Наталья Соколова, Brand Analytics: Иностранные системы не справляются с анализом российских соцмедиа
Системы анализа социальных медиа давно стали трендом на Западе. Теперь они набирают популярность и в России. О том, почему иностранные решения не подходят нашей действительности, как и зачем обрабатывать десятки миллионов постов в день, в интервью CNews рассказала Наталья Соколова, CEO компании Brand Analytics.
«Попытки использовать в России зарубежные решения никогда не были успешными»
CNews: Наталья, расскажите, как в целом выглядит российский рынок систем мониторинга и анализа социальных медиа? Насколько велико наше отставание от лучших образцов?
Наталья Соколова: Если в США в настоящий момент девять из десяти компаний в обязательном порядке используют ту или иную систему анализа социальных медиа, то в России мы только в начале пути. Мы еще формируем рынок и спрос, и видим в этом свою миссию.
Тысячи компаний, использующих сейчас аналитику соцмедиа в России и странах СНГ, в ближайшие годы превратятся в миллионы клиентов. Мы наблюдаем бурный рост, как это уже случилось на западных и азиатских рынках.
CNews: Какие основные системы представлены на рынке и чего ждут от подобных решений заказчики?
Наталья Соколова: Если говорить про российский рынок, то сейчас это «Медиалогия», «Крибрум», YouScan (украинская система), IQ Buzz и Brand Analytics, являющийся, согласно рейтингу Adindex 2018, лидером среди систем мониторинга и анализа социальных медиа.
Если говорить об ожиданиях клиентов, то на рынке уже сформирован спрос на мониторинг для выявления репутационных угроз и для клиентской поддержки пользователей в социальных медиа. Это действительно важные для бизнеса задачи, однако потенциал аналитики соцмедиа много больше. Наша задача — его реализовать. Дать маркетологам инсайты о клиентах, продуктах и трендах потребления, PR-специалистам – инструменты нового медиапланирования и современные KPI, кадровикам — возможность мониторинга HR-бренда в режиме реального времени, службам эксплуатации — выявление сбоев в системах по сообщениям пользователей, безопасникам — долгожданный контроль утечек в соцсети и так далее. Для топов же — это инструмент стратегического маркетинга и развития бизнеса, показывающий, как завтра стать лидером.
CNews: Существует немало западного ПО – насколько российские варианты конкурентоспособны?
Наталья Соколова: На самом деле, западного ПО (вернее, облачных систем) не так уж и много. А лидеров — буквально единицы. Это американская Sprinklr, немецкая TalkWalker, английская BrandWatch, французская Linkfluence. Создать подобную систему — дело непростое и трудноповторимое. Это сплав самых передовых технологий обработки естественного языка с применением машинного обучения и элементов ИИ, а также дорогостоящей платформы сбора данных в режиме реального времени со всех типов соцмедийных площадок.
Аналитическая система Brand Analytics — более чем конкурентный продукт. Именно поэтому нашими клиентами являются, в том числе, все ведущие мировые исследовательские компании: Kantar TNS, Ipsos, GFK и Nielsen. Более того, Ipsos, недавно купивший одну из систем анализа соцмедиа (Synthesio), все равно продлевает контракт с нами.
Имея собственные разработки в области высокоскоростной компьютерной лингвистики, мы не уступаем западным системам в автоматической аналитике, а по части полноты и качества анализируемых данных — превосходим их. Чтобы завоевать и сохранить лидерство по сбору данных в России, мы действуем сразу в нескольких направлениях. Одно из ключевых — работа с площадками. Так, например, у нас с ВКонтакте подписан коммерческий договор на получение полного потока публичных данных этой соцсети.
В России и СНГ западным системам трудно обеспечить не только сбор данных, но и лингвистическую обработку русского и других языков. Поэтому неоднократные попытки использовать зарубежные решения в России никогда не приводили к хорошим результатам.
Рынок систем мониторинга соцмедиа делится по языкам, а не по странам. И это работает в обе стороны — для Brand Analytics весьма затратно выходить на другие языковые рынки.
«Анализ соцмедиа помогает реально улучшать продукт»
CNews: Какой функциональностью должны обладать подобные решения? Какие департаменты предприятий в них наиболее заинтересованы и почему?
Наталья Соколова: С аналитикой соцмедиа сложилась уникальная ситуация — она позволяет компаниям решать широчайший круг задач. Как правило, сотрудничество Brand Analytics с компанией начинается с PR-департамента клиента. Пиарщикам, в первую очередь, необходимо выявлять репутационные риски и купировать репутационные кризисы, которые все чаще возникают и развиваются в сверхпроводящей среде соцмедиа. Они оказывают серьезное влияние на бренд компании и лояльность пользователей.
Но пиарщики не только защищаются, они хотят быть эффективными и хотят выполнять свои KPI. А KPI пиарщика — это не число публикаций в СМИ, как раньше, а сам факт того, «зашел» ли ваш контент в соцсети, получил ли он высокую цитируемость и соответствующий аудиторный охват.
Поэтому сегодня мы наблюдаем переход на совершенно новые принципы медиапланирования. С помощью анализа соцмедиа легко увидеть площадки, необходимые для продвижения и коммуникации с той или иной группой ЦА. Нетрудно узнать их интересы и запустить релевантную рекламную кампанию или предложить релевантный контент.
CNews: Но одними только пиарщиками дело не ограничивается?
Наталья Соколова: Верно. Вслед за ними из компании к нам приходит служба клиентской поддержки или контакт-центр. Стоящая перед ними задача понятна: необходимо адаптировать бизнес-процессы и инструменты отработки обращений клиентов к соцмедийным каналам, где более 80% таких обращений пользователи оставляют за пределами собственных страниц и групп брендов.
Первыми такие задачи начали решать банки, телеком-операторы и страховщики, а сейчас практически все розничные бренды озабочены поддержанием лояльности пользователей в соцмедийном канале.
Однако самое интересное начинается тогда, когда вслед за пиарщиками и клиентской поддержкой к нам приходит маркетинг. Далеко не все маркетологи — и это реальная проблема — знакомы с возможностями аналитики соцмедиа. И сотрудничество с ними набирает ход не сразу, зато имеет долгую перспективу и стратегическое значение для компании.
Надо следить за потребительским трендами, чтобы завтра не подарить своих клиентов новому Тинькову? Да, такая задача актуальна для любого банка и она имеет решение. Это называется Trendwatching («выявление трендов»).
Углубиться в интересы и привычки того или иного сегмента аудитории, чтобы понять как продвигать для него ваш продукт и улучшить его в дальнейшем? Не проблема. Для этого в рамках современных U&A-исследований (Usage and Attitude — «потребительские привычки и предпочтения») уже используются данные соцмедиа. Как воспринимается новый продукт, что ждет от вас клиент завтра — теперь на эти вопросы можно и нужно искать ответы в аналитике соцмедиа.
Проанализировать удовлетворенность клиентов и интерпретировать колебания привычных для бизнеса показателей NPS (Net Promoter Score – «индекс потребительской лояльности») и CSI (Customer Satisfaction Index – «индекс удовлетворенности потребителя»)? Да, теперь бизнес получил такую возможность — понимать, почему клиент вас рекомендует или не рекомендует в каждый момент времени.
Такое ключевое исследование для бренда как трекинг «здоровья» бренда BHT (Brand Health Tracking), анализирующий влияние на бренд всех его активностей, теперь проводится обязательно с включением аналитики соцмедиа, которая призвана интерпретировать динамику показателей и атрибутов бренда. По-прежнему ли вас воспринимают как надежную и инновационную компанию. А если нет, то почему и как это исправить?
CNews: Получается, что анализ соцмедиа открывает маркетологам очень много новых возможностей.
Наталья Соколова: Возможностей и правда очень много. Самое главное в том, что аналитика соцмедиа помогает маркетологам улучшить продукт, найти свою аудиторию, сделать релевантную рекламу и разместить ее там, где она сработает. И, конечно, помогает увидеть «завтрашний день», выявляя зарождающие и уже сформировавшиеся тренды потребления.
Маркетинг — это очень важно, но это еще не вся компания. Сейчас рынок вновь борется за кадры и управление HR-брендом становится одной из первостепенных задач компании. Мы помогаем и тут. Автоматический анализ восприятия HR-бренда как кандидатами, так и собственными сотрудниками помогает сделать предложение работодателя более конкурентным и снизить не только кадровую текучку, но и соответствующие финансовые потери.
Эксплуатация? Вы не поверите, но и службы эксплуатации нуждаются в аналитике в режиме реального времени. Зачастую географически распределенный розничный бизнес именно от нас может узнать о сбоях или поломках в своих системах, так как на страже работоспособности стоит многомиллионная аудитория пользователей соцмедиа и сигнализирует в случае необходимости.
CNews: А безопасники?
Наталья Соколова: Технологии поиска по тексту на картинках в сообщениях соцмедиа позволяют обнаружить скрины конфиденциальных документов или экраны внутренних информационных систем, вбросы и так далее.
В итоге, начиная свой путь с PR-департамента, система аналитиза соцмедиа в течение года-двух «проникает» в контакт-центр, отделы маркетинговых исследований и продвижения, в стратегический маркетинг, в HR-департамент и к бизнес-аналитикам, строящим модели, к безопасникам и эксплуатационщикам и, конечно, к топ-менеджменту. Почти такой путь мы прошли, например, вместе со Сбербанком, в котором уже более двухсот сотрудников различных подразделений используют в своей работе Brand Analytics.
CNews: Назовите основные бизнес-преимущества, которые дают эти решения?
Наталья Соколова: Сегодня бизнес все больше и больше опирается на клиентский опыт, крупные компании даже специально создают профильные центры. И тут у аналитики соцмедиа серьезных конкурентов просто нет.
Как мы уже обсудили, использование системы анализа соцмедиа критично и для операционных, и для стратегических задач. Аналитика соцмедиа быстрее, точнее, дешевле и обладает прогностическим потенциалом.
Популярный нынче анализ больших структурированнных данных, как правило, касается обработки именно внутренней информации. Это такие сведения, как данные о продажах или о проходимости точек продаж, данные биллинга или данные о поведении пользователей интернет-магазина.
Анализ таких данных позволяет оптимизировать бизнес, повысить доходы и сократить расходы на проценты. А аналитика соцмедиа способна на большее, она смотрит не назад, а помогает быть конкурентным и востребованным завтра.
«Видео в соцсети может быть угрозой, а может содержать важные инсайты»
CNews: Возвращаясь к теме безопасности: компания Brand Analytics недавно представила поиск по тексту на картинках в соцмедиа и по расшифровкам видео. Расскажите, что в этом особенного? Чем новые возможности отличаются от других подобных предложений?
Наталья Соколова: Смотрите, на настоящий момент все системы мониторинга и анализа соцмедиа на российском рынке анализируют только текст сообщений пользователей. Исключение — предложение YouScan по мониторингу логотипов брендов и решение Angry по мониторингу упоминаний в геоточках. Геоточки в Brand Analytics есть давно, а кейсы с дорогостоящим мониторингом логотипов не слишком убедительны. Разве что для оценки эффективности спортивного спонсорства.
Мы же поставили задачу предоставить всем клиентам возможность текстового анализа не только сообщений и комментариев, но и чекинов, картинок, видео и сториз. То есть максимально полного набора типов данных в соцмедиа.
Почему это так важно? Потому, что текст на картинках может оказаться рекламой или мемом. А может оказаться вбросом или фотографией конфиденциальных документов. Подобная скрытая от глаз бренда информация может быть крайне чувствительной. Ежедневно в русскоязычных соцмедиа публикуется 25 млн картинок, каждая третья из которых содержит текст. Это огромный пласт информации, которую нельзя оставлять без внимания, желательно автоматического.
Видео влиятельного блогера также может содержать угрозу репутации или дискредитировать ваш продукт в рамках, например, сравнительного теста. А может быть, наоборот, источником инсайта для вашего позиционирования, как это часто бывает на практике. Ежедневно в русскоязычных соцмедиа публикуется более 2 млн постов с видеоконтентом и этот тренд только усиливается — видео и публикуют больше, и смотрят чаще. Не анализировать текст в видео — непозволительная роскошь.
Кстати, большинство телеканалов сейчас выкладывает свои новости на YouTube с автоматической расшифровкой. А это значит, что попутно мы предоставили нашим клиентам возможность мониторинга телеэфира.
CNews: Как это реализовано технологически?
Наталья Соколова: Классическая задача распознавания текста на изображениях решена давно, однако реализовать подобное решение в режиме реального времени для многомиллионного потока данных соцмедиа — задача совершенно иного уровня.
Изображений в соцсетях не просто много - их очень много. Для распознавания на них текста все картинки необходимо скачать на свои серверы. Это огромная нагрузка и на канал связи, и на серверные мощности. Поэтому наша главная технологическая задача состояла в оптимизации обработки фотографий на всех этапах для снижения вычислительной нагрузки, реализации высокоскоростной обработки и решения главной задачи — аналитики текстов в публикуемых картинках на полном потоке соцмедиа в режиме реального времени.
Первый этап оптимизации — фильтрация. Необходимо исключить из последующей обработки все ненужное, чтобы не нагружать систему попусту. За счет анализа метаинформации и текстов сообщений, без скачивания изображений, мы фильтруем поток картинок от ботов и спама.
Для дальнейшего анализа изображения придется скачивать, что требует не только сверхширокой полосы пропускания, но и работы хранилища данных на запись-чтение потока файлов в высокоскоростном режиме. Даже для высоконагруженных серверов баз данных требования по нагрузке ниже.
Скачали, что дальше? Надо быстро находить «похожие» изображения. Это позволит в дальнейшем распознавать текст только на одной из похожих картинок вместо того, что распознавать его на каждой из них.
В этой задаче много нюансов и, несмотря на доступность различных реализаций хешей для изображений, позволяющих их сравнивать, нам пришлось разработать свой подход к хешированию. Существующие решения могли обеспечить либо качество, либо скорость. Нам же удалось «усидеть на двух стульях».
Дальше нужно ответить на вопрос: а есть ли на картинке вообще текст? И тут нам пришлось создать и обучить собственную нейронную сеть, так как существующие нас снова не устроили из-за своих скоростных параметров. Для обучения нейронной сети нам пришлось собрать корпус из нескольких сотен тысяч изображений с текстом и без него для разных языков.
Для самого процесса распознавания текста оптимальным решением оказалась доработка рекуррентной сети, построенной на LSTM-архитектуре, что мы и сделали.
После всех оптимизаций решение по распознаванию текста на картинках в потоке соцмедиа оказалось реализуемой задачей с разумной «компьютерной себестоимостью», сравнимой по необходимым ресурсам с обеспечением высокой доступности одной из наших внутренних баз данных.
«Раньше рынку была непонятна ценность подобных сервисов»
CNews: Расскажите о том, как создавался этот продукт. Это полностью самописная история или в основе лежат какие-то программные решения?
Наталья Соколова: Brand Analytics — полностью российский продукт, созданный в стенах компании и использующий только программное обеспечение с открытым кодом. Система Brand Analytics включена в реестр российского ПО.
В свое время первоначальный интерес рынка к системам мониторинга упоминаний в соцмедиа не перерос во что-то большее. Рынку была непонятна ценность подобных сервисов, которая не распространялась дальше ответов на найденные жалобы пользователей. Нужна была новая идея, которая бы дала толчок развитию индустрии.
Такая идея была сформулирована при создании Brand Analytics. Аналитическая система создавалась в качестве инструмента, который бы позволял учитывать все публично высказанные мнения, анализировать их в режиме реального времени и выдавать рекомендации бизнесу и государству по широчайшему кругу вопросов, основываясь на быстрой обратной связи от пользователей социальных медиа.
Амбициозная задача потребовала совершенно новых технологических подходов. Во-первых, чтобы система «знала ответы на все вопросы», надо было уйти от «запросного» мониторинга по отдельным ключевым словам для клиентов. Для этого пришлось построить платформу сбора данных, агрегирующую в режиме реального времени полный поток сообщений русскоязычных социальных медиа, включающий не только соцсети, но и другие соцмедийные площадки. Это видеохостинги, форумы, отзовики, блог-платформы, UGC-ресурсы, комментарии в СМИ и так далее. В итоге такая платформа, наполняющая озеро данных, была построена. К середине 2019 года архив соцмедиа-данных в системе превысил 100 млрд единиц контента. Ежедневно добавляется 60-80 млн новых сообщений.
Во-вторых, для того, чтобы в режиме реального времени анализировать мнения в озере данных, извлекать смыслы и формировать рекомендации, необходимо было создать новые лингвистические алгоритмы, позволяющие обрабатывать «неграмотный» разговорный язык соцмедиа на огромных скоростях — до нескольких тысяч единиц контента в секунду. В результате высокоскоростная лингвистика для потоковой обработки неструктурированных данных на лету была разработана в собственной лингвистической лаборатории Brand Analytics.
В частности, был создан целый набор лингвистических модулей, ориентированных на неграмотный язык соцмедиа: модуль определения объектной и безобъектной тональности, модуль выявления именованных сущностей и трендов, модуль выявления разной степени агрессии и тому подобные. Кроме того, появился набор автоматических классификаторов, выявляющих сарафанное радио, контент розыгрышей, информацию о ДТП, о благотворительности, поисковый спам.
Имея «на руках» озеро данных и высокоскоростные алгоритмы обработки естественного языка, в 2012 году Brand Analytics разработал и вывел на рынок одноименную аналитическую систему, предоставившую возможность любому пользователю в считанные минуты начать работать с аналитикой соцмедиа. Быстро, просто и удобно, несмотря на скрывающиеся за этой простотой сложнейшие технологические решения.
В 2017 году по итогам конкурса, организованного аналитическим центром при Правительстве РФ, система Brand Analytics была признана лучшим информационно-аналитическим решением для обработки неструктурированных данных.
В 2019 году Brand Analytics стала лучшей среди систем мониторинга и анализа соцмедиа по результатам исследования рынка технологий обработки естественного языка в России и мире, опубликованного во втором выпуске альманаха «Искусственный интеллект». Система BrandAnalytics вошла сразу в несколько рейтингов аналитического отчета о состоянии этого рынка, заняв 2 место среди компаний в области sentiment-анализа и 5 место среди разработчиков технологий поиска и извлечения информации из текста.
CNews: Как происходит внедрение программы?
Наталья Соколова: Brand Analytics — это SaaS-решение, начать использовать которое можно буквально в течение нескольких минут. Наши консультанты помогают с первоначальной настройкой системы и персонально сопровождают клиента в первый месяц работы, бережно передавая его службе клиентской поддержки.
Мало того, мы бесплатно обучаем наших клиентов и в онлайне, и в офлайне, а также предоставляем возможность сертификации. Сконцентрировать свое внимание клиенту нужно на основной настройке в системе – на описании объекта мониторинга на языке поисковых запросов. Все остальные операции не представляют какой-либо сложности. Времена, когда решения внедрялись в компаниях месяцами, прошли. Сейчас всем нужен быстрый результат, и мы его даем.
CNews: Нужна ли (и возможна ли) дополнительная интеграция с другими элементами инфраструктуры?
Наталья Соколова: Это очень важный вопрос. Мы верим в это направление и уже реализовали несколько интеграционных решений. В первую очередь, мы интегрировались с мессенджером Telegram, в который отправляем персональные оповещения о важных для бренда или персоны событиях в инфополе. Интегрировались с наиболее распространенными хелпдесками и CRM, а также предоставили промышленное API крупным клиентам, строящим свои корпоративные решения, например, ситуационным центрам. В ближайшее время мы расширим список интеграционных направлений и отдельно расскажем об этом.
CNews: Существуют ли планы экспансии этого решения на западные рынки?
Наталья Соколова: Сейчас Brand Analytics оптимизирован для работы с русским, украинским, казахским, белорусским, молдавским и армянским языками. Являясь прибыльной компанией, мы растем быстрее формирующегося рынка, вкладывая в развитие собственные средства. Наш ближайший приоритет – страны СНГ и государства, в которых высок уровень проникновения русского языка.
Технологически мы готовы конкурировать и на американском рынке, и на европейском, и на рынке Юго-Восточной Азии. Но для этого требуются серьезные дополнительные инвестиции в «железо», так как создание озер данных потоков соцмедиа — это реально огромные объемы данных.
Наша стратегия — быть независимым зеркалом мнений пользователей. Формат частной компании наиболее точно соответствует этой задаче, и инвестиционные предложения для географического скачка мы рассматриваем в рамках этой стратегии.