News & Updates

Новое в YouScan: определение спама и фильтр по языку

presentation

Андрей Радич

Андрей Радич

Head of Product

27 октября 2016 года

Вам знакома проблема очистки потока от нерелевантных упоминаний? Тогда вам наверняка придутся по душе новые возможности YouScan. Мы стремимся сократить количество ручной работы и помочь вам сконцентрироваться на главном — анализе значимых отзывов о вашем бренде.

Автоматическое определение спам-сообщений

Для каждого, кто уже имел опыт обработки упоминаний из социальных медиа, не будет новостью, что среди них попадается немало сообщений от спам-ботов.

О том, кто и зачем их создает мы уже когда-то писали. Для мониторинга в подавляющем большинстве случаев они не представляют никакого интереса. И для получения объективной аналитики, построенной на мнениях людей, такие упоминания приходится удалять, что занимает достаточно много времени.

Чтобы облегчить эту задачу, и вы могли больше внимания уделять работе именно с релевантными упоминаниями, в YouScan внедрен алгоритм автоматического определения спам-ботов, упоминания от них будут собираться в отдельную папку “Спам”.

spam-folder

YouScan уже умеет определять спам в социальных сетях Вконтакте и Twitter. Для этого специальный алгоритм учитывает множество факторов: содержание текста, атрибуты автора, количество и качество подписчиков, частоту постов, количество “лайков” и другие параметры. Пока что еще не всех ботов удается распознать, но по мере обучения алгоритма, все меньше и меньше подобных спам-сообщений вы будете находить в своих темах.
Если же какое-то упоминание, которое попало в спам, все же представляет для вас интерес, вы можете вернуть его в тему, воспользовавшись кнопкой “Восстановить из спама”.

Ограничение сбора по языку упоминания

Еще один тип нерелевантных упоминаний доставляет немало хлопот, если название вашего бренда пишется латиницей. В этом случае в мониторинг иногда могли попадать упоминания на испанском, немецком, и прочих языках. Для международных брендов количество упоминаний такого рода могло быть достаточно большим.

Теперь для таких случаев можно настроить ограничение по языку.

languages

Если опция “Собирать упоминания только на следующих языках” выключена, то в тему будут попадать упоминания на всех языках, включая и те, которые не присутствуют в списке (немецкий, испанский и т.д.); если включена — только на выбранных в списке языках.

Для всех новых тем, которые вы создаёте, фильтрация уже будет включена по умолчанию, и в них будут попадать только сообщения на русском, украинском, казахском, белорусском и английском языках.

Для всех тем, которые были созданы ранее, фильтрация по языкам выключена.Вы можете поменять эту настройку в любой момент для любой темы. С момента включения фильтрации по языкам в теме она будет применяться ко всем новым упоминаниям, ранее найденные упоминания в теме останутся без изменений.

Но что происходит, если сообщение написано с ошибками, на смеси разных языков? В таких случаях не всегда язык можно определить со 100% вероятностью. Поэтому для того, чтобы при включении фильтрации по языкам не “отсеялись” релевантные для вас упоминания, мы ввели простое правило: при определении языка для такого рода “смешанных” упоминаний приоритет отдается русскому языку, если в сообщении есть кириллица, и английскому, если ее нет. Так, если текст, например, состоит только из хештегов латиницей и одного русского слова, он будет считаться русским, и вы это упоминание не пропустите.

Если вы уже пользуетесь YouScan, попробуйте эти новые возможности сегодня, и конечно же, задавайте свои вопросы нашей службе поддержки прямо в чате внутри системы.

А если вы еще не мониторите социальные медиа — попробуйте YouScan прямо сейчас!

Приятного и легкого мониторинга вам, ну и конечно, только позитивных упоминаний 🙂

Подпишитесь на наш Блог