Определяем ботов в Facebook :: методология, инструменты, выводы
Synergis против зла
Кому надо сразу практики - http://itsynergis.ru/assets/docs/fb_bots.pdf
Начнём с категорий :: наш стажёр на должность аналитика Евгений предложил следующее определение бота: "фальшивый аккаунт, создающий видимость сетевой деятельности, созданный с целью: распространения рекламы, автоматического управления страницей (публикации, комментарии, ответы), накрутки количества пользователей при продвижении страниц, создания новостного «шума», прочих действий вирусного характера", - если не придраться, то вполне.
Также он предложил следующие типы ботов:
- Собственно спам-боты (определение см. выше);
- Аккаунты магазинов и прочие "продающие страницы";
- Неиспользуемые аккаунты.
Далее Евгений акцентировался на том, как выявить бота (критерии):
- Время создания профиля;
- Фото (подробней - ниже);
- Корреляции личных данных;
- Друзья;
- Публикации на странице;
- Отзывы и лайки;
- Группы и подписки.
Боты по фото
- Характерными чертами ботов являются изображения разных людей на новых/старых фото профиля, фото известных людей, «красивых» девушек или юношей, фото с логотипами или изображениями без людей и т.п.
2.2 Если видим несколько фото одного человека в разное время с разными людьми в разных местах, с огромной долей вероятности - это реальный человек.
2.3 Даты публикации фотографий (опубликованные подряд фотографии не относящиеся к одному событию).
Профайл
- Указание нескольких мест работы, учёбы коррелирующих между собой данных - даёт 100% реальный аккаунт.
- Ссылки на акк. других соц. сетей и прочие ресурсы - дополнительный критерий.
- Отсутствие данных, противоречивые или несовпадающие данные, например: дата начала работы 2012 год – комментарии под записью 2-х дневной давности.
- Критерий-цитаа: "если это индианка, пишет только на ассамийском языке о нелегкой жизни своих братьев в бедной деревне. Ну или не индианка, смысл понятен".
- Несоответствие профайла и фото.
Оценка подписчиков
- Оценивается количество, динамика добавления: если в друзья добавляют пачками по несколько десятков или за две недели с регистрации акк. количество друзей превышает сотню.
- Место проживания друзей (из того же города). Большое количество друзей, при пустом профиле с непонятной фотографией при отсутствии публикаций характерно для ботов.
Публикации
- Оценивается наличие/отсутствие публикаций, даты публикаций, их количество и динамика во времени (10 публикаций в течение суток, потом перерыв на месяц-два).
- Перепосты чужих новостей или личные заметки/фотографии.
Комментирование
- Комментарии под публикациями, оценивается также количество друзей и отсутствие комментариев, перепосты.
- Ответы на комментарии от владельца страницы, диалоги в комментариях с участием владельца (зачастую в профилях ботов, в комментариях под публикациями только гости).
- *Критерий уже не от Евгения - если подписчиков масса, а каков - один-два (или в другом соотношении).
Участие в группах
- Подписки на страницы всех подряд с количеством участников более 1 тыс. чел.
- Подписки на фейк-аккаунты (по фото) либо отсутствие каких-либо подписок вообще.
Прим. с учетом универсальных критериев 2, 3 и 4 первым фильтром для дальнейшего анализа профиля стало наличие у профиля личной информации (о месте работы или учебы) на странице общего списка друзей.
Анализ страницы fb.com/menaskop
Тоже аналитика по странице, но уже от другого кандидата в аналитики - Эдуарда:
Он сформулировал следующий подход:
Универсальные параметры - это:
- Аватар: отсутствие, равно как любое другое изображение, кроме личного фото, а также постановочное фото, фото откровенного характера, эротика и т.п. - сразу наталкивает на мысль о фейке
- Фон - его отсутствие, наличие рекламы, текста, эротики, хайпа и т.п. вещей есть признаки фэйка
Пол : по статистике большинство ботов с "женским лицом", особенно, если в предыд. пунктах есть откровенные или постановочные (сделанные профессионально) фото - Никнейм: боты часто используют либо нелепые сочетания имени и фамилии, либо вовсе бессодержательные прозвища
- Сведения о себе: у ботов отсутствуют, либо минимальны, либо не проходят проверку на уникальность
- Срок регистрации: обычно боты имеют срок в несколько месяцев
Теперь о индивидуальных критериях:
"Остальные параметры, которые я использовал в своей таблице, я бы отнес к индивидуальным критериям, именно поэтому я включил в таблицу свой аккаунт, поясню почему: я не могу назвать себя экстравертом, неохотно делюсь личной информацией, с друзьями предпочитаю общаться в реале, либо по телефону, фотками делюсь в месседжере, надолго забрасывал аккаунт, - и таких людей немало, - это накладывает отпечаток на пофиль (кол-во личных фото, постов и репостов). В таких случаях необходимо смотреть на такие критерии, как уникальность личных данных (проверить яндексом и гуглом), их корреляцию друг с другом: язык человека и его друзей (редко кто говорит на китайском,суоми и хинди одновременно), их географию, где учился-работал-проживает человек, какой контент присутствует в личных фото, есть ли разношерстность лайков и тематик, котрыми интересуется владелец аккаунта, - у ботов часто среди указанных параметров нелепица.
Характер личных постов, репостов, личные фото, наличие рекламы и большого кол-ва друзей, я бы отнес к индивидуальным критериям, - в моём примере аккаунт я решил реанимировать, когда заинтересовался криптой, мне попался курс по баунти компаниям, и хотя я сам еще до сих пор не учавствовал в баунти, но стал на всякий случай прокачивать акк-ты в ФБ и Твиттер, участие же в баунти отложил, т.к. хочу изучить анализ проектов, чтобы не стать участником рекламы скамов. Поэтому при неоднозначности индивид. критериев, если они прошли проверку корреляцией друг с другом, нужно смотреть на цели, которые преследует владелец аккаунта, - если это реклама, продажи и спам, то соответственный вывод - ак-т сделан в рачестве рекламного, а управлять им может либо реальный человек, либо скрипт, это не суть важно.
Таким образом, универсальные критерии помогают сделать экспресс-анализ с минимумом затраченного времени, что называется, на лету, если по универсальным критериям фрэнд-проверку прошел, то смотрим на индивидуальные китерии, которые могут быть неоднозначны, хотя неоднозначность и есть один из важных признаков живого человека".
Примеры для разбора
- https://www.facebook.com/esther.daniella.900
- https://www.facebook.com/rally8888
- https://www.facebook.com/aleks.remezov.50
- ваш...
Полезные ссылки
- Пост по теме от Евгения Роменко
- Простейший сбособ фильтрации
- Решение от Ивана Тихонова
- Отличный анализ от ещё одного кандидата в аналитики (Юлии) - http://itsynergis.ru/assets/docs/fb_bots.pdf
Первые итоги
- Чего-то толкового из инструментов по определению ботов - не нашёл
- Критерии - описанные не плохи, но явно заслуживают проработки
- Какие ваши предложения в этом направлении?
До!
P.S. Благодарности: Эдуарду, Евгению, Юлии, Наталье за помощь :: пока опубликовал не все наработки. Будет, как и всегда у нас), вторая часть - минимум :: дальше зависит от активности сообщества