Уважаемые пользователи Голос!
Сайт доступен в режиме «чтение» до сентября 2020 года. Операции с токенами Golos, Cyber можно проводить, используя альтернативные клиенты или через эксплорер Cyberway. Подробности здесь: https://golos.io/@goloscore/operacii-s-tokenami-golos-cyber-1594822432061
С уважением, команда “Голос”
GOLOS
RU
EN
UA
itsynergis
6 лет назад

Определяем ботов в Facebook ::  методология, инструменты, выводы

animals-1846546_1280.jpg

Synergis против зла


Кому надо сразу практики - http://itsynergis.ru/assets/docs/fb_bots.pdf


Начнём с категорий :: наш стажёр на должность аналитика Евгений предложил следующее определение бота: "фальшивый аккаунт, создающий видимость сетевой деятельности, созданный с целью: распространения рекламы, автоматического управления страницей (публикации, комментарии, ответы), накрутки количества пользователей при продвижении страниц, создания новостного «шума», прочих действий вирусного характера", - если не придраться, то вполне.

Также он предложил следующие типы ботов:

  1. Собственно спам-боты (определение см. выше);
  2. Аккаунты магазинов и прочие "продающие страницы";
  3. Неиспользуемые аккаунты.

Далее Евгений акцентировался на том, как выявить бота (критерии):

  1. Время создания профиля;
  2. Фото (подробней - ниже);
  3. Корреляции личных данных;
  4. Друзья;
  5. Публикации на странице;
  6. Отзывы и лайки;
  7. Группы и подписки.

Боты по фото

  1. Характерными чертами ботов являются изображения разных людей на новых/старых фото профиля, фото известных людей, «красивых» девушек или юношей, фото с логотипами или изображениями без людей и т.п.
    2.2 Если видим несколько фото одного человека в разное время с разными людьми в разных местах, с огромной долей вероятности - это реальный человек.
    2.3 Даты публикации фотографий (опубликованные подряд фотографии не относящиеся к одному событию).

Профайл

  1. Указание нескольких мест работы, учёбы коррелирующих между собой данных - даёт 100% реальный аккаунт.
  2. Ссылки на акк. других соц. сетей и прочие ресурсы - дополнительный критерий.
  3. Отсутствие данных, противоречивые или несовпадающие данные, например: дата начала работы 2012 год – комментарии под записью 2-х дневной давности.
    • Критерий-цитаа: "если это индианка, пишет только на ассамийском языке о нелегкой жизни своих братьев в бедной деревне. Ну или не индианка, смысл понятен".
  4. Несоответствие профайла и фото.

Оценка подписчиков

  1. Оценивается количество, динамика добавления: если в друзья добавляют пачками по несколько десятков или за две недели с регистрации акк. количество друзей превышает сотню.
  2. Место проживания друзей (из того же города). Большое количество друзей, при пустом профиле с непонятной фотографией при отсутствии публикаций характерно для ботов.

Публикации

  1. Оценивается наличие/отсутствие публикаций, даты публикаций, их количество и динамика во времени (10 публикаций в течение суток, потом перерыв на месяц-два).
  2. Перепосты чужих новостей или личные заметки/фотографии.

Комментирование

  1. Комментарии под публикациями, оценивается также количество друзей и отсутствие комментариев, перепосты.
  2. Ответы на комментарии от владельца страницы, диалоги в комментариях с участием владельца (зачастую в профилях ботов, в комментариях под публикациями только гости).
  3. *Критерий уже не от Евгения - если подписчиков масса, а каков - один-два (или в другом соотношении).

Участие в группах

  1. Подписки на страницы всех подряд с количеством участников более 1 тыс. чел.
  2. Подписки на фейк-аккаунты (по фото) либо отсутствие каких-либо подписок вообще.

Прим. с учетом универсальных критериев 2, 3 и 4 первым фильтром для дальнейшего анализа профиля стало наличие у профиля личной информации (о месте работы или учебы) на странице общего списка друзей.


Анализ страницы fb.com/menaskop

Снимок экрана 2018-05-24 в 15.41.10.png

Тоже аналитика по странице, но уже от другого кандидата в аналитики - Эдуарда:

Снимок экрана 2018-05-24 в 16.54.04.png

Он сформулировал следующий подход:

Универсальные параметры - это:

  1. Аватар: отсутствие, равно как любое другое изображение, кроме личного фото, а также постановочное фото, фото откровенного характера, эротика и т.п. - сразу наталкивает на мысль о фейке
  2. Фон - его отсутствие, наличие рекламы, текста, эротики, хайпа и т.п. вещей есть признаки фэйка
    Пол : по статистике большинство ботов с "женским лицом", особенно, если в предыд. пунктах есть откровенные или постановочные (сделанные профессионально) фото
  3. Никнейм: боты часто используют либо нелепые сочетания имени и фамилии, либо вовсе бессодержательные прозвища
  4. Сведения о себе: у ботов отсутствуют, либо минимальны, либо не проходят проверку на уникальность
  5. Срок регистрации: обычно боты имеют срок в несколько месяцев

Теперь о индивидуальных критериях:

"Остальные параметры, которые я использовал в своей таблице, я бы отнес к индивидуальным критериям, именно поэтому я включил в таблицу свой аккаунт, поясню почему: я не могу назвать себя экстравертом, неохотно делюсь личной информацией, с друзьями предпочитаю общаться в реале, либо по телефону, фотками делюсь в месседжере, надолго забрасывал аккаунт, - и таких людей немало, - это накладывает отпечаток на пофиль (кол-во личных фото, постов и репостов). В таких случаях необходимо смотреть на такие критерии, как уникальность личных данных (проверить яндексом и гуглом), их корреляцию друг с другом: язык человека и его друзей (редко кто говорит на китайском,суоми и хинди одновременно), их географию, где учился-работал-проживает человек, какой контент присутствует в личных фото, есть ли разношерстность лайков и тематик, котрыми интересуется владелец аккаунта, - у ботов часто среди указанных параметров нелепица.

Характер личных постов, репостов, личные фото, наличие рекламы и большого кол-ва друзей, я бы отнес к индивидуальным критериям, - в моём примере аккаунт я решил реанимировать, когда заинтересовался криптой, мне попался курс по баунти компаниям, и хотя я сам еще до сих пор не учавствовал в баунти, но стал на всякий случай прокачивать акк-ты в ФБ и Твиттер, участие же в баунти отложил, т.к. хочу изучить анализ проектов, чтобы не стать участником рекламы скамов. Поэтому при неоднозначности индивид. критериев, если они прошли проверку корреляцией друг с другом, нужно смотреть на цели, которые преследует владелец аккаунта, - если это реклама, продажи и спам, то соответственный вывод - ак-т сделан в рачестве рекламного, а управлять им может либо реальный человек, либо скрипт, это не суть важно.

Таким образом, универсальные критерии помогают сделать экспресс-анализ с минимумом затраченного времени, что называется, на лету, если по универсальным критериям фрэнд-проверку прошел, то смотрим на индивидуальные китерии, которые могут быть неоднозначны, хотя неоднозначность и есть один из важных признаков живого человека".


Примеры для разбора

  1. https://www.facebook.com/esther.daniella.900
  2. https://www.facebook.com/rally8888
  3. https://www.facebook.com/aleks.remezov.50
  4. ваш...

Полезные ссылки

  1. Пост по теме от Евгения Роменко
  2. Простейший сбособ фильтрации
  3. Решение от Ивана Тихонова
  4. Отличный анализ от ещё одного кандидата в аналитики (Юлии) - http://itsynergis.ru/assets/docs/fb_bots.pdf

Первые итоги

  1. Чего-то толкового из инструментов по определению ботов - не нашёл
  2. Критерии - описанные не плохи, но явно заслуживают проработки
  3. Какие ваши предложения в этом направлении?

До!


P.S. Благодарности: Эдуарду, Евгению, Юлии, Наталье за помощь :: пока опубликовал не все наработки. Будет, как и всегда у нас), вторая часть - минимум :: дальше зависит от активности сообщества

147
0.655 GOLOS
На Golos с December 2016
Комментарии (1)
Сортировать по:
Сначала старые