Любимцы Голоса: обзор статистики популярных тегов за прошлую неделю
С появлением интернета перед людьми встала неожиданная проблема в виде огромного количества информации, в которой необходимо ориентироваться и уметь находить необходимое. Одно из самых простых решений этой проблемы - категоризация контента при помощи тегов. Несмотря на простоту, этот механизм оказался эффективным, и сегодня теги в том или ином виде присутствуют в любой соцсети, в том числе, и на Голосе
Однако, у местной системы тегов есть несколько особенностей. Во-первых, количество тегов под постом ограничено пятью. Во-вторых, у некоторых пользователей очень быстро образуется причинно-следственная связь между высокими выплатами и используемыми тегами, и поэтому нередко содержание постов мало связано с тегами. Кроме того, вполне вероятно, что подобная практика может приводить к аггрегации пользователей вокруг нескольких наиболее популярных категорий. Еще одна особенность состоит в том, что правила платформы предполагают, что пользователи могут ставить флаги за неправильную категоризацию контента, поэтому некоторые авторы начинают оберегать придуманные ими теги
Разобраться с этими особенностями и составить общее представление о системе категоризации контента на Голосе вам поможет мой сегодняшний пост, посвященный обзору статистики самых популярных тегов за предыдущую неделю
Материалы и методы
Для получения списка самых популярных тегов был сделан запрос к API Голоса с помощью функции getTrendingCategories
. Итоговая выборка составила 14 постов, из нее были исключены несколько тегов, таких как lesnik-случайнаявст и u403..., попавшие в список из-за технических недоработок Голоса. После этого для каждого тега из базы данных GolosSQL была собрана информация о постах, опубликованных с этими тегами в промежуток с 25 сентября по 1 октября включительно. Сразу отмечу, что часть постов из итоговой выборки могли повторно появляться в результатах для нескольких тегов. Таким образом, были собраны следующие показатели: число постов, которые опубликованы с каждым тегом, а также суммы апвоутов за посты (чтобы получить этот показатель я считал число записей в поле active_votes
), выплат (использовался показатель total_payout_value
, включающий авторские и кураторские выплаты) и комментариев (их число можно получить с помощью поля children
). Наконец, для каждого тега был составлен список тегов, которые чаще всего с ним использовались
Результаты
Количество постов
Первым оцениваемым показателям стало количество постов, опубликованных с тегом в обозначенный промежуток
Рис 1. Основные показатели по 14 популярным тегам
Как видно из Рис 1., первое место занимает тег жизнь. С ним за неделю было опубликовано более 2 тысяч постов. Также популярными оказались теги голос - его использовали больше полутора тысяч раз, и фотография, использованный 1418 раз. Остальные теги использовались меньше 1 тысячи раз
Сумма выплат
Если суммировать выплаты за неделю, то ситуация будет следующая. Лидиром по этому показателю стал тег голос, собравший почти 142 тысячи золотых. За ним следует vox-populi, набрав 107 тысяч. На третьем месте расположился жизнь - посты с этим тегом собрали 98 с половиной тысяч золотых
Еще один тег, следующий за тройкой лидеров psk - собрал 70 тысяч. После него начинается резкий спад выплат, и оставшиеся теги собрали меньше 50 тысяч
Количество апвоутов
По количеству апвоутов первые два места занимают теги жизнь и голос, а вот дальше ситуация начинает отличаться от топа выплат. Например, vox-populi, взявший серебро в прошлой номинации, по количеству апвоутов заниает лишь пятое место. Сразу за ним идет psk (4 место по выплатам). И наоборот, фотография, занявшая лишь 6 место по сумме выплат, по числу апвоутов занимает 3 место, а конкурс, занявший 9 место по выплатам, перемещается на 7 место
Количество комментариев
Наконец, по количеству комментариев лидирует тег жизнь, собравший почти 14 тысяч комментариев. Следующие два места на пьедестале занимают голос (13 с половиной тысяч комментариев) и мысли (7 с половиной тысяч комментариев). За ними идут фотография и конкурс (7169 и 5554 комментариев соответсвенно)
Каждый из оставшихся тегов собрал за неделю меньше 5 тысяч комментариев
Топ выплат по тегу голос
Как мы увидели, самая большая сумма выплат была у тега голос. Поэтому было бы интересно посмотреть на список постов, попавших в топ-10 выплат по этому тегу:
Первый пост, собравший больше 4 с половиной тысяч золотых принадлежит перу @ivelon и сообщает о действительно эпохальном событии - запуске системы платежей с использованием Голосов
Следующие два поста касаются Программы поддержки уникального контента от @sept. Первый собрал 4483 золотых, второй - 3870
За ними идут 3 поста от @vik про скрипт для мгновенной регистрации на Голосе и других технических аспектах Голоса
После этого идет пост @arcange о делегатах, которых он перестал поддерживать, пост @yudina-cat с рассуждениями о конструктивной критике, пост @ontofractal о программе апвоут 50-50, и промо-ролик для сообщества @vp-handmade от @vp-golos-tv
Если же посмотреть на топ-посты тега жизнь, то среди них 4 тоже посвящены Голосу. В их числе 2 промо-ролика от @vp-golos-tv, отчет ПАУКа и празднование двух месяцев на Голосе пользователя @catyk
Из 6 оставшихся 1 рассказывает про экстремальную кругосветку @ieshua, 2 принадлежат пользователю @konstantin и повествуют о современных технологиях, еще два - рассуждения @yudina-cat о критике и @carpe-diem о троечниках и отличниках, а также пост @smotritelmayaka про псевдонимы Вольтера
Какие теги чаще всего используются вместе с топовыми?
Как я уже упоминал, теги - это довольно эффективное средство категоризации контента. Поэтому, чтобы составить представление о тематической направленности топ-тегов, было бы полезно посмотреть, какие теги используются вместе с ними
В случае с тегом жизнь картина получилась следующей. Чаще всего с ним использовались теги мысли, голос и фотография. Кроме того, "жизненные" посты часто ассоциировались с программой пск, творчеством и путешествиями. Интересная находка - наличие тега апвот50-50
Для конкурса самыми часто используемыми тегами стали супер-популярные теги жизнь и голос. Помимо них, конкурсы часто были связаны с творчеством, фото, путешествиями и детьми. О последнем говорят два тега - дети и калякарисовака
У psk в число часто используемых помимо всего прочего попали тематические теги, например, история и психология, а также vox-populi. Последнее может говорить о том, что авторы сообществ нередко намереваются получить дополнительную прибыль от программы поддержки
Выводы
Какие выводы можно сделать из этой информации? Во-первых, заметно, что значительное число постов сконцентрировано в нескольких топовых тегах. Что интересно, немалое число постов с этими тегами посвящено внутренней кухне Голоса
Во-вторых, заметно, что зачастую разные показатели популярности постов (объем выплат, количество апвоутов и комментариев) не совпадают друг с другом. Одни теги получают много голосов, но мало выплат, другие - наоборот. Это может говорить о том, что вкусы китов и основной массы голосующих в ряде случаев расходятся
Наконец, интересно, что посты, использующие один из топ-тегов,в качестве остальных 4 тегов чаще используют другие топ-теги, а не тематические. Из-за этого рамки использования того или иного тега размываются и задача категоризации контента осложняется
На этом я заканчиваю свой обзор. В следующей части мы продолжим собирать статистику по тегам и посмотрим, какие пользователи чаще всего используют тот или иной тег