Почти серьезная статистика: анализируем программу psk

За все в этой жизни приходится платить, в том числе и за качественный контент. Для Голоса этот вопрос особенно актуален, поэтому одна из популярнейших тем на площадке - создание программ поддержки талантливых авторов. За недолгое время существования Голоса их было создано бесчетное количество, но среди самых популярных и результативных можно выделить программу psk. Заручившись поддержкой кита @val, автор программы @eee сумел создать инструмент, позволяющий обеспечивать талантливым авторам серьезные по местным меркам выплаты и привлекать внимание к их творчеству

Однако, несмотря на популярность программы, ее результаты до сих пор по большей части неизвестны широкой публике их-за полного отсутствия статистических обзоров на эту тему (за исключением одного поста от @veritas) . Чтобы исправить эту ситуацию, я решил собрать статистику программы, и с ее помощью ответить на несколько вопросов:

  • насколько часто посты с тегом psk получают поддержку от @golosmedia?
  • кто из пользователей чаще всего получал поддержку?
  • есть ли взаимосвязь между популярностью автора на Голосе и вероятностью попасть в программу psk?

Материалы и методы

1. Для проведения статистического анализа я собрал список авторов, попавших в программу поддержки, после чего собрал о каждом информацию, позволяющую судить об их популярности на Голосе.

2. Критерии отбора: согласно методике исследования пост попадал в выборку при соблюдении двух условий: один из тегов поста = psk, за пост проголосовали аккаунты @val и @econmag

3. Из выборки были исключены авторы, написавшие меньше 10 постов с тегом psk, так как настолько маленькое число не позволяет делать достоверные статистические выводы

4. В качестве источника данных была выбрана база данных GolosSQL от @arcange

5. Для каждого автора, посты которых попали под описанные выше критерии, была собрана следущая информация:

  • репутация
  • количество подписчиков
  • количество репостов
  • средняя выплата за пост (в расчет брались все посты авторов, а не только с тегом psk)
  • число постов с тегом psk
  • число постов, попавших в программу поддержки
  • соотношение между общим числом psk-постов и числом поддержаных (коофициент эффективности), подсчитаное следующим образом: поддержаные/все посты

С данными в сыром виде можно ознакомиться по ссылке

6. Над каждым показателем был произведен статистический анализ: 

  • были высчитаны квартили, минимальное и максимальное значение, среднее и медиана
  • при помощи коофициента Пирсона была подсчитана корреляция между коофициентом эффективности и количеством репостов, подписчиков, средними выплатами

Результаты

Основные показатели

Для начала предлагаю посмотреть на основные показатели программы. 

Всего под критерии отбора попали 103 автора

Самое большое число постов с тегом psk написал пользователь @varja - 118. При этом в программу поддержки попали всего 13 его постов, и коофициент эффективности пользователя составляет 0.11. 

Минимальное число поддержаных постов - 1, таких пользователей оказалось 22 штуки, рекордсмен среди них моммо с 55 постами и коофициентом 0.01

Максимальное число поддержаных постов - 50 у пользователя @lex. Ему же принадлежит рекорд по средней выплате за пост: 637, а также по эффективности: 0.57. Таким образом, его можно считать самым результативным пользователем psk

Если говорить более обще, эффективность пользователей оказалась довольно невысокой

На графике видно, что у большинства пользователей поддержку получило меньше 10 постов. Если же говорить о коофициенте эфеективности, то он распределен примерно схожим образом:

Также интересно посмотреть на третьи квартили основных показателей (третий квартиль - это число, меньше которого 75% выбранных значений). Согласно им, большая часть пользователей написала меньше 36 постов в psk. Из всех psk-постов убольшинства поддержали  от 1 до 8. Средняя выплата у большинства авторов варьировалась от 10 до 169 золотых. Также стоит отметить, что репутация большинства авторов была не больше 67

Корреляция между популярностью авторов и эффективностью в psk

Один из главных вопросов, встающих про раздаче наград на Голосе - справедливо ли они распределены между популярными авторами и новичками. Чтобы узнать, нет ли в psk перекоса в сторону "старичков", я решил проверить, существует ли корреляция между показателями, отражающими популярность автора и его коофициентом эффективности

Необходимо сразу отметить, что распределение исходных данных не соответветствует нормальному, что могло сказаться на точности анализа

Результаты анализа оказались следующими:

Как видим, наблюдается достаточно слабая связь между популярностью автора и вероятностью попасть в psk. На эффективность авторов практически не влияет количество репостов и подписчиков. Более сильная взаимосвязь наблюдается между средней выплатой и эффективностью, а также между репутацией и эффективностью, но она также слишком мала, чтобы делать однозначные выводы

Соотношение между коофициентом эффективности и основными показателями, отражающими популярность пользователей

Выводы

Какие выводы можно сделать на основе полученной информации? 

Во-первых, из всех постов, публикуемых авторами под тегом psk, поддержку получает лишь малое число. Это может быть связано с тремя факторами: 1)программа является очень популярной, и под этим тегом публикуется очень много постов, 2) число постов, заслуживающих поддержку, до сих пор невелико, 3) возможности программы довольно скромны (всего 40 апвоутов в день, из которых часть уходит на другие проекты @eee)

Во-вторых, несмотря на низкое соотношение между общим числом psk постов и числом поддержаных, можно выделить несколько лидеров с высоким коофициентом эффективности. К таким пользователям, кроме отмеченного выше @lex относятся @med (коофициент 0.56, 36 постов, 20 поддержано), @vood.one коофициент 0.56, 15 постов, 8 поддержано), @artemmaka (коофициент 0.5, 20 постов, 10 поддержано)

В третьих, не наблюдается очевидной взаимосвязи между популярностью автора и его вероятностью попасть в программу. Минимально значимая корреляция наблюдается лишь между эффективностью и репутацией + средними выплатами

Однако, так как корреляция ничего не говорит о причинно-следственных связях, отсутствие подобной взаимосвязи может говорить и о том, что программа psk слабо помогает авторам продвигаться на Голосе, поэтому у авторов с большим числом поддержаных постов не наблюдается большего числа подписчиков или репостов. Однако, чтобы ответить на этот вопрос, нужно провести гораздо более серьезный анализ данных

В качестве итога могут сказать, что полученные числа выглядят довольно оптимистично. Несмотря на сравнительно скромные возможности (всего один кит в распоряжении), @eee удалось привлечь большой интерес к своей программе, а также сделать ее демократичной - в ней не отдается предпочтения продвинутым пользователям, и при наличие таланта и определенной степени упорства, авторы могут расчитывать на поддержку 

pskстатистиканиндзя-аналитикаголосжизнь
25%
2
108
26.821 GOLOS
0
В избранное
ninjas
На Golos с 2017 M05
108
0

Зарегистрируйтесь, чтобы проголосовать за пост или написать комментарий

Авторы получают вознаграждение, когда пользователи голосуют за их посты. Голосующие читатели также получают вознаграждение за свои голоса.

Зарегистрироваться
Комментарии (12)
Сортировать по:
Сначала старые