Бывший аналитик Google определяет уровень безработицы по порнозапросам
Американскому Бюро трудовой статистики требуются три недели, чтобы собрать и представить публике официальную информацию о безработице. Бывший аналитик Google Сет Стивенс-Давидовитц открыл гораздо более быстрый способ посчитать безработных, опираясь на поисковые запросы, связанные с порно.
Как сообщает Business Insider, Стивенс-Давидовитц в своей новой книге описывает этот способ как пример постоянного изменения самого понятия данных. Началось всё с системы, которая использовала поисковые запросы, связанные с гриппом, для определения текущих темпов заболеваемости – причём задолго до того, как Центры по контролю и профилактике болезней опубликуют официальные данные.
В дальнейшем похожая система стала использоваться для составления общей картины национальной экономики. К тому времени инженеры Google уже создали сервис Correlate, сопоставляющий набору данных коррелирующие с ним поисковые запросы, и Стивенс-Давидовитц решил использовать его для предсказания уровня безработицы. Аналитик ввёл в систему данные о безработице в США с 2004 по 2011 годы, и система выдала ближайший поисковой запрос – «Slutload» (это порносайт).
На первый взгляд, такой результат может показаться странным, но сам Стивенс-Давидовитц видит разгадку в том, что у безработных много свободного времени; многие из них сидят дома в одиночестве и скучают.
Можно сделать и более общий вывод: традиционные способы сбора данных могут быть не самыми эффективными или точными – хотя бы потому, что люди не всегда честны при участии в опросах.