Как я искал NSFW картинки на Голосе

в прошлом году
52 в nsfw

Если кто не знал, NSFW -- аббревиатура от английского "Not Safe For Work". Используется для обозначения контента, не подходящего для просмотра на рабочем месте. Т.е. контент (картинки, видео, тексты и т.д.), просмотр которого неприемлем в присутствии вашего начальника и/или коллег.
Так же, пару раз слышал вариант расшифровки "Not Safe For Wife", хотя, казалось бы, чего она там такого не видела :)

Обожаю свою работу!

0.05.jpg

В перерывах между инфраструктурными и devops задачами несколько дней инвестировал в исследование возможности использования сверточных нейронных сетей для просмотра порнухи классификации изображений, заливаемых пользователями на Голос.

С помощью нейросетки, обученной на распознавание картинок для взрослых можно сделать на Голосе множество полезных фич: например, автоматически ставить тег NSFW там, где он необходим и где его забыл поставить автор. Или ещё как-то улучшить жизнь человечества...

В любом случае, заниматься порно-картинками гораздо интереснее, чем серверами с linux-ом, и я с радостью взялся за работу :)

Итак, имеем нейросеть на основе Caffe (deep learning фреймворк от Berkley AI Research), тренированную на огромных объемах размеченных изображений, как NSFW, так и обычных SFW ("suitable/safe for work"). Не буду грузить вас скучными техническими подробностями реализации, перейдём сразу к экспериментальной части.

Правда находит NSFW-картинки?

Самый первый вопрос, возникающий у любого экспериментатора -- где деньги, Зин? а покажи-ка нам, любезная нейросеточка, что ты умеешь? Правда можешь хорошо определять NSFW-картинки?

С бескрайних просторов нашего любимого интернета я скачал архив из пятисот NSFW-фоток разного уровня бесстыдства (привет, Роскомнадзор!). Естественно, не удовольствия ради, а работы для! :) И скормил этот архив нашей нейросети. Результаты получились вот такие:

nsfw.png

Поясню. Каждый крестик на графике -- это одно изображение. Каждому изображению после анализа присваивается оценка от 0 до 1. Это вероятность того, что на изображении присутствует что-то пикантное:

  • Оценка от 0 до 0.2: картинка, по мнению нейросетки, является вполне пристойной
  • Оценка от 0.2 до 0.8: картинка явно с "клубничкой", разной степени откровенности
  • Оценка от 0.8 до 1: картинка совершенно точно ПРЯМ ОГОНЬ! :)

Поэтому, увидев распределение вероятностей, я уже было обрадовался -- мол, классно, работает! Всё отлично определяет! Но тут в голову пришла идея внимательно рассмотреть эти пол-тыщи картинок провести эксперимент номер два.

А как на реальных данных?

А натравлю-ка я эту нейросеть на реальные картинки с Голоса. Взял, точно так же, пол-тыщи реальных картинок, залитых реальными пользователями на блокчейн. Результаты получились вот такие:

golos.png

Вроде бы, тоже отличный результат, всё гуд. Большинство картинок уложились в оценку от 0 до 0.2. Но тут любопытство взяло верх :) А давайте посмотрим, что там за картинки получили оценку выше 0.2? Что там за "клубничка" такая у нас на Голосе?

Что возбуждает нашу нейросеть?

Итак, что же возбуждает нашу нейросеть? Я вытащил из сета все картинки с высокими оценками:

hot NSFW images

И вот что обнаружилось:
КЛИКАБЕЛЬНО ДЛЯ ПРОСМОТРА В БОЛЬШЕМ РАЗМЕРЕ

  1. График с двумя выпуклыми пересекающимися кривыми напомнил нейросетке о чём-то пикантном (0.20)
  2. Спящий котик был оценен в 0.28
  3. Эротичное тесто в крепких мужских объятьях пекаря получило оценку 0.36
  4. Фракталы на зелёном фоне возбудили нашу нейросеть сильнее, чем накачанный мужик в белых трусах (0.59 против 0.52)
  5. И мужик в трусах и фракталы проиграли картинке с фразой "Когда у твоего мужа есть биткоины" (0.62)
  6. Обручальные кольца -- это вообще без пяти секунд порно (0.76)
  7. Выпуклости персиков и их косточка были оценены аж в 0.33 и 0.35
  8. При этом, валяющаяся на берегу практически без одежды дама с не менее аппетитными формами была оценена всего в 0.05. Ничего не поделаешь, персики для нашей нейросети более сексуальны :)
  9. И дама и персики вчистую проиграли спящему над клавиатурой очкарику (0.48)
  10. Ну и моё самое любимое, набросок выкройки какой-то игрушки нейросеть посчитала вообще жестким порно и оценила аж в 0.87:

0.87.jpg

Дедушка Фрейд точно был бы рад.

Выводы

Даже страшно представить, что и в каких количествах повидала наша нейросеть в процессе своего обучения и работы, раз её теперь даже такие, казалось бы, обыденные картинки будоражат. Поставлю-ка я ей в целях психологической разгрузки архивчик с фотками котят и миленьких щеночков -- пусть немного расслабится, заслужила. А то ей уже по ночам одни "персики" да "фракталы" снятся, а может и что похуже (выкройка, омг!)

Теперь вот и не знаю, можно ли ей доверить принятие хоть сколько-то серьёзных решений на Голосе. Как вы считаете? :)

Авторы получают вознаграждение, когда пользователи голосуют за их посты.
Голосующие читатели также получают вознаграждение за свой голос.
Порядок сортировки:  Популярное

Да, прикольно!))


Теперь вот и не знаю, можно ли ей доверить принятие хоть сколько-то серьёзных решений на Голосе.

Как-то даже и не знаю. Сомневаюсь, что можно.)))) Вообще, думаю, над сетью надо ещё поработать. Может внести спектр цветов человеческой кожи. И тот-же спектр, но уже в ЧБ. Точнее это уже будет спектр тонов. Но и выкройка может тогда снова подойти. Сложно!)))

73
  ·  в прошлом году

нейросети пора выдавать молоко за вредность...

·
52
  ·  в прошлом году

ага, и путёвку в санаторий :)

Круто!!! Помогите ей развидеть это, загрузите ей котиков что ли.

Интересный экспериментик. А ещё что-нибудь скармливали сеткам? Было бы интересно почитать.

Смотрю на выкройку и так, и эдак, и в принципе, понимаю нейросеть. Это похоже на товары из секс-шопа, вот. (заранее извиняюсь, если я кого-то смутила, и да, я хожу в секс-шоп)

·

Могли бы и не писать, что Вы ходите в такие места, ведь для того, что бы знать как выглядят оттуда товары, не обязательно туда ходить. ))) Я, вот, например, никогда там не был.))

·
·

@rikimaru в какие-такие? В свободном обществе живем.

·
·
·

Вы хотите, что бы я об этом прямо написал что ли?))) Конечно в свободном. Они не запрещены. Просто я знаю и без посещения как от туда товары выглядят. ))

69
  ·  в прошлом году

@muhazokotuha Поздравляю! Вы добились некоторого прогресса на Голосе и были награждены следующими новыми бейджами:

Награда за количество полученных голосов

Вы можете нажать на любой бейдж, чтобы увидеть свою страницу на Доске Почета.
Чтобы увидеть больше информации о Доске Почета, нажмите здесь

Если вы больше не хотите получать уведомления, ответьте на этот комментарий словом стоп

Голосуя за это уведомление, вы помогаете всем пользователям Голоса. Узнайте, как здесь.

61
  ·  в прошлом году

Бедняга, пересмотрела...

Это прекрасно. Теперь ей можно доверить выбирать качественный, серьезный контент. 。゚(TヮT)゚。

72
  ·  в прошлом году

Ваш пост поддержали следующие Инвесторы Сообщества "Добрый кит":
knopki, spinner, chiliec, kavalsky, olga-olga, semasping, newodin, vika-teplo, borisss, vadimph, myhardmoney, olgaborisova, wedge, vsebudethorosho, izbushka
Поэтому я тоже проголосовал за него!
Узнать подробности о сообществе можно тут:
Разрешите представиться - Кит Добрый
Правила
Инструкция по внесению Инвестиционного взноса
Вы тоже можете стать Инвестором и поддержать проект!!!


Если Вы хотите отказаться от поддержки Доброго Кита, то ответьте на этот комментарий командой "!нехочу"
69
  ·  в прошлом году

@muhazokotuha Поздравляю! Вы добились некоторого прогресса на Голосе и были награждены следующими новыми бейджами:

Вы получили свою первую выплату
Награда за общую выплату получил

Вы можете нажать на любой бейдж, чтобы увидеть свою страницу на Доске Почета.
Чтобы увидеть больше информации о Доске Почета, нажмите здесь

Если вы больше не хотите получать уведомления, ответьте на этот комментарий словом стоп

Голосуя за это уведомление, вы помогаете всем пользователям Голоса. Узнайте, как здесь.

@muhazokotuha, Поздравляю!
Ваш пост был упомянут в моем хит-параде в следующих категориях:

  • Голосов - 10 позицию - 56 Голосов
  • Выплаты - 4 позицию - 34,7040 GBG

что там с хф?)