Пять примеров статистически идеального мошенничества
Как известно, Иммануил Кант утверждал, что ложь паразитирует на истине. Но паразиты должны себя ограничивать: убийство носителя это эволюционный тупик, поэтому живучий паразит должен сдерживаться и не разрастаться до своего максимума.
Ложь точно так же часто балансирует между «недостаточным» и «излишним». Мошенничество и подлог ограничиваются, но и голая правда никому не нужна.
Вот пять примеров мошенничества не слишком крупного и не слишком мелкого, а идеального масштаба.
Подделки сумок и костей святых
Святые реликвии были одним из важнейших товаров в Средневековой Европе — в основном, части тел святых и мучеников, но были и предметы, относящиеся к Иисусу или апостолам, например, фрагменты Животворящего Креста, риза Богородицы и даже одна из пеленок младенца Иисуса (ее и сейчас в особых случаях выставляют в немецком городе Ахене). Огромная сеть торговцев и воров работала на нужды соборов, церквей и частных коллекционеров, а некоторые историки полагают, что борьба за контроль над торговлей реликвиями была основной целью Крестовых походов. Рынок реликвий процветал, несмотря на тот очевидный факт, что многие товары были подделкой — это подтверждают цифры. В какой-то момент в двадцати одной церкви утверждали, что у них хранится священный препуций, а количество гвоздей с Животворящего Креста, увиденных Марком Твеном во время поездок по Европе, достигло в общей сложности «45 килограмм».
Торговля реликвиями в чем-то схожа с нынешней торговлей предметами роскоши. Ими стремятся обладать из-за связанных с ними ассоциаций и происхождения, хотя физически они могут не отличаться от более дешевых подделок. И этот рынок также процветает, несмотря на внушительное количество мошенников. Потому ли это, что отсутствие подделок — не самый выгодный вариант даже с точки зрения официальных изготовителей?
Наличие контрафактной продукции позволяет обществам, где лишь немногие могут позволить себе покупку подлинников, сохранять связь с желанными брендами, вещами, которые они, возможно, смогут купить в будущем.
Аналитик потребительских тенденций Яна Ятури выражает это так: «Многие элитные бренды рассматривают подделки как форму вирусного маркетинга».
Более увлекательная теория, выдвинутая в виде детализированной модели экономистом Яо Цзэнь-Тэ, показывает, что «эффект Веблена» — склонность потребителей выше оценивать товар с более высокой стоимостью — позволяет изготовителям подлинников получать выгоду из режима контроля, достаточно строгого, чтобы затраты мошенников были высокими, но не настолько строгого, чтобы полностью их исключить. Благодаря наличию подделок растет готовность разборчивых покупателей — на профессиональном жаргоне их называют «снобы» — платить больше за определенно «подлинные» предметы роскоши.
Исследования мнений потребителей подтвердили, что из-за существования реплик растет цена, которую люди считают адекватной цене на оригинальные изделия. К примеру, в одном из исследований участникам показали сумку Louis Vuitton и сказали, что существует много ее подделок (группа «часто подделываемые»), либо мало (группа «редко подделываемые»). Обе группы оценили стоимость оригинальной сумки и ее реплики; у группы «часто подделываемых» разница в стоимости подлинника и подделки была более чем в два раза больше, чем у группы «редко подделываемых».
Если торговля реликвиями производилась по такому же принципу, мы можем предположить, что иногда в соответствующих органах могли намеренно пропустить поддельный свиток-другой. Как бы то ни было, наказание было суровей: если сейчас органы контроля в назидательных целях иногда сжигают фальшивые изделия, то средневековых фальсификаторов могли сжигать вместе с товаром.
Лига плюща
Существует группа элитных университетов, дипломы которых считаются огромным толчком для последующей жизни и карьеры выпускника. Но есть некоторые расхождения между этим документом и подразумеваемым под ним потенциалом, что неизбежно открывает дорогу мошенникам: взять хотя бы огромный интернет-рынок сочинений для студентов или арест подростков с Лонг-Айленда, проходивших вступительные экзамены в колледж (SAT и ACT) под именами сверстников, у которых было больше денег и меньше мозгов. Мотивация тут простая — ни покупатели, ни продавцы не несут личной ответственности за надежность системы.
Но представьте себя вице-президентом комиссии по приему абитуриентов и финансированию в элитном университете из Лиги плюща. Вы преданы университету, но при этом весьма циничны. Дети богачей и потенциальных вкладчиков, часть которых — сами выпускники, выстраиваются в очередь, умоляя о зачислении. Вы можете заполнить ими свой класс и обеспечить огромный приток денег учреждению. Есть неопровержимые доказательства того, что успех выпускников элитных университетов в основном определяется процессом отбора — выпускники Лиги плюща успешны, потому что они из тех, кого принимают в Лигу. В этом случае ценой за зачисление на первый курс недалеких отпрысков богачей станет то, что их будут считать такими же гениальными, как и их сокурсников. (Что, возможно, усиливается пользой многих лет, проведенных за косячком с будущими лидерами страны в сфере бизнеса и технологий).
Это очень ценно, это щедрый вклад, ведь в гнезде первокурсников Лиги плюща вылупился первый богатенький кукушонок. Каждый новый привилегированный студент преуменьшает значение всей этой аферы, поскольку он понижает общий интеллектуальный уровень группы, на члена которой он намерен походить. Люди привыкают спрашивать «ты из этих выпускников Лиги?» В какой-то момент важность репутации (с точки зрения вас как вице-президента комиссии) перевешивает возможный доход. Может, приемная комиссия кое-где проводила тайный экономический анализ для выявления необходимого количества таких студентов, хотя можно надеяться, что менее корыстные — или, как минимум, ориентированные на будущее — размышления перевесили этот циничный расчет.
Продемонстрируем, как это могло бы работать. Пусть S — это средняя зарплата выпускников других университетов, не уступающих выпускникам из университетов Лиги Плюща, а S1 — это средняя зарплата обладателей диплома Лиги Плюща. Мы можем предположить, что если среднестатистический подросток проскользнет в университет Лиги, он или она могут получить прибавку к заработку — бонус SI-S. Если долю «притворщиков» обозначить за p, то предполагаемая разница в качестве уменьшится, поэтому бонус станет равняться (1-p)a×(SI-S), где a — это параметр (из той серии, которую можно увидеть в любой реальной статистической модели), количественно выражающий степень признания того, что «притворщики» могут затесаться в ряды выпускников из Лиги Плюща, отчего начинаются сомнения в качестве образования остальных выпускников. Чем больше параметр a, тем сильнее каждый «притворщик» раскрывает всех остальных, и тем меньший кредит доверия остается у университета. Если a > 1, это значит, что с ростом числа «притворщиков» ослабление качества первокурсников становится все сложнее игнорировать, чего мы и ожидаем.
Итоговая прибавка — за которую эти, в остальном среднестатистические, студенты будут готовы платить — будет рассчитываться как Np(1-p)a×(SI-S), где N — это количество студентов одного года. Прибавка максимальна, когда p=1/(1+a). Возьмем. например, Гарвард (случайно выбранный реальный университет), где около 1/8 учащихся — дети выпускников Гарварда, которых принимают в пять раз чаще, чем кого-либо из других абитуриентов.3 Если их число будет составлять половину «притворщиков», мы можем считать p=0,25, или около 400 студентов в год, таким образом, параметр a будет примерно равен 4. Помноженный на Гарвардский бонус (SI-S) — который оценивается в районе $13 тыс в год, — это становится ощутимым поводом для благодарности своей alma mater.
Бабочки и бактерии
В 1861 году, почти через два года после публикации великого трактата Ч. Дарвина, натуралист и исследователь Генри Уолтер Бейтс представил перед лондонским Линнеевским обществом впечатляющий доклад. Он разобрался в проблеме, которую наблюдал в течение 11 лет, изучая насекомых в амазонских джунглях. Его попытки классифицировать бабочек по рисунку на крыльях рушились из-за существования отдельных особей, на первый взгляд неотличимых от одних видов, но которые при более детальном рассмотрении оказывались разновидностями совершенно других. Он обнаружил, что более многочисленные виды обладали защитными химическими свойствами, благодаря которым были несъедобны для основных своих врагов. Окраска редких видов оказалась мимикрией, защищающей от хищников, научившихся ассоциировать определенный окрас крыльев с невкусной пищей или последующей болезнью.
И Бейтс, и Дарвин признали это как раз тем примером, которого недоставало дарвиновской теории эволюции: очевидно, что птицы выбирали съедобные виды, тем самым постепенно искореняя особей, не похожих на представителей несъедобных видов. Выжившие особи передавали свой защитный окрас потомкам, часть которых еще больше напоминала непригодные к пище виды. В 20 веке проводились количественные исследования «бейтсовской мимикрии», начатые великим статистиком и биологом-эволюционистом Р. Э. Фишером. Он рассматривал ее как парадигму отбора, зависящего от плотности популяции — эволюцию характеристик, степень приспосабливаемости которых варьировалась в зависимости от их распространенности в популяции. В конце концов, утверждал ученый, чем чаще происходит мимикрия, тем больше шансов, что хищники поймут, что бабочки с данным характерным окрасом не такие уж и невкусные. Мимикрия среди представителей популяции ограничена, что в основном зависит от того, насколько ядовит их образец, и того, насколько птицы готовы рискнуть.
Похожая динамика (но в куда меньшем масштабе) наблюдается при борьбе иммунной системы человека с микробами. Этот процесс известен как молекулярная мимикрия. Во многих вирусах были обнаружены белки, похожие на белки человека настолько, что это позволяет им обмануть иммунную систему, которая принимает их за человеческие, не представляющие угрозы клетки; некоторые подражают особым белкам, подавляющим иммунитет. Учитывая, что белки, мимикрирующие структуру человеческих, явно пригодились бы любому амбициозному паразиту, почему их нет у каждого из них? Один из первых исследователей молекулярной мимикрии в 1960-х Реймонд Дамадьян предположил, что паразиты с человеческими белками, как бабочки, притворяющиеся ядовитыми сородичами, рискуют тем, что иммунная система может понять, что выглядящие человеческими клетки на самом деле — вкусные паразиты. Это приводит к аутоимунным заболеваниям, калечащим или убивающим человека и, соответственно, ограничивающим возможное развитие паразита. Заражение патогенами с молекулярной мимикрией считается важным механизмом, провоцирующим аутоиммунную реакцию.
Неудобные вопросы
Роберту Макнамара, министру обороны США времен войны во Вьетнаме, приписывают следующий совет тем, у кого берут интервью: «Никогда не отвечайте на вопрос, который вам задали. Отвечайте на вопрос, который вам хотелось бы услышать». Интервьюеры не возражают против таких уловок, потому что это, похоже, является лучшим способом выудить хоть что-то полезное из уклончивых людей. Оказывается,этот принцип может пригодиться даже для получения нужного ответа на прямой вопрос. Когда речь идет о личных делах и возможном неудобстве, лучше всего добиться правды можно, дав интервьюируемому солгать в ответе на альтернативный вопрос.
Стремление уклониться от ответа — основная проблема социальных опросов. Если вы спросите: «Изменяли ли вы когда-нибудь супругу(-е)?», внушительная часть тех, кто ответил бы положительно, устыдившись, скажут «нет», вне зависимости от искренности вашего обещания сохранить анонимность. Полвека назад экономист Стэнли Уорнер предложил простое решение: дайте человеку наполовину синюю, наполовину зеленую вертушку. Пусть он тайно прокрутит вертушку и ответит на вопрос «Изменяли ли вы когда-нибудь своему супругу(-е)?», если выпадет зеленый, и на вопрос «Вы никогда не изменяли своему супругу(-е)?», если выпадет синий.
Отталкиваясь от того, что люди в основном склонны говорить правду, такой вариант действий спасает их от неловкости положительного ответа: никто никоим образом не может узнать, на какой из вопросов был дан ответ. Тем не менее, исследователи все равно могут подсчитать общее количество людей, признавшихся в измене: если за группу ответивших «да» взять Q, а зеленую часть площади вертушки обозначить P, то, обратившись к алгебре, мы выявим, что доля людей, сознавшихся в измене, составит (Q+P-1)/(2P-1). (Этот параметр может оказаться отрицательным, что будет не очень удобно, но в среднем верно).
Тогда встает вопрос о том, какая часть площади вертушки должна быть зеленой. Доля ответов 2(1-P) фактически пропадает, поэтому с приближением показателя P к ½, уменьшается точность подсчетов, или же вам придется опросить больше людей. Но с приближением P к единице все большему количеству респондентов кажется, что их напрямую спрашивают об измене, и все больше становится их желание солгать. Точка компромисса располагается примерно посередине и зависит от точного количества опрашиваемых и степени необходимой им анонимности.
Конфиденциальность и ложная информация
Ложные прямые вопросы — это, конечно, хорошо, но они не покрывают всех проблем приватности в современных социальных исследованиях с большими объемами данных, не говоря уже о терабайтах личной информации, ежедневно накапливаемой правительством и частными компаниями. Исследователям необходим способ гарантировать сохранение приватности субъектов при обмене информацией.
Для решения данной проблемы были разработаны сложные схемы создания версий масштабных баз данных, в которых все детали ложны, но многие общие характеристики верны, включая и непродуманные создателями синтетических данных. «Ложность» сведений в таких искусственных базах данных определяется свойством дифференциальной приватности, согласно которому не существует такого вопроса, который можно задать по всей базе, где отсутствуют ваши данные, и получить ответ отличный от того, который получили бы со сведениями о вас.
Разумеется, для сохранения приватности лучше всего подходят полностью фиктивные базы данных. Концепт дифференциальной приватности заключается в определении степени приближенности искусственной базы данных, выявленной из сведений деликатного характера — и тем не менее содержащей необходимую общую информацию — к идеальной приватности, которую можно получить при полностью фиктивных данных.
Один из принятых методов создания искусственной базы данных, впервые предложенный Дональдом Рубином в 1993 году, называется многообразное введение синтетических микроданных. Мы начинаем с ситуации, когда у нас есть группа людей, которые могут быть отобраны — например, из переписи жилищных единиц — и при этом часть их данных находится в открытом доступе (например, адрес). Изучается небольшая выборка этих людей, и мы узнаем определенную личную информацию (как возраст, пол, уровень дохода, состояние здоровья).
Мы хотим предоставить исследователям возможность запрашивать данные, учитывая разницу между открытой и личной информацией, не раскрывая при этом последнюю. Статистические органы могут «вводить» — по сути, угадывать в соответствии со статистической моделью, основанной на реальных значениях — значения, связанные с личными данными всех не вошедших в выборку людей. Затем эти личные параметры отбрасываются, и создаются многочисленные новые образцы путем случайного отбора из введенных данных. Эти образцы публикуют. Из таких синтетических образцов исследователи могут извлечь множество выводов и получить по сути такие же результаты, какие они получили бы из оригинальных данных.