Авторский стиль глазами робота..

Тут в своей публикации @feevatali подняла вопрос о ценности процентных показателей «уникальности текста».

Тема для меня нервная, хотя и не критичная для жизнедеятельности.

Я впервые столкнулась с требованием «уникальности» около трех лет назад, когда стала участвовать в онлайн кулинарных конкурсах, и сразу была ошарашена тем, что под этим подразумевается вовсе не оригинальность рецепта как такового, а набор слов и их порядок в тексте.

То есть берем готовое чужое, переписываем своими словами, и оп! уникальный рецепт готов победить!.
Обидно. До сих пор не могу смириться.
А еще, поигравшись с программами проверки на уникальность, я обнаружила такие показатели как «вода» и «заспамленность».
Заспамленность это, фактически, количество в тексте слов из числа наиболее часто встречающихся. И это плохой показатель. Но о чем можно рассказать, какую мысль донести и до кого, если говорить только редко употребляющимися словами.
«Вода» вообще задела за живое. По сути, это как раз то, что и определяет авторский стиль, помогает передаче эмоционального фона, сродни роли мимики и жестов в беседе. Убираем воду, получаем сухарь, и какому читающему захочется его грызть без особой нужды?
Конечно, авторский стиль может быть таким, что у нормальных людей волосы дыбом вставать будут, но какая программа это сможет определить? Роботовское ли это дело?

иллюстрация

Интересно, как построен алгоритм анализа этих показателей у нашей @cheetah?