Уважаемые пользователи Голос!
Сайт доступен в режиме «чтение» до сентября 2020 года. Операции с токенами Golos, Cyber можно проводить, используя альтернативные клиенты или через эксплорер Cyberway. Подробности здесь: https://golos.io/@goloscore/operacii-s-tokenami-golos-cyber-1594822432061
С уважением, команда “Голос”
GOLOS
RU
EN
UA
chaos.legion
6 лет назад

CXXIX. Борьба с плагиатом с помощью машинного обучения AI

Использование машинного обучения AI для борьбы с плагиатом

Всемирная паутина — мечта плагиатара. Огромное количество цифрового контента доступно для легкого копирования. К счастью, есть надежда, что люди будут противостоять распространению плагиата. Используя анализ данных и машинное обучение, плагиат можно держать под контролем.

Плагиат, конечно, является актом воспроизведения чужой работы или идеи, полностью или частично, не отдавая должное автору.

Плагиат может включать в себя дословное копирование текста, изображений или других средств массовой информации, но это этим дело не ограничивается. Контент, который заимствует чужие идеи без надлежащей атрибуции, также является формой плагиата. То есть статьи или сообщения в блогах, которые переиздаются без разрешения владельца контента или которые воспроизводятся без ссылки на его автора.

Преподаватели ВУЗов и издатели борются с плагиатом, распространение которого стало более простым в эпоху интернета, где размещено колоссальное количество информации, которая легко доступна путем простой комбинации "Copy-Paste".

Использование Data Analytics для борьбы с плагиатом

Тем не менее, даже когда цифровые технологии упростили использования плагиата, они также предоставляют и новые инструменты для борьбы с ним, которые основаны на анализе данных и машинном обучении. В настоящее время существует широкий спектр инструментов для обнаружения плагиата. Вот список только некоторых.

  • Dupli Checker — Это один из самых эффективных инструментов бесплатного обнаружения плагиата в Интернете. Хотя он не имеет причудливого интерфейса, он, безусловно, выполняет свою работу хорошо.

  • Copyleaks — Эта платформа проверки подлинности на основе облачных вычислений позволяет отслеживать, как контент eLearning используется во всем Интернете.

  • PaperRater — Многоцелевой инструмент обнаружения плагиата, который используется в более чем в 140 странах.

  • Plagiarisma — Простой в использовании многоцелевой инструмент обнаружения плагиата, который используется студентами, преподавателями, писателями, а также различными участниками литературной индустрии.

  • Plagiarism Checker — Удобный и полностью бесплатный инструмент обнаружения плагиата.

Существуют и различные русскоязычные платформы, такие, как Text.ru и другие.

Хотя эти инструменты отличаются деталями их функциональности, все они используют один и тот же базовый подход к обнаружению и анализу плагиата. Они используют данные и машинное обучение для принятия автоматических решений о том, является ли один фрагмент контента достаточно похожим на другой, чтобы считаться плагиатом.

Сложности обнаружения плагиата

Обнаружение плагиата достаточно просто, когда речь идет о дословном копировании авторского текста. Однако, как отмечалось выше, не весь плагиат имеет такой формат. Структура плагиата становятся более сложной, когда мы имеем дело с так называемым «умным плагиатом», что означает плагиат, который намеренно разработан таким образом, чтобы избежать существующих механизмов его автоматического обнаружения.

Смарт-плагиаторы могут использовать чужой контент, но менять структуру слов или предложений, чтобы запутать программы обнаружения. Это можно сделать вручную (например, в случае, если студенты пытаются избежать написания оригинальной курсовой работы) или автоматически (например, с помощью цифровых инструментов, которые крадут контент с одного веб-сайта и публикуют его в модифицированной форме на другом сайте).

Смарт-плагиат можно вывести на чистую воду только с помощью интеллектуальной аналитики данных и машинного обучения. Сложные инструменты должны управляться сложными алгоритмами, которые могут анализировать сходство между двумя частями контента и определять, был ли он скопирован с другого, даже если элементы выглядят оригинально с поверхностной точки зрения.

Вывод

Плагиат включает в себя воспроизведение существующей информации в измененном формате. Сегодня он встречается практически во всех областях человеческой деятельности, поэтому большое внимание уделяется выявлению и обнаружению плагиата. Сегодня некоторые экспериментальные результаты показывают, что в целом улучшаются показатели использования методов машинного обучения в случае обнаружения плагиата.

Борьба с плагиатом посредством машинного обучения — еще один пример того, как данные сейчас управляют практически всем, что мы делаем. Данные могут помочь контролировать честность студентов, редакторов веб-сайтов и всех, кто публикует контент на просторах Интернете, даже в тех случаях, когда это было бы очень сложно сделать обычными средствами.

Чтобы максимально использовать данные для обнаружения плагиата и для любой другой цели, необходимы инструменты для эффективного преобразования, перемещения и анализа данных. Платформа Syncsor предоставляет такие решения в сфере больших данных.

Автор: @konstantin


Контакты

Чат Легиона Хаоса в телеграм: Scintillam
Почтовый ящик для желающих стать авторами: vpchaoslegion@gmail.com
Личка в телеграм: varwar
Тег: chaos-legion


Sequere nobis. Nos scientiam

@chaos.legion

2
36.045 GOLOS
На Golos с September 2017
Комментарии (3)
Сортировать по:
Сначала старые