Анализ данных в Блокчейне. Интересная находка в Ethereum. Спикер: Сергей Недашковский
Спикер сегодняшней лекции расскажет об анализе данных в Блокчейн и о Huge Ethereum Mixer - примечательном инструменте в сети Ethereum.
Рассмотрим Блокчейн как базу данных
Важно отметить, что Блокчейн и есть база данных, которая развивается как и другие аналогичные информационные ресурсы.
Сначала база данных Блокчейн хранила информацию о транзакциях. Затем появился Ethereum и вместе с тем, возможность хранить еще и программный код. Параллельно появились системы для хранения даты, в данном случае текстовые - Steem и Golos. Все движется к тому, что мы будет обращаться не просто к базе данных, а к сервису для хранения объектов и самих баз данных внутри Блокчейн. Также появляется много проектов облачного выполнения приложений на Блокчейн и запускаются проекты в рамках уже существующей инфраструктуры - нейросети, что несомненно перспективно.
Процесс сбора информации с конкретной цепочки выглядит следующим образом:
Есть нода, у клиента ноды есть API ⇾ из которого достаточно просто получить дату, просто обратившись к нему, для этого необходимо написать скипт, обычно это Python ⇾ выгрузить туда, куда необходимо.
Для анализа конкретной цепочки можно воспользоваться данным алгоритмом действий.
Сейчас cyber•Fund готовит первый релиз Блокчейн Explorer, в котором все будет настроено по умолчанию, достаточно просто запустить его и будет собираться информация о цепочках и всех трейдах, которые существуют на рынке.
Разберем на примере Ethereum: как можно взять дату из Ethereum и поместить в нужное хранилище:
У клиента Parity есть удобное API, по адресу, указанному внизу изображения можно скачать скрипт, который берет дату из API Parity и помещает ее в CSV, Elasticsearch или PostgreSQL.
Теперь разберем на примере Golos, Steem:
Недавно прошел Блокчейн Хакатон, на котором команда cyber•Fund адаптировала выгрузку Steem к Golos и поместила все на MongoDB. Принцип тот же: есть нода с API, которая кладет все в MongoDB, оттуда информацию можно выгрузить с помощью скрипта Python или любого другого удобного скрипта.
Так выглядит классическая структура таблиц выгруженная из голоса:
Huge Ethereum Mixer
Сейчас переходим к конкретному исследованию, проведенному по транзакциям Ethereum и проанализируем получившиеся результаты.
Мы привыкли видеть объем транзакций Ethereum именно так и это действительно поразительные показатели, колоссальные цифры - в пике оборот примерно 15 000 000 000 USD по курсу на тот период в день.
Теперь расшифруем понятие Ethereum Mixer и как он работает
Миксер Ethereum - это то место, куда попадают токены, перемешиваются много раз, таким образом уже после 20-40 операций невозможно проследить откуда пришли токены и куда ушли.
Как удалось обнаружить систему:
Построив распределение и на спектральной диаграмме заметив явные «вылеты», проанализировав адреса, узлы и графы пришли к интересному результату:
Если посчитать все транзакции в Ethereum с момента запуска системы, то транзакции, не относимые к этим адресам, составляют 34%, все остальные - это транзакции из Миксера.
Если говорить о количестве транзакций, то 10,7% приходится на систему Миксер.
Проанализировав ситуацию на данный момент - только 14% транзакций приходится на операции не связанные с Миксером.
Вернемся к первой иллюстрации графика объема транзакций в Ethereum и вычтем операции связанные с системой Миксер
И увидим совершенно иную картину - эфир растет, есть положительная динамика, но не такая грандиозная как на первом графике, так как большая часть роста обеспечена именно включением Миксера.
Реальная картина роста Ethereum:
Общая картина: топ адресов на входе и на выходе:
Данная лекция представила алгоритм анализа данных в Блокчейн, также продемонстрировала интересную систему Миксер, используемую в Ethereum.