Система поиска в формате Web 3.0, или гипотеза Пуанкаре в действии

Коллеги могут со мной не согласиться, но это мало что изменит, поскольку весь современный поиск, будь он построен на индексировании или же через семантическое моделирование (впрочем, сейчас и моделирования-то нет: есть условная унификация представлений внутри моделей) живёт на моделях "выдачи" кого-то кому-то, а не совместной полезной работы.

Но в жизни реальной, а не виртуальной, поиск часто происходит по иным критериям: "опасное это дело, Фродо, выходить за порог: стоит ступить на дорогу и, если дашь волю ногам, неизвестно куда тебя занесёт". Мы ищем планеты через спектральный анализ, гравитационные эффекты и прочее; мы предсказываем Бозон Хиггса и уже НА ОСНОВЕ гипотезы - мастерим дорогостоящее оборудование, способное его "найти".

Впрочем, в цифровом пространстве так тоже поступают: хакеры. Например, когда осуществляют фингерпринтинг: устройств, ОС, серверов и т.д., а до него - сканирование по различным заданным параметрам. Ещё один удачный пример - Shodan, который ищет дыры безопасности (и здесь - снова больше пересечений с поиском Чёрных дыр в Космосе, чем вы думаете) в самой примитивной части IoT.

И всё же поиск нынешний - будь то абстрактный семантический граф или граф знаний, или всё тот же индекс - основан на гипотезе, что:

проиндексировать можно всё по определённым правилам (банально - через запуск "паука").
всё, что вне графа/индекса - вне Сети.
всё подаётся некой формализацией.

Всё это так и не так одновременно: да, индексация и/или помещение в граф знаний - вполне себе формализуемый процесс, но уже второй пункт сам по себе содержит (моё) лукавство: есть множество закрытых, запароленных страниц; страниц, создаваемых ad hoc через js-код; страниц внутри Deep/Dark-Net'а, не говоря о разного рода эксперементальных сетях, а равно и тех, для кого криптография и стеганография являются основой и просто не доступны "простым смертным".

С другой стороны: IoT постепенно (в том числе - благодаря IPv6, появлению новых игроков и т.д.) уходит в сторону некой, пока предельно абстрактной, но самостоятельной сети; возможность меш-сетей, встроенная в 5G/bluetooth и т.д. сулит ещё множество локальных (по месту начального распространения) глобальных (по возможности соединения с другими сетями: как себеподобными, так и нет) сетей; IPFS/blockchain-ноды и другие p2p-сущности и вовсе априори настроены на работу не только внутри Интернета, но и во вне. Говоря проще: сетей будет становиться больше и далеко не все из них будут зависеть, в том числе и на уровне низшем - физическом - от Интернета.

И здесь натолкнёмся (уже столкнулись) со множеством проблем. Перечислю несколько очевидных:

Индексировать IPv6 гораздо сложнее, чем IPv4: конечно, есть метки потоков, классы трафика, многоадресное вещание; но есть при этом и джамбограммы в 4 Гб! Но главное... !внимание! ... "количество адресов IPv6 в 79 228 162 514 264 337 593 543 950 336 раз больше числа адресов IPv4"! Как вам такая цифра? Я про масштабирование индекса/графа...
А как быть с тем, что в Интернете у нас были устройства (ПК, смартфоны и т.д.) и субъекты, а Web 3.0 концепт предусматривает не просто более широкий их спектр (AI, автономные IoT-устройста, ДАО и другие наборы смарт-контрактов и прочее), но и фактическое начальное (я бы назвал - на нулевом уровне) равенство субъекта и объекта? Как репутационно, так и по другим параметрам.
Или ещё один момент: когда грань между оффлайном и онлайном станет невидимой совсем (будут ли это какие-то аспекты VR/AR, микродатчики "в каждом кирпиче" или что-то ещё - не важно), то как именно не мы, но условные они (роботы, скрипты, истинный AI и другие) начнут разделять оффлайн и онлайн? Если не будут, то вопросов возникнет ещё больше: одно дело "умереть" в сетевой игре, другое дело - в реальной (?) жизни.
И подобных проблем - ещё несколько...

Как же их решить?

И вот теперь - о гипотезе Пуанкаре, которая утверждает: «всякое односвязное замкнутое n-мерное многообразие гомеоморфно n-мерной сфере». Быть может, дело в том, что доказал её мой великий соотечественник - Г. Перельман: быть может, потому что потратил достаточное время на изучение выводов, следующих за её доказательством; быть может, по причине какой-то иной, но ключевым для меня явилось слово "гомеоморфно", то есть до нужной степени сходной с заданной сущностью (если сосвсем-совсем далеки от физики и иже с ней - для вас есть вот этот материал, который проясняет не всё, но два ключевых аспекта: вполне понятным языком).

Проще говоря, можно сделать вывод, что если "ещё не известные данные" есть некая тёмная материя объединённого пространства-времении оффлайна и онлайна, а дискретность неких соединений - как уровни строения материи (от Планковкой длины до возможной Мультивселенной), то можно в конечном итоге, имея тем более важный связывающий элемент - время, прийти к условной категориальной эквивалентности этих сущностей: то есть равенство оффлайна и онлайна, как минимум, для некой модели обобщённого поиска в любой точке пространства-времени - находится ли она в "реальности" или же в "виртуальности".

Для этого предлагаю использовать следующий подход:

Назовём SaO - некую сущность, которая может быть как субъектом, так и объектом, которая действием или бездействием может создавать некие поисковые транзакции (один запрос может содержать НЕСКОЛЬКО поисковых транзакций - ПТ). SaO может быть человеком, искусственным интеллектом, скриптом, Dapps'ом или чем-то ещё.

SaO может иметь достаточные знания (не важно, что под этим понимаете) для создания некой ПТ - взяв всего три элемента, а именно: выбрав сеть (глобальный Интернет вещей, некие Локальные Глобальные Сети (ЛГС), какие-то ad hoc сети (меш-сети или иные), Интернет или любые другие); задав временной интервал (период времени) и/или же временную точку (например, ровно 00:10:06:000 07.02.2020), а также задав (по семантической и/или индексной модели) описание искомого, может начать создание собственной под-Сети поиска, применяя две "старые" модели с новым подходом децентрализации/распределения информации.

Это отчасти похоже на поиск "внеземных цивилизаций" и различных небесных тел/скоплений/etc. посредством радио-, рентгеновского, оптических (aka Хаббл) телескопов. Похоже это и на экспертные сети с разбивкой формата "Раздел - подраздел - вопрос - ответ". Можно сравнить и со сканированием wi-fi сетей по диапазону. И много с чем ещё - и каждый раз сравнение будет неполным.

Но суть его такова, что:

Получаем простую и понятную модель, где каждый SaO может по мере необходимости (!) становиться условным поисковым оракулом, а заодно и нодой, которая в конечном итоге будет иметь определённую репутацию. Например, сегодня есть Wiki-энтузиасты, которые "по фану" заполняют страницы электронной энциклопедии и имеют немеренный социальный капитал, который не обязательно монетизируется (пример с монетизацией - А. Антонополоус). Такой путь значительно облегчит создание p2p-систем датчиков и неких внешних оракулов, предсказывающих погоду куда точнее нынешних синоптиков-шаманов. Или же мы сможем пробовать путешствовать внутри виртуального пространства в формате не "Звёздного пути" (aka Startrack), а, скорее, как в безумном фильме/книге "Автостопом по Галактике".
Имея явное противоборство централизованных (с их именно стороны) и децентрализованных/распределённых систем (ДРС) - можно с помощью big data и обучаемых нейронных сетей, выявлять аномалии и тем самым - выводить мошенников на чистую воду: будь то очередной слив персональных данных или же завышение продаж IoT-устройств или даже политическое давление на определённые регионы. Вы ведь не являетесь специалистом в политологии, языках программирования, создании чего-то на Raspberry pi и высокой кухне сразу? Я тоже :) А вот разные люди/устройства - да: и нужно дать им шанс индексировать Единую Сверхсеть самим! Хватит уже доверять google и тем более kremlin.
Наконец, та самая транзакционная репутация, о коей твержу с 2017 года (и даже 2016, если говорить о философских основаниях), а равно и монетизация социального капитала становятся реальностью: вы/кто-то/что-то можете делать нечто и получать за это токены/фиатные деньги/лайки/иные поощрения, затем пытаясь перевести в нужную стоимостную сущность, также руководствуясь тремя критериями: количественным, временным и субъективным.

Надеюсь, концепт ясен: его (рас)толкование и пояснение на примерах - в следующий раз, а пока -

До!

web-3 веб-3 поиск cyb граф-знаний индексирование граф menaskop

295