Як Web3 може відігравати роль на різних етапах в AI-індустрії

AI+Web3: Вежі та площі

ТЛ; ДОКТОР

  1. Проекти Web3 з концепцією ШІ стали привабливими для залучення коштів на первинному та вторинному ринку.

  2. Можливості Web3 в індустрії штучного інтелекту в основному проявляються в: використанні розподілених стимулів для координації потенційних постачань довгого хвоста ( через дані, зберігання та обчислення ); одночасно створюючи децентралізований ринок для відкритих моделей і AI Agent.

  3. ШІ в індустрії Web3 головним чином застосовується в ланцюгових фінансах ( криптооплатах, торгівлі, аналізі даних ) та допомозі в розробці.

  4. Ефективність AI+Web3 проявляється в взаємодоповненні сторін: Web3 має потенціал протистояти централізації AI, а AI має потенціал допомогти Web3 вийти за межі.

! AI+Web3: Вежі та Плази

Вступ

Останні два роки розвиток ШІ стрімко прискорився, поява ChatGPT відкрила нову еру генеративного штучного інтелекту і викликала хвилю в сфері Web3.

Під впливом концепції штучного інтелекту фінансування проектів Web3 помітно зросло. Тільки в першій половині 2024 року 64 проекти Web3+AI завершили фінансування, серед яких операційна система на базі штучного інтелекту Zyber365 отримала максимальне фінансування в 100 мільйонів доларів на раунді A.

Вторинний ринок став більш процвітаючим. Згідно з даними Coingecko, загальна ринкова капіталізація AI-сфери досягла 48,5 мільярдів доларів, а обсяг торгів за 24 години становить майже 8,6 мільярдів доларів. Прогрес у основних AI-технологіях приніс суттєві переваги, наприклад, після випуску Sora від OpenAI середня ціна в сегменті AI зросла на 151%. Ефект AI також поширився на сегмент криптовалют, що залучають капітал: перша концепція AI-агента MemeCoin GOAT швидко стала популярною, її оцінка досягла 1,4 мільярда доларів, що викликало бум AI Meme.

Дослідження та теми, пов'язані з AI+Web3, набирають обертів: від AI+Depin до AI Memecoin, далі до AI Agent та AI DAO, емоції FOMO вже важко встигати за швидкістю зміни нових наративів.

Комбінація концепцій AI+Web3, що наповнена гарячими грошима, модними тенденціями та фантазіями про майбутнє, неминуче сприймається як шлюб на замовлення для капіталістів. Нам важко визначити, чи це арена спекулянтів, чи переддень вибуху.

Щоб відповісти на це питання, ключовим є роздуми: чи стане все краще з іншою стороною? Чи можна отримати вигоду від моделі іншої сторони? У цій статті намагається розглянути цю ситуацію: як Web3 може впливати на різні етапи технологічного стеку ШІ, а ШІ може принести нове життя Web3?

Частина 1 Які можливості має Web3 під штучним інтелектом?

Перед тим, як розпочати цю тему, нам потрібно зрозуміти технологічний стек великих моделей штучного інтелекту:

AI великі моделі можна порівняти з людським мозком, на ранніх етапах, як у немовлят, потрібно спостерігати та збирати величезну кількість зовнішньої інформації, щоб зрозуміти світ, це етап "збирання" даних. Оскільки комп'ютери не мають багатосенсорності людини, перед навчанням потрібно "попереднє оброблення" для перетворення неназваної інформації в формат, зрозумілий комп'ютеру.

Після введення даних AI через "тренування" створює модель з можливістю розуміння та прогнозування, подібну до того, як дитина поступово розуміє і вивчає навколишній світ. Параметри моделі подібні до мовних здібностей дитини, які постійно коригуються. Зміст навчання розділяється на теми або отримується зворотний зв'язок через спілкування з людьми, переходячи до етапу "тонкої настройки".

Діти, які виросли і навчилися говорити, можуть розуміти та висловлюватися в нових діалогах, подібно до етапу "інференції" у великих AI-моделях, можуть здійснювати прогнозний аналіз нових вхідних даних. Немовлята виражають свої почуття мовою, описують об'єкти та вирішують проблеми, подібно до того, як великі AI-моделі, завершивши навчання, застосовуються для виконання різних спеціалізованих завдань, таких як класифікація зображень, розпізнавання мови тощо.

AI Agent стає ближчим до наступної форми великої моделі: здатен самостійно виконувати завдання, переслідуючи складні цілі, має здібності до мислення, пам'яті, планування, а також може використовувати інструменти для взаємодії з світом.

Щодо болючих точок у всіх стеків AI, Web3 наразі початково сформував багаторівневу взаємопов'язану екосистему, що охоплює всі етапи процесу моделювання AI.

! AI+Web3: Вежі та Квадрати

Одне. Базовий рівень: обчислювальна потужність та дані Airbnb

Потужність

На даний момент одним з найвищих витрат, пов'язаних з AI, є обчислювальна потужність та енергія, необхідні для навчання та інференції моделей.

Якщо Meta LLAMA3 потребує 16000 NVIDIA H100 GPU, щоб завершити навчання за 30 днів. Ціна за 80 ГБ версію становить 30-40 тисяч доларів, потрібно інвестувати 400-700 мільйонів доларів у апаратуру, щомісячне споживання електроенергії складає 1,6 мільярда кіловат-годин, витрати на енергію становлять майже 20 мільйонів доларів.

Розгортання штучного інтелекту є перетином Web3 з AI------DePin( децентралізованою мережею фізичної інфраструктури). DePin Ninja перерахував понад 1400 проектів, такими як io.net, Aethir, Akash, Render Network є прикладами спільного використання GPU.

Основна логіка: платформа дозволяє власникам невикористаних GPU ресурсів без дозволу децентралізовано вносити обчислювальну потужність, подібно до онлайн-ринку, де купують і продають сторони, як у Uber чи Airbnb, підвищуючи використання недостатньо використаних GPU ресурсів; кінцеві користувачі отримують недорогі та ефективні обчислювальні ресурси; одночасно механізм стейкінгу забезпечує покарання для постачальників ресурсів у разі порушення контролю якості або переривання мережі.

Особливості:

  • Збір вільних ресурсів GPU: переважно для надлишкових обчислювальних потужностей малих та середніх сторонніх дата-центрів, крипто-майнінгових ферм тощо, обладнання для PoS-майнінгу, такого як FileCoin та ETH-майнери. Є також проекти, які прагнуть знизити поріг входу для обладнання, такі як exolab, що використовує MacBook, iPhone, iPad та інші локальні пристрої для створення мережі обчислювальної потужності для інфраструктури великих моделей.

  • Орієнтуючись на довгий хвіст ринку обчислювальної потужності ШІ: a. Технічний бік: більш підходить для етапів висновків. Навчання залежить від надвеликих кластерів GPU, вимоги до обчислювальної продуктивності GPU для висновків є нижчими, наприклад, Aethir зосереджений на низькозатратному рендерингу та AI-висновках. b. Сторона попиту: невеликі замовники обчислювальної потужності не будуть окремо навчати великі моделі, а лише оптимізувати та тонко налаштовувати великі моделі, що природно підходить для розподілених невикористаних обчислювальних ресурсів.

  • Децентралізоване володіння: Значення технології блокчейн полягає в тому, що власники ресурсів завжди зберігають контроль над ресурсами, гнучко коригуючи їх та отримуючи прибуток.

Дані

Дані є основою штучного інтелекту. Без даних обчислення, як і мертва трава, не мають жодної користі; зв'язок між даними та моделлю можна описати висловом "Сміття на вході, сміття на виході". Кількість та якість даних визначають кінцеву якість виходу моделі. Для навчання моделей штучного інтелекту дані визначають мовленнєві здібності, здатність до розуміння, світогляд та гуманітарні прояви. Наразі основними проблемами з потребами в даних для штучного інтелекту є:

  • Голод даних: тренування AI моделей залежить від величезних обсягів даних. OpenAI тренував GPT-4 з кількістю параметрів на рівні трильйонів.

  • Якість даних: з розвитком AI та інтеграцією в різні галузі з'являються нові вимоги до своєчасності, різноманітності, професійності даних, а також до нових джерел даних, таких як емоційний аналіз в соціальних мережах.

  • Приватність та відповідність: підприємства в різних країнах поступово звертають увагу на важливість якісних наборів даних та обмежують їх збір.

  • Високі витрати на обробку даних: велика кількість даних, складна обробка. AI-компанії витрачають понад 30% витрат на дослідження та розробки на базове збори та обробку даних.

Рішення Web3 проявляються в чотирьох аспектах:

  1. Збір даних: безкоштовне отримання даних з реального світу швидко виснажується, витрати AI-компаній на дані щорічно зростають, але не повертаються справжнім внесникам, платформа отримує всю цінність, наприклад, Reddit отримав 203 мільйони доларів доходу через угоди з AI-компаніями.

Дати можливість справжнім користувачам брати участь у створенні цінності даних, отримувати більш приватні цінні дані низькою вартістю через розподілену мережу та механізми стимулювання — це бачення Web3.

  • Трава: децентралізований рівень даних та мережа, користувачі запускають вузли, вносячи свій вільний пропускний здатність для ретрансляції трафіку, захоплюючи в реальному часі дані та отримуючи токен- винагороди.

  • Vana: Введення концепції пулу ліквідності даних (DLP), користувачі завантажують приватні дані в певний DLP і гнучко обирають, чи дозволяти третім особам їх використовувати.

  • PublicAI: Користувачі можуть збирати дані, використовуючи #AI或#Web3 тег на X та @PublicAI.

  1. Передобробка даних: У обробці даних за допомогою ШІ збори даних зазвичай є шумними та містять помилки, тому перед навчанням їх необхідно очистити та перетворити в придатний формат, що включає стандартизацію, фільтрацію, обробку відсутніх значень та інші повторювані завдання. Ця стадія є однією з небагатьох ручних етапів в індустрії ШІ, що спричинило виникнення індустрії маркування даних; оскільки моделі підвищують вимоги до якості даних, планка також підвищується, що природно підходить для децентралізованих механізмів стимулювання Web3.
  • Grass та OpenLayer розглядають можливість додавання етапу маркування даних.

  • Synesis提出 "Train2earn" концепцію, підкреслюючи якість даних, користувачі надають анотації даних, коментарі тощо отримують винагороду.

  • Проект маркування даних Sapien перетворює завдання з маркування на гру, користувачі ставлять на кон бали, щоб заробити більше балів.

  1. Приватність та безпека даних: потрібно чітко розрізняти приватність даних та безпеку, адже це дві різні концепції. Приватність даних стосується обробки чутливих даних, тоді як безпека даних захищає інформацію від несанкціонованого доступу, знищення та крадіжки. Переваги технологій приватності Web3 та потенційні сценарії застосування: (1) тренування чутливих даних; (2) співпраця з даними: кілька власників даних беруть участь у навчанні ШІ без необхідності ділитися оригінальними даними.

Поточні технології конфіденційності Web3:

  • Довірене виконавче середовище ( TEE ), як Super Protocol

  • Повна гомоморфна криптографія (FHE), така як BasedAI, Fhenix.io, Inco Network

  • Технологія нульового знання ( zk ), така як Reclaim Protocol, використовує технологію zkTLS для генерування нульових доказів HTTPS-трафіку, дозволяючи користувачам безпечно імпортувати дані про активність, репутацію та ідентичність з зовнішніх веб-сайтів без необхідності розкривати чутливу інформацію.

Ця сфера все ще на ранній стадії, більшість проектів перебувають у процесі дослідження, наразі проблема полягає у високих витратах на обчислення, наприклад:

  • Фреймворк zkML EZKL потребує близько 80 хвилин для створення доказу моделі 1M-nanoGPT.

  • Дані Modulus Labs показують, що витрати zkML перевищують чисті обчислення більш ніж у 1000 разів.

  1. Зберігання даних: необхідно зберігати дані в ланцюзі та генерувати LLM. Основною проблемою є доступність даних (DA), до оновлення Danksharding пропускна здатність Ethereum становила 0,08 МБ. Для навчання моделей ШІ та реального інференсу зазвичай потрібно 50-100 ГБ пропускної здатності даних на секунду. Така різниця в обсягах робить існуючі рішення на ланцюзі складними для ресурсомістких застосувань ШІ.
  • 0g.AI є представником проекту. Це централізоване рішення для зберігання, розроблене для високих вимог до продуктивності AI, ключові характеристики: висока продуктивність та масштабованість, підтримує швидке завантаження та завантаження великих масивів даних за допомогою передових технологій шардінгу та кодів виправлення помилок, швидкість передачі даних наближається до 5 ГБ на секунду.

Два, Проміжне програмне забезпечення: навчання та виведення моделі

Децентралізований ринок відкритих моделей

Дебати про закриті та відкриті моделі ШІ тривають. Відкритість приносить колективні інновації, що є незрівнянною перевагою закритих моделей, але як підвищити мотивацію розробників без прибуткової моделі? Засновник Baidu Лі Яньхун у квітні стверджував, що "відкриті моделі будуть все більше відставати".

Web3 пропонує можливість децентралізованих відкритих моделей ринку: токенізація самої моделі, збереження певного відсотка токенів для команди, перенаправлення частини майбутніх доходів на тримачів токенів.

  • Протокол Bittensor створює відкритий P2P ринок моделей, що складається з десятків "підмереж", де постачальники ресурсів ( обчислюють, збирають/зберігають дані, а таланти в машинному навчанні ) змагаються за задоволення цілей конкретних власників підмереж. Підмережі можуть взаємодіяти, вчитися одна в одної для досягнення більшої потужності інтелекту. Нагороди розподіляються через голосування громади та додатково розподіляються між підмережами залежно від їхніх виступів у конкуренції.

  • ORA впроваджує концепцію первинного випуску (IMO), токенізуючи моделі ШІ, які можна купувати, продавати та розробляти через децентралізовану мережу.

  • Sentient, децентралізована платформа AGI, яка заохочує людей співпрацювати, створювати, копіювати та розширювати моделі ШІ, а також винагороджує внесок.

  • Spectral Nova, зосереджено на створенні та застосуванні моделей ШІ та МЛ.

Доведене міркування

Щодо проблеми "чорної скриньки" в AI-інференції, стандартним рішенням Web3 є повторна перевірка результатів за участю кількох валідаторів, але нестача висококласних "чіпів Nvidia" призводить до високих витрат на AI-інференцію, тому це підхід стикається з викликами.

Більш обнадійливим є виконання ZK-доказів для обчислення AI-інференції поза ланцюгом, що не вимагає дозволу для перевірки обчислень AI-моделі на ланцюзі. Потрібно зашифрувати докази на ланцюзі, що поза ланцюгом обчислено правильно завершення (, якщо набір даних не зазнав змін ), одночасно забезпечуючи конфіденційність усіх даних.

Основні переваги:

  • Масштабованість: нульові знання дозволяють швидко підтверджувати велику кількість обчислень поза ланцюгом. Навіть якщо кількість транзакцій зростає, одне підтвердження може перевірити всі транзакції.

  • Захист конфіденційності: деталі даних та AI моделей залишаються конфіденційними, сторони можуть перевірити, що дані та моделі не були порушені.

  • Не потрібно довіряти: можна підтвердити обчислення без залежності від централізованих учасників.

  • Інтеграція Web2: за визначенням Web2 є інтеграцією поза ланцюгом, верифіковане висновування може допомогти перенести його набори даних та обчислення ШІ на ланцюг, що сприяє підвищенню рівня прийняття Web3.

Наразі технології Web3 для верифікованого міркування:

  • zkML: поєднує нульові знання та машинне навчання, забезпечуючи конфіденційність даних і моделей, дозволяючи верифіковані обчислення без розкриття основних властивостей, як-от ZK-протокол, створений на основі ZKML компанією Modulus Labs, ефективно перевіряє, чи правильно постачальники AI виконують алгоритми в ланцюгу, наразі клієнти в основному є DApp на ланцюгу.

  • opML: Використовуючи принцип оптимістичного агрегування, підвищити ML через перевірку часу виникнення суперечок.

Переглянути оригінал
Ця сторінка може містити контент третіх осіб, який надається виключно в інформаційних цілях (не в якості запевнень/гарантій) і не повинен розглядатися як схвалення його поглядів компанією Gate, а також як фінансова або професійна консультація. Див. Застереження для отримання детальної інформації.
  • Нагородити
  • 3
  • Поділіться
Прокоментувати
0/400
AirdropHuntervip
· 17год тому
ще не обдурюють людей, як лохів великі фінансові ресурси
Переглянути оригіналвідповісти на0
OnChainDetectivevip
· 17год тому
Слідкував за напрямками фінансів три дні. Всі кити накопичують концепцію ai.
Переглянути оригіналвідповісти на0
MEVSupportGroupvip
· 17год тому
Це всього лише нова іграшка капіталістів
Переглянути оригіналвідповісти на0
  • Закріпити