Дані як активи: DataFi відкриває новий блакитний океан
Світ перебуває в епосі змагання за створення найкращих базових моделей. Хоча обчислювальна потужність і архітектура моделей є важливими, справжнім захистом є навчальні дані. Найбільша новина цього місяця в колі ШІ - це демонстрація сили Meta, де Цукерберг активно наймає таланти і формує розкішну команду ШІ, до складу якої входять переважно китайські науковці. Лідером є 28-річний Alexander Wang, засновник Scale AI, чия оцінка на сьогодні становить 29 мільярдів доларів США і яка надає дані багатьом конкурентним гігантам ШІ, включаючи військові сили США, OpenAI, Anthropic, Meta та інші. Основний бізнес Scale AI полягає в наданні великої кількості точних маркованих даних.
Успіх Scale AI
Причина, чому Scale AI змогла вирізнитися серед багатьох єдинорогів, полягає в тому, що вона рано виявила важливість даних у галузі штучного інтелекту.
Обчислювальна потужність, модель та дані - це три основні опори AI моделі. Якщо порівнювати велику модель з людиною, то модель - це тіло, обчислювальна потужність - це їжа, а дані - це знання/інформація.
У процесі швидкого розвитку LLM акцент у галузі змістився від моделей до обчислювальної потужності. Наразі більшість моделей вже закріпили transformer як основу, іноді з'являються інновації, такі як MoE або MoRe; великі компанії або створюють суперкомп'ютерні кластери, або укладають довгострокові угоди з постачальниками хмарних послуг для вирішення проблеми обчислювальної потужності. Після задоволення основних потреб у обчислювальній потужності важливість даних поступово починає проявлятися.
Scale AI прагне створити міцну базу даних для моделей ШІ, її бізнес не лише включає видобуток існуючих даних, але й зосереджений на довгостроковому бізнесі з генерації даних. Компанія формує команди тренування ШІ з експертів у різних сферах, щоб забезпечити більш якісні дані для навчання моделей ШІ.
Два етапи навчання моделі
Модельне навчання ділиться на два етапи: попереднє навчання та доопрацювання.
Процес навчання, подібний до того, як людські немовлята вчаться говорити, вимагає введення в модель ШІ великої кількості текстів, кодів та іншої інформації, зібраної з Інтернету, щоб модель могла самостійно навчитися основним навичкам спілкування.
Тонка настройка схожа на школу, де зазвичай є чіткі правильні та неправильні відповіді і напрямки. Різні "школи" виховують різних "фахівців" з різними характеристиками. Ми використовуємо деякі ретельно підготовлені, цільові набори даних, щоб надати моделі ті здібності, на які ми сподіваємось.
Отже, нам потрібні два типи даних:
Велика кількість даних, які не потребують значної обробки, в основному походять з великих UGC платформ, даних веб-сканування, відкритих баз даних літератури, корпоративних приватних баз даних тощо.
Професійний набір даних, ретельно спроектований і відібраний, потребує очищення, відбору, маркування та зворотного зв'язку від людей.
Ці два типи наборів даних складають основу траси AI Data. На сьогодні вважається, що в міру зникнення переваги обчислювальної потужності дані стануть ключем для виробників великих моделей для збереження конкурентоспроможності.
З підвищенням можливостей моделей різні більш точні та професійні навчальні дані стануть ключовим фактором, що визначає можливості моделей. Якщо порівняти навчання моделі з вихованням майстра бойових мистецтв, то якісний набір даних є найкращим посібником з бойових мистецтв.
З точки зору довгострокової перспективи, AI Data є довготривалою нішею з ефектом снігової кулі. З накопиченням попередніх робіт, дані активи набудуть здатності до компаундного зростання, їхня вартість буде зростати з часом.
Web3 DataFi: Ідеальний ґрунт для AI даних
На відміну від традиційних даних компаній, Web3 має природні переваги в галузі даних AI, що призвело до появи концепції DataFi.
В ідеальному випадку переваги Web3 DataFi включають:
Смарт-контракти забезпечують суверенітет даних, безпеку та конфіденційність
Розподілена архітектура приваблює найбільш підходящу глобальну робочу силу
Блокчейн надає чіткі переваги в стимулюванні та розрахунках
Сприяє створенню ефективного, відкритого єдиного ринку даних
Для звичайних користувачів DataFi є найзручнішим децентралізованим проектом штучного інтелекту. Користувачам потрібно лише просто увійти до гаманця, щоб взяти участь, виконуючи різні завдання, такі як надання даних, оцінка моделей, використання AI-інструментів для простого створення, участь у торгівлі даними тощо.
Потенційні проєкти Web3 DataFi
На сьогоднішній день декілька проектів DataFi отримали великі інвестиції, нижче наведені деякі представницькі проекти:
Sahara AI: прагне створити інфраструктуру та торговий ринок для децентралізованого ШІ
Yupp: платформа зворотного зв'язку для AI-моделей, що збирає відгуки користувачів про виходи моделей
Vana: перетворення особистих даних користувачів на цифрові активи, які можна монетизувати
Chainbase: зосереджений на даних блокчейну, охоплює понад 200 блокчейнів
Sapien: Перетворення людських знань на високоякісні дані для навчання ШІ
Prisma X: прагне створити відкритий координаційний шар для роботів
Masa: підпроект екосистеми Bittensor, що надає доступ до даних в реальному часі
Irys: зосереджений на програмованому зберіганні даних та обчисленнях
ORO: надає можливість звичайним людям брати участь у внесках в AI
Gata: децентралізований рівень даних, що пропонує різні способи участі в даних
Ці проекти наразі мають загалом низькі бар'єри, але з накопиченням користувачів та екосистемної прихильності, переваги платформи швидко сформуються. Раннім проектам слід зосередитися на мотиваційних заходах та досвіді користувачів, щоб залучити достатню кількість користувачів.
Водночас ці платформи також повинні звернути увагу на те, як управляти людськими ресурсами, забезпечувати якість даних і уникати явища "вибивання поганих монет" через "вибивальників". Деякі проекти, такі як Sahara та Sapien, вже почали підкреслювати якість даних, намагаючись встановити довгострокові здорові партнерські відносини з користувачами платформи.
Крім того, підвищення прозорості також є викликом, з яким стикаються нинішні проекти на блокчейні. Багато проектів все ще повинні пришвидшити процес відкритості та прозорості для сприяння довгостроковому здоровому розвитку Web3 DataFi.
Масштабне впровадження DataFi потребує просування з двох напрямків: по-перше, залучення достатньої кількості індивідуальних користувачів для участі в зборі/генерації даних, формування споживчої групи AI економіки; по-друге, отримання визнання від основних підприємств, оскільки в короткостроковій перспективі вони є основним джерелом великих даних.
Висновок
З одного боку, DataFi - це використання людського інтелекту для тривалого розвитку машинного інтелекту, одночасно забезпечуючи прибуток від людської праці через смарт-контракти, і в кінцевому підсумку насолоджуючись поверненням від машинного інтелекту.
Для тих, хто сповнений невизначеності в епоху штучного інтелекту, або хто все ще має ідеали в області блокчейну, слідування за капіталістичними магнатами та занурення в DataFi може стати вдалим вибором.
Переглянути оригінал
Ця сторінка може містити контент третіх осіб, який надається виключно в інформаційних цілях (не в якості запевнень/гарантій) і не повинен розглядатися як схвалення його поглядів компанією Gate, а також як фінансова або професійна консультація. Див. Застереження для отримання детальної інформації.
16 лайків
Нагородити
16
4
Поділіться
Прокоментувати
0/400
SneakyFlashloan
· 21год тому
Боже, 28 років і 29 мільярдів. Мені потрібно постаратися.
Переглянути оригіналвідповісти на0
MetaMuskRat
· 21год тому
Знову Зак діє, сміюсь до сліз.
Переглянути оригіналвідповісти на0
NftDataDetective
· 21год тому
схоже, що цукерки нарешті зрозуміли... дані - це нова нафта, серйозно
Переглянути оригіналвідповісти на0
AirdropChaser
· 21год тому
Присідай і подивись, дійсно грошей багато в цьому проекті, час вкладатись.
DataFi: Web3 сприяє новій тенденції майнізації даних AI
Дані як активи: DataFi відкриває новий блакитний океан
Світ перебуває в епосі змагання за створення найкращих базових моделей. Хоча обчислювальна потужність і архітектура моделей є важливими, справжнім захистом є навчальні дані. Найбільша новина цього місяця в колі ШІ - це демонстрація сили Meta, де Цукерберг активно наймає таланти і формує розкішну команду ШІ, до складу якої входять переважно китайські науковці. Лідером є 28-річний Alexander Wang, засновник Scale AI, чия оцінка на сьогодні становить 29 мільярдів доларів США і яка надає дані багатьом конкурентним гігантам ШІ, включаючи військові сили США, OpenAI, Anthropic, Meta та інші. Основний бізнес Scale AI полягає в наданні великої кількості точних маркованих даних.
Успіх Scale AI
Причина, чому Scale AI змогла вирізнитися серед багатьох єдинорогів, полягає в тому, що вона рано виявила важливість даних у галузі штучного інтелекту.
Обчислювальна потужність, модель та дані - це три основні опори AI моделі. Якщо порівнювати велику модель з людиною, то модель - це тіло, обчислювальна потужність - це їжа, а дані - це знання/інформація.
У процесі швидкого розвитку LLM акцент у галузі змістився від моделей до обчислювальної потужності. Наразі більшість моделей вже закріпили transformer як основу, іноді з'являються інновації, такі як MoE або MoRe; великі компанії або створюють суперкомп'ютерні кластери, або укладають довгострокові угоди з постачальниками хмарних послуг для вирішення проблеми обчислювальної потужності. Після задоволення основних потреб у обчислювальній потужності важливість даних поступово починає проявлятися.
Scale AI прагне створити міцну базу даних для моделей ШІ, її бізнес не лише включає видобуток існуючих даних, але й зосереджений на довгостроковому бізнесі з генерації даних. Компанія формує команди тренування ШІ з експертів у різних сферах, щоб забезпечити більш якісні дані для навчання моделей ШІ.
Два етапи навчання моделі
Модельне навчання ділиться на два етапи: попереднє навчання та доопрацювання.
Процес навчання, подібний до того, як людські немовлята вчаться говорити, вимагає введення в модель ШІ великої кількості текстів, кодів та іншої інформації, зібраної з Інтернету, щоб модель могла самостійно навчитися основним навичкам спілкування.
Тонка настройка схожа на школу, де зазвичай є чіткі правильні та неправильні відповіді і напрямки. Різні "школи" виховують різних "фахівців" з різними характеристиками. Ми використовуємо деякі ретельно підготовлені, цільові набори даних, щоб надати моделі ті здібності, на які ми сподіваємось.
Отже, нам потрібні два типи даних:
Велика кількість даних, які не потребують значної обробки, в основному походять з великих UGC платформ, даних веб-сканування, відкритих баз даних літератури, корпоративних приватних баз даних тощо.
Професійний набір даних, ретельно спроектований і відібраний, потребує очищення, відбору, маркування та зворотного зв'язку від людей.
Ці два типи наборів даних складають основу траси AI Data. На сьогодні вважається, що в міру зникнення переваги обчислювальної потужності дані стануть ключем для виробників великих моделей для збереження конкурентоспроможності.
З підвищенням можливостей моделей різні більш точні та професійні навчальні дані стануть ключовим фактором, що визначає можливості моделей. Якщо порівняти навчання моделі з вихованням майстра бойових мистецтв, то якісний набір даних є найкращим посібником з бойових мистецтв.
З точки зору довгострокової перспективи, AI Data є довготривалою нішею з ефектом снігової кулі. З накопиченням попередніх робіт, дані активи набудуть здатності до компаундного зростання, їхня вартість буде зростати з часом.
Web3 DataFi: Ідеальний ґрунт для AI даних
На відміну від традиційних даних компаній, Web3 має природні переваги в галузі даних AI, що призвело до появи концепції DataFi.
В ідеальному випадку переваги Web3 DataFi включають:
Для звичайних користувачів DataFi є найзручнішим децентралізованим проектом штучного інтелекту. Користувачам потрібно лише просто увійти до гаманця, щоб взяти участь, виконуючи різні завдання, такі як надання даних, оцінка моделей, використання AI-інструментів для простого створення, участь у торгівлі даними тощо.
Потенційні проєкти Web3 DataFi
На сьогоднішній день декілька проектів DataFi отримали великі інвестиції, нижче наведені деякі представницькі проекти:
Ці проекти наразі мають загалом низькі бар'єри, але з накопиченням користувачів та екосистемної прихильності, переваги платформи швидко сформуються. Раннім проектам слід зосередитися на мотиваційних заходах та досвіді користувачів, щоб залучити достатню кількість користувачів.
Водночас ці платформи також повинні звернути увагу на те, як управляти людськими ресурсами, забезпечувати якість даних і уникати явища "вибивання поганих монет" через "вибивальників". Деякі проекти, такі як Sahara та Sapien, вже почали підкреслювати якість даних, намагаючись встановити довгострокові здорові партнерські відносини з користувачами платформи.
Крім того, підвищення прозорості також є викликом, з яким стикаються нинішні проекти на блокчейні. Багато проектів все ще повинні пришвидшити процес відкритості та прозорості для сприяння довгостроковому здоровому розвитку Web3 DataFi.
Масштабне впровадження DataFi потребує просування з двох напрямків: по-перше, залучення достатньої кількості індивідуальних користувачів для участі в зборі/генерації даних, формування споживчої групи AI економіки; по-друге, отримання визнання від основних підприємств, оскільки в короткостроковій перспективі вони є основним джерелом великих даних.
Висновок
З одного боку, DataFi - це використання людського інтелекту для тривалого розвитку машинного інтелекту, одночасно забезпечуючи прибуток від людської праці через смарт-контракти, і в кінцевому підсумку насолоджуючись поверненням від машинного інтелекту.
Для тих, хто сповнений невизначеності в епоху штучного інтелекту, або хто все ще має ідеали в області блокчейну, слідування за капіталістичними магнатами та занурення в DataFi може стати вдалим вибором.