AI-дані містять величезний потенціал, Web3 DataFi може стати новою блакитною океан.
У сьогоднішньому світі, де глобальні змагання в галузі ШІ стають дедалі жорсткішими, дані поступово стають ключовою перевагою для створення відмінних базових моделей. Оскільки різниця в архітектурі моделей та обчислювальних можливостях поступово зменшується, якісні навчальні дані стануть основним фактором, що визначає конкурентоспроможність компаній у галузі ШІ.
Цього місяця найпомітнішою подією в AI-середовищі стало те, що Meta активно вербує таланти, формуючи провідну команду AI, переважно з китайських науковців. Особливо привертає увагу 28-річний Alexander Wang. Його компанія Scale AI наразі оцінюється в 29 мільярдів доларів США і надає послуги з обробки даних багатьом великим AI-компаніям, включаючи американську армію. Причина, чому Scale AI змогла виділитися серед багатьох юнікорнів, полягає в тому, що вона рано усвідомила важливість даних у AI-індустрії.
Якщо порівняти великий модель з людиною, то модель є тілом, обчислювальна потужність - це їжа, а дані - це знання та інформація. У процесі стрімкого розвитку великих мовних моделей акцент в індустрії змістився з архітектури моделей на обчислювальну потужність, і тепер більшість моделей використовують трансформер як базову структуру. Великі компанії або створюють власні суперкомп'ютерні кластери, або укладають довгострокові угоди з постачальниками хмарних послуг для задоволення базових потреб в обчислювальній потужності. У цьому контексті важливість даних стає дедалі очевиднішою.
На відміну від традиційних компаній з обробки великих даних для бізнесу, Scale AI зосереджується на створенні міцної бази даних для AI-моделей. Її діяльність охоплює не лише видобуток існуючих даних, але й спрямована на довгостроковий бізнес з генерації даних, а також на формування команди з тренування AI, що складається з експертів з різних галузей, для забезпечення моделей якіснішими навчальними даними.
Моделювання навчання зазвичай розділяється на два етапи: попереднє навчання та доопрацювання. Попереднє навчання подібне до процесу, коли дитина вчиться говорити, і потребує великої кількості текстів, кодів та іншої інформації, отриманої з Інтернету. Доопрацювання ж схоже на навчання в школі, де є чіткі правильні та неправильні відповіді та напрямки, і виховання специфічних здібностей моделі відбувається за допомогою ретельно розроблених наборів даних.
Отже, дані AI також можна поділити на дві категорії: перша - це величезні, але не потребують особливої обробки дані, такі як дані з соціальних мереж, дані з веб-скрапінгу кодових репозиторіїв; друга категорія потребує ретельного проектування та відбору, щоб забезпечити розвиток певних якісних характеристик моделі, що вимагає очищення даних, маркування тощо. Ці два типи наборів даних складають основу сектора AI Data.
Зі збільшенням можливостей моделей різні спеціалізовані та детальні тренувальні дані стануть ключовими змінними, які впливають на можливості моделей. Якісні набори даних подібні до безцінних технік майстрів бойових мистецтв, які є критично важливими для підвищення можливостей моделей. У довгостроковій перспективі AI Data також є напрямком, що має ефект снігової кулі: з накопиченням початкової роботи, дані активи будуть генерувати складні відсотки, а їх цінність буде ставати все більш очевидною.
У цьому контексті Web3 DataFi як нова сфера має природні переваги у сфері даних AI:
Смарт-контракти забезпечують суверенітет даних, безпеку та конфіденційність. Користувачі можуть чітко розуміти, як використовуються їхні дані, при цьому захищаючи чутливу інформацію за допомогою технологій, таких як нульові знання.
Розподілена архітектура приваблює найбільш підходящу робочу силу з усього світу. Децентралізований характер блокчейну і прозора система стимулювання можуть залучити робочу силу з усього світу до участі в внесенні даних, що сприяє підвищенню різноманітності даних.
Блокчейн забезпечує чіткі переваги стимулювання та розрахунків. Смарт-контракти можуть реалізувати прозору систему стимулювання, уникаючи проблем, які можуть виникнути в традиційних централізованих компаніях. Водночас, розрахунки на ланцюгу можуть подолати територіальні обмеження, забезпечуючи більш ефективні трансакції між країнами.
Сприяє створенню ефективного та відкритого ринку даних. Децентралізований ринок може забезпечити більш прозоре та ефективне з'єднання між сторонами попиту та пропозиції даних, сприяючи процвітанню екосистеми.
Для звичайних користувачів DataFi є найкращою можливістю для участі в децентралізованих AI проектах. На відміну від високих бар'єрів в майнінгу потужностей або розробці моделей, користувачам потрібно лише виконувати прості завдання, такі як надання даних, оцінка моделей тощо. Це надає звичайним людям можливість скористатися шансом у революції AI.
На сьогоднішній день у сфері Web3 DataFi вже з'явилася низка перспективних проєктів, таких як Sahara AI, Yupp, Vana та інші. Ці проєкти мають свої особливості в питаннях стимулювання користувачів, управління якістю даних тощо. Однак вони також стикаються з деякими спільними викликами, такими як балансування короткострокових вигод і довгострокової якості, підвищення прозорості тощо.
У майбутньому масове застосування DataFi потребує двох напрямків: по-перше, залучення достатньої кількості звичайних користувачів для формування активної сили збирання та генерації даних; по-друге, отримання визнання від провідних компаній, щоб залучити великі замовлення. Деякі провідні проекти вже досягли гарного прогресу в обох напрямках.
В цілому, DataFi представляє собою новий тип взаємодії між людським інтелектом і машинним інтелектом. Завдяки смарт-контрактам, він не лише забезпечує прибуток від людської праці, але й надає живлення для розвитку машинного інтелекту. Для тих, хто сповнений надії на епоху ШІ і дотримується ідеалів блокчейн, DataFi безсумнівно є областю, яка варта уваги та інвестицій.
Ця сторінка може містити контент третіх осіб, який надається виключно в інформаційних цілях (не в якості запевнень/гарантій) і не повинен розглядатися як схвалення його поглядів компанією Gate, а також як фінансова або професійна консультація. Див. Застереження для отримання детальної інформації.
13 лайків
Нагородити
13
4
Поділіться
Прокоментувати
0/400
WhaleWatcher
· 23год тому
мінтинг кількох NFT просто щоб заробити?
Переглянути оригіналвідповісти на0
CodeAuditQueen
· 23год тому
Вразливості безпеки на етапі збору даних є великою загрозою і можуть легко призвести до впровадження брудних даних.
Web3 DataFi може стати новим блакитним океаном у змаганні за дані AI. Блокчейн сприяє монетизації вартості даних.
AI-дані містять величезний потенціал, Web3 DataFi може стати новою блакитною океан.
У сьогоднішньому світі, де глобальні змагання в галузі ШІ стають дедалі жорсткішими, дані поступово стають ключовою перевагою для створення відмінних базових моделей. Оскільки різниця в архітектурі моделей та обчислювальних можливостях поступово зменшується, якісні навчальні дані стануть основним фактором, що визначає конкурентоспроможність компаній у галузі ШІ.
Цього місяця найпомітнішою подією в AI-середовищі стало те, що Meta активно вербує таланти, формуючи провідну команду AI, переважно з китайських науковців. Особливо привертає увагу 28-річний Alexander Wang. Його компанія Scale AI наразі оцінюється в 29 мільярдів доларів США і надає послуги з обробки даних багатьом великим AI-компаніям, включаючи американську армію. Причина, чому Scale AI змогла виділитися серед багатьох юнікорнів, полягає в тому, що вона рано усвідомила важливість даних у AI-індустрії.
Якщо порівняти великий модель з людиною, то модель є тілом, обчислювальна потужність - це їжа, а дані - це знання та інформація. У процесі стрімкого розвитку великих мовних моделей акцент в індустрії змістився з архітектури моделей на обчислювальну потужність, і тепер більшість моделей використовують трансформер як базову структуру. Великі компанії або створюють власні суперкомп'ютерні кластери, або укладають довгострокові угоди з постачальниками хмарних послуг для задоволення базових потреб в обчислювальній потужності. У цьому контексті важливість даних стає дедалі очевиднішою.
На відміну від традиційних компаній з обробки великих даних для бізнесу, Scale AI зосереджується на створенні міцної бази даних для AI-моделей. Її діяльність охоплює не лише видобуток існуючих даних, але й спрямована на довгостроковий бізнес з генерації даних, а також на формування команди з тренування AI, що складається з експертів з різних галузей, для забезпечення моделей якіснішими навчальними даними.
Моделювання навчання зазвичай розділяється на два етапи: попереднє навчання та доопрацювання. Попереднє навчання подібне до процесу, коли дитина вчиться говорити, і потребує великої кількості текстів, кодів та іншої інформації, отриманої з Інтернету. Доопрацювання ж схоже на навчання в школі, де є чіткі правильні та неправильні відповіді та напрямки, і виховання специфічних здібностей моделі відбувається за допомогою ретельно розроблених наборів даних.
Отже, дані AI також можна поділити на дві категорії: перша - це величезні, але не потребують особливої обробки дані, такі як дані з соціальних мереж, дані з веб-скрапінгу кодових репозиторіїв; друга категорія потребує ретельного проектування та відбору, щоб забезпечити розвиток певних якісних характеристик моделі, що вимагає очищення даних, маркування тощо. Ці два типи наборів даних складають основу сектора AI Data.
Зі збільшенням можливостей моделей різні спеціалізовані та детальні тренувальні дані стануть ключовими змінними, які впливають на можливості моделей. Якісні набори даних подібні до безцінних технік майстрів бойових мистецтв, які є критично важливими для підвищення можливостей моделей. У довгостроковій перспективі AI Data також є напрямком, що має ефект снігової кулі: з накопиченням початкової роботи, дані активи будуть генерувати складні відсотки, а їх цінність буде ставати все більш очевидною.
У цьому контексті Web3 DataFi як нова сфера має природні переваги у сфері даних AI:
Смарт-контракти забезпечують суверенітет даних, безпеку та конфіденційність. Користувачі можуть чітко розуміти, як використовуються їхні дані, при цьому захищаючи чутливу інформацію за допомогою технологій, таких як нульові знання.
Розподілена архітектура приваблює найбільш підходящу робочу силу з усього світу. Децентралізований характер блокчейну і прозора система стимулювання можуть залучити робочу силу з усього світу до участі в внесенні даних, що сприяє підвищенню різноманітності даних.
Блокчейн забезпечує чіткі переваги стимулювання та розрахунків. Смарт-контракти можуть реалізувати прозору систему стимулювання, уникаючи проблем, які можуть виникнути в традиційних централізованих компаніях. Водночас, розрахунки на ланцюгу можуть подолати територіальні обмеження, забезпечуючи більш ефективні трансакції між країнами.
Сприяє створенню ефективного та відкритого ринку даних. Децентралізований ринок може забезпечити більш прозоре та ефективне з'єднання між сторонами попиту та пропозиції даних, сприяючи процвітанню екосистеми.
Для звичайних користувачів DataFi є найкращою можливістю для участі в децентралізованих AI проектах. На відміну від високих бар'єрів в майнінгу потужностей або розробці моделей, користувачам потрібно лише виконувати прості завдання, такі як надання даних, оцінка моделей тощо. Це надає звичайним людям можливість скористатися шансом у революції AI.
На сьогоднішній день у сфері Web3 DataFi вже з'явилася низка перспективних проєктів, таких як Sahara AI, Yupp, Vana та інші. Ці проєкти мають свої особливості в питаннях стимулювання користувачів, управління якістю даних тощо. Однак вони також стикаються з деякими спільними викликами, такими як балансування короткострокових вигод і довгострокової якості, підвищення прозорості тощо.
У майбутньому масове застосування DataFi потребує двох напрямків: по-перше, залучення достатньої кількості звичайних користувачів для формування активної сили збирання та генерації даних; по-друге, отримання визнання від провідних компаній, щоб залучити великі замовлення. Деякі провідні проекти вже досягли гарного прогресу в обох напрямках.
В цілому, DataFi представляє собою новий тип взаємодії між людським інтелектом і машинним інтелектом. Завдяки смарт-контрактам, він не лише забезпечує прибуток від людської праці, але й надає живлення для розвитку машинного інтелекту. Для тих, хто сповнений надії на епоху ШІ і дотримується ідеалів блокчейн, DataFi безсумнівно є областю, яка варта уваги та інвестицій.