Công nghệ Web3 và sự phát triển đồng bộ với AI: Khai thác khả năng tính toán và giá trị dữ liệu mới.

AI+Web3: Tháp và Quảng trường

TL;DR

  1. Các dự án Web3 về khái niệm AI trở thành mục tiêu hút vốn trên thị trường sơ cấp và thứ cấp.

  2. Cơ hội của Web3 trong ngành AI thể hiện ở: sử dụng các động lực phân tán để phối hợp nguồn cung tiềm năng trong đuôi dài ------ qua dữ liệu, lưu trữ và tính toán; trong khi đó, xây dựng một mô hình mã nguồn mở cũng như thị trường phi tập trung cho AI Agent.

  3. AI trong ngành Web3 chủ yếu được sử dụng trong tài chính trên chuỗi (thanh toán tiền điện tử, giao dịch, phân tích dữ liệu) và hỗ trợ phát triển.

  4. Tính hữu ích của AI+Web3 được thể hiện ở sự bổ sung của cả hai: Web3 hy vọng có thể chống lại sự tập trung của AI, AI hy vọng có thể giúp Web3 vượt ra ngoài giới hạn.

AI+Web3:Tháp và Quảng trường

Giới thiệu

Trong hai năm qua, sự phát triển của AI như được nhấn nút tăng tốc, cơn gió do Chatgpt khơi mào không chỉ mở ra một thế giới mới của trí tuệ nhân tạo sinh sinh, mà còn tạo nên làn sóng mạnh mẽ tại bờ bên kia của Web3.

Dưới sự hỗ trợ của khái niệm AI, việc huy động vốn trong thị trường tiền điện tử chậm lại đã có sự cải thiện rõ rệt. Các phương tiện truyền thông thống kê, chỉ trong nửa đầu năm 2024, đã có tổng cộng 64 dự án Web3+AI hoàn thành việc huy động vốn, trong đó hệ điều hành dựa trên trí tuệ nhân tạo Zyber365 đã đạt được số tiền huy động cao nhất là 100 triệu đô la Mỹ trong vòng A.

Thị trường thứ cấp ngày càng sôi động, một trang web dữ liệu cho biết, chỉ trong hơn một năm, tổng giá trị thị trường của lĩnh vực AI đã đạt 48,5 tỷ USD, khối lượng giao dịch trong 24 giờ gần 8,6 tỷ USD; sự tiến bộ rõ ràng của công nghệ AI chính thống đã mang lại lợi ích, sau khi công ty nào đó phát hành mô hình chuyển đổi văn bản thành video Sora, giá trung bình của lĩnh vực AI đã tăng 151%; hiệu ứng AI cũng lan tỏa đến một trong những lĩnh vực hút tiền của tiền điện tử là Meme: MemeCoin đầu tiên với khái niệm AI Agent ------ GOAT đã nhanh chóng nổi tiếng và đạt được 1,4 tỷ USD giá trị, thành công tạo ra cơn sốt AI Meme.

Về nghiên cứu và chủ đề AI+Web3 cũng đang rất sôi nổi, từ AI+Depin đến AI Memecoin rồi đến hiện tại là AI Agent và AI DAO, tâm lý FOMO đã không theo kịp tốc độ xoay vòng của những câu chuyện mới.

AI+Web3, sự kết hợp của thuật ngữ đầy tiền nóng, cơn sốt và những ảo tưởng về tương lai này, khó tránh khỏi bị coi như một cuộc hôn nhân do vốn đầu tư sắp đặt, chúng ta dường như rất khó phân biệt dưới lớp áo choàng lộng lẫy này, thực sự là sân khấu của những kẻ đầu cơ, hay là đêm trước của sự bùng nổ?

Để trả lời câu hỏi này, một suy nghĩ quan trọng đối với cả hai bên là liệu có thể tốt hơn với nhau không? Có thể hưởng lợi từ mô hình của nhau không? Trong bài viết này, chúng tôi cũng cố gắng đứng trên vai những người đi trước để xem xét cấu trúc này: Web3 có thể đóng vai trò như thế nào trong tất cả các giai đoạn của công nghệ AI, và AI có thể mang đến điều gì mới mẻ cho Web3?

Phần 1: Cơ hội nào cho Web3 dưới ngăn xếp AI?

Trước khi bắt đầu chủ đề này, chúng ta cần hiểu về công nghệ của mô hình AI lớn:

Diễn đạt toàn bộ quá trình bằng ngôn ngữ đơn giản hơn: "Mô hình lớn" giống như bộ não của con người, trong giai đoạn đầu, bộ não này thuộc về một em bé vừa mới chào đời, cần quan sát và tiếp nhận lượng thông tin khổng lồ từ xung quanh để hiểu thế giới, đó là giai đoạn "thu thập" dữ liệu; do máy tính không có các giác quan như thị giác hay thính giác của con người, trước khi đào tạo, lượng thông tin lớn không được gán nhãn từ bên ngoài cần được "tiền xử lý" để chuyển đổi thành định dạng thông tin mà máy tính có thể hiểu và sử dụng.

Sau khi nhập dữ liệu, AI thông qua "huấn luyện" đã xây dựng một mô hình có khả năng hiểu và dự đoán, có thể được coi là quá trình trẻ em từ từ hiểu và học hỏi về thế giới bên ngoài. Các tham số của mô hình giống như khả năng ngôn ngữ của trẻ em được điều chỉnh liên tục trong quá trình học tập. Khi nội dung học bắt đầu phân chuyên ngành, hoặc nhận được phản hồi và điều chỉnh từ việc giao tiếp với người khác, nó sẽ bước vào giai đoạn "tinh chỉnh" của mô hình lớn.

Trẻ em dần lớn lên và biết nói, sau đó có thể hiểu ý nghĩa và diễn đạt cảm xúc cũng như suy nghĩ của mình trong các cuộc đối thoại mới. Giai đoạn này tương tự như "suy luận" của mô hình AI lớn, mô hình có khả năng dự đoán và phân tích đối với các đầu vào ngôn ngữ và văn bản mới. Trẻ sơ sinh thể hiện cảm xúc, mô tả đối tượng và giải quyết nhiều vấn đề thông qua khả năng ngôn ngữ, điều này cũng tương tự như việc mô hình AI lớn được áp dụng vào các nhiệm vụ cụ thể sau khi hoàn thành đào tạo và đưa vào sử dụng, chẳng hạn như phân loại hình ảnh, nhận diện giọng nói, v.v.

AI Agent thì gần gũi hơn với hình thái tiếp theo của mô hình lớn ------ có khả năng thực hiện nhiệm vụ độc lập và theo đuổi mục tiêu phức tạp, không chỉ có khả năng suy nghĩ mà còn có thể ghi nhớ, lập kế hoạch, và có khả năng sử dụng công cụ để tương tác với thế giới.

Hiện tại, nhằm giải quyết những điểm đau trong các ngăn xếp của AI, Web3 hiện đã hình thành một hệ sinh thái đa tầng, kết nối lẫn nhau, bao gồm các giai đoạn khác nhau của quy trình mô hình AI.

AI+Web3:Tháp và Quảng trường

Một, tầng cơ sở: sức mạnh tính toán và dữ liệu của Airbnb

sức mạnh tính toán

Hiện tại, một trong những chi phí cao nhất của AI là sức mạnh tính toán và năng lượng cần thiết để đào tạo mô hình và suy diễn mô hình.

Một ví dụ là, một mô hình của một công ty cần 16.000 GPU của một mẫu do công ty đó sản xuất (đây là một đơn vị xử lý đồ họa hàng đầu được thiết kế đặc biệt cho các khối lượng công việc trí tuệ nhân tạo và tính toán hiệu năng cao.) để hoàn thành việc đào tạo trong 30 ngày. Giá của phiên bản 80GB dao động từ 30.000 đến 40.000 đô la, điều này yêu cầu đầu tư phần cứng tính toán từ 400 đến 700 triệu đô la (GPU + chip mạng), cùng với đó, việc đào tạo hàng tháng tiêu tốn 1,6 tỷ kilowatt giờ, chi phí năng lượng hàng tháng gần 20 triệu đô la.

Đối với việc giải nén sức mạnh AI, đây cũng chính là lĩnh vực giao thoa sớm nhất giữa Web3 và AI ------ DePin (mạng cơ sở hạ tầng vật lý phi tập trung). Hiện tại, một trang web dữ liệu đã liệt kê hơn 1400 dự án, trong đó các dự án đại diện cho chia sẻ sức mạnh GPU bao gồm io.net, Aethir, Akash, Render Network, v.v.

Logic chính của nó là: nền tảng cho phép cá nhân hoặc tổ chức sở hữu tài nguyên GPU nhàn rỗi đóng góp sức mạnh tính toán của mình theo cách phi tập trung mà không cần giấy phép, thông qua một thị trường trực tuyến cho người mua và người bán tương tự như Uber hoặc Airbnb, nâng cao tỷ lệ sử dụng tài nguyên GPU chưa được sử dụng một cách đầy đủ; đồng thời, cơ chế staking cũng đảm bảo rằng nếu có sự vi phạm cơ chế kiểm soát chất lượng hoặc ngắt kết nối mạng xảy ra, nhà cung cấp tài nguyên sẽ phải chịu hình phạt tương ứng.

Đặc điểm của nó là:

  • Tập hợp tài nguyên GPU nhàn rỗi: Bên cung cấp chủ yếu là các trung tâm dữ liệu độc lập nhỏ và vừa từ bên thứ ba, các nhà khai thác mỏ tiền điện tử với nguồn lực tính toán thừa, phần cứng khai thác theo cơ chế đồng thuận PoS, như máy khai thác FileCoin và ETH. Hiện tại cũng có các dự án cam kết khởi động các thiết bị với ngưỡng tham gia thấp hơn, như exolab sử dụng MacBook, iPhone, iPad và các thiết bị địa phương khác để thiết lập mạng lưới tính toán cho việc suy diễn mô hình lớn.

  • Đối mặt với thị trường dài hạn của sức mạnh tính toán AI:

a. "Về mặt kỹ thuật" thì thị trường sức mạnh tính toán phi tập trung phù hợp hơn cho các bước suy luận. Đào tạo phụ thuộc nhiều hơn vào khả năng xử lý dữ liệu mà GPU quy mô siêu lớn mang lại, trong khi suy luận yêu cầu hiệu suất tính toán GPU tương đối thấp, như Aethir tập trung vào công việc render độ trễ thấp và ứng dụng suy luận AI.

b. "Về phía nhu cầu" thì các bên có nhu cầu tính toán nhỏ sẽ không tự mình huấn luyện mô hình lớn, mà chỉ chọn tối ưu hóa và tinh chỉnh xung quanh một số mô hình lớn hàng đầu, và những tình huống này đều tự nhiên phù hợp với nguồn tài nguyên tính toán nhàn rỗi phân tán.

  • Quyền sở hữu phi tập trung: Ý nghĩa công nghệ của blockchain là các chủ sở hữu tài nguyên luôn giữ quyền kiểm soát đối với tài nguyên, điều chỉnh linh hoạt theo nhu cầu và đồng thời thu được lợi nhuận.

Dữ liệu

Dữ liệu là nền tảng của AI. Nếu không có dữ liệu, tính toán sẽ như bèo trôi, hoàn toàn vô dụng, và mối quan hệ giữa dữ liệu và mô hình giống như câu tục ngữ "Garbage in, Garbage out", số lượng dữ liệu và chất lượng đầu vào quyết định chất lượng đầu ra của mô hình cuối cùng. Đối với việc huấn luyện các mô hình AI hiện nay, dữ liệu quyết định khả năng ngôn ngữ, khả năng hiểu biết, thậm chí cả giá trị và biểu hiện nhân văn của mô hình. Hiện tại, những khó khăn về nhu cầu dữ liệu của AI chủ yếu tập trung vào bốn khía cạnh sau:

  • Tham lam dữ liệu: Việc huấn luyện mô hình AI phụ thuộc vào một lượng lớn dữ liệu đầu vào. Tài liệu công khai cho thấy, một công ty đã huấn luyện một mô hình với số lượng tham số lên tới hàng nghìn tỷ.

  • Chất lượng dữ liệu: Với sự kết hợp của AI và các ngành nghề khác nhau, tính kịp thời của dữ liệu, sự đa dạng của dữ liệu, tính chuyên môn của dữ liệu theo ngành, và việc tiếp nhận các nguồn dữ liệu mới như cảm xúc từ mạng xã hội đã đặt ra những yêu cầu mới đối với chất lượng của nó.

  • Vấn đề quyền riêng tư và tuân thủ: Hiện nay, các quốc gia và doanh nghiệp ngày càng nhận thấy tầm quan trọng của các bộ dữ liệu chất lượng cao, đang áp dụng các hạn chế đối với việc thu thập dữ liệu.

  • Chi phí xử lý dữ liệu cao: Khối lượng dữ liệu lớn, quy trình xử lý phức tạp. Tài liệu công khai cho thấy, hơn 30% chi phí R&D của các công ty AI được sử dụng cho việc thu thập và xử lý dữ liệu cơ bản.

Hiện tại, giải pháp web3 được thể hiện qua bốn khía cạnh sau:

  1. Thu thập dữ liệu: Việc cung cấp miễn phí dữ liệu thực tế được thu thập đang nhanh chóng cạn kiệt, các công ty AI đang chi tiêu ngày càng nhiều cho dữ liệu. Nhưng đồng thời, chi phí này không được chuyển lại cho những người đóng góp thực sự của dữ liệu, mà các nền tảng hoàn toàn hưởng lợi từ giá trị mà dữ liệu mang lại, như một nền tảng đã đạt doanh thu tổng cộng 203 triệu USD thông qua thỏa thuận cấp phép dữ liệu với các công ty AI.

Cho phép những người dùng thực sự đóng góp cũng tham gia vào việc tạo ra giá trị từ dữ liệu, cũng như thu thập dữ liệu cá nhân hơn và có giá trị hơn từ người dùng bằng cách sử dụng mạng phân phối và cơ chế khuyến khích với chi phí thấp, là tầm nhìn của Web3.

  • Grass là một lớp dữ liệu và mạng phi tập trung, người dùng có thể chạy nút Grass, đóng góp băng thông nhàn rỗi và lưu lượng trung chuyển để thu thập dữ liệu thời gian thực từ toàn bộ internet và nhận phần thưởng bằng token;

  • Vana đã giới thiệu một khái niệm độc đáo về bể thanh khoản dữ liệu (DLP), cho phép người dùng tải lên dữ liệu cá nhân của họ (như lịch sử mua sắm, thói quen duyệt web, hoạt động trên mạng xã hội, v.v.) lên DLP cụ thể và linh hoạt chọn xem có cấp quyền cho các bên thứ ba cụ thể sử dụng những dữ liệu này hay không;

  • Trong PublicAI, người dùng có thể sử dụng #AI 或#Web3 làm thẻ phân loại và @PublicAI để thu thập dữ liệu trên một nền tảng nào đó.

  1. Chuẩn bị dữ liệu: Trong quá trình xử lý dữ liệu của AI, do dữ liệu thu thập thường ồn ào và chứa lỗi, nên trước khi đào tạo mô hình, nó phải được làm sạch và chuyển đổi thành định dạng có thể sử dụng, liên quan đến việc chuẩn hóa, lọc và xử lý các giá trị thiếu. Giai đoạn này là một trong số ít những bước thủ công trong ngành AI, đã phát sinh ra ngành nghề người đánh dấu dữ liệu, với yêu cầu về chất lượng dữ liệu của mô hình ngày càng cao, ngưỡng vào nghề của người đánh dấu dữ liệu cũng theo đó mà tăng lên, và nhiệm vụ này một cách tự nhiên phù hợp với cơ chế khuyến khích phi tập trung của Web3.
  • Hiện tại, Grass và OpenLayer đều đang xem xét việc tham gia vào khâu quan trọng là gán nhãn dữ liệu.

  • Synesis đã đưa ra khái niệm "Train2earn", nhấn mạnh chất lượng dữ liệu, người dùng có thể nhận phần thưởng bằng cách cung cấp dữ liệu được gán nhãn, chú thích hoặc các hình thức đầu vào khác.

  • Dự án gán nhãn dữ liệu Sapien đã biến nhiệm vụ gán nhãn thành trò chơi và cho phép người dùng đặt cược điểm để kiếm thêm điểm.

  1. Quyền riêng tư và an ninh dữ liệu: Cần làm rõ rằng quyền riêng tư và an ninh dữ liệu là hai khái niệm khác nhau. Quyền riêng tư dữ liệu liên quan đến việc xử lý dữ liệu nhạy cảm, trong khi an ninh dữ liệu bảo vệ thông tin dữ liệu khỏi việc truy cập, phá hoại và đánh cắp trái phép. Do đó, lợi thế công nghệ quyền riêng tư Web3 và các ứng dụng tiềm năng được thể hiện ở hai khía cạnh: (1) Đào tạo dữ liệu nhạy cảm; (2) Hợp tác dữ liệu: Nhiều chủ sở hữu dữ liệu có thể tham gia cùng nhau vào việc đào tạo AI mà không cần chia sẻ dữ liệu gốc của họ.

Các công nghệ bảo mật phổ biến hiện tại trong Web3 bao gồm:

  • Môi trường thực thi đáng tin cậy ( TEE ), chẳng hạn như Super Protocol;

  • Mã hóa hoàn toàn đồng nhất (FHE), chẳng hạn như BasedAI, Fhenix.io hoặc Inco Network;

  • Công nghệ Zero-Knowledge (zk), như Reclaim Protocol sử dụng công nghệ zkTLS, tạo ra chứng minh Zero-Knowledge cho lưu lượng HTTPS, cho phép người dùng nhập dữ liệu hoạt động, danh tiếng và danh tính từ các trang web bên ngoài một cách an toàn mà không cần tiết lộ thông tin nhạy cảm.

Tuy nhiên, hiện tại lĩnh vực này vẫn ở giai đoạn đầu, hầu hết các dự án vẫn đang trong quá trình khám phá, một trong những khó khăn hiện tại là chi phí tính toán quá cao, một số ví dụ là:

  • Khung zkML EZKL cần khoảng 80 điểm
Xem bản gốc
Trang này có thể chứa nội dung của bên thứ ba, được cung cấp chỉ nhằm mục đích thông tin (không phải là tuyên bố/bảo đảm) và không được coi là sự chứng thực cho quan điểm của Gate hoặc là lời khuyên về tài chính hoặc chuyên môn. Xem Tuyên bố từ chối trách nhiệm để biết chi tiết.
  • Phần thưởng
  • 3
  • Chia sẻ
Bình luận
0/400
shadowy_supercodervip
· 07-28 21:01
Công nghệ nên trao quyền bình đẳng
Xem bản gốcTrả lời0
MEVHuntervip
· 07-28 21:00
Dự đoán táo bạo sẽ rất nổi bật
Xem bản gốcTrả lời0
LightningAllInHerovip
· 07-28 20:39
Song kiếm hợp bích tất thành đại khí
Xem bản gốcTrả lời0
Giao dịch tiền điện tử mọi lúc mọi nơi
qrCode
Quét để tải xuống ứng dụng Gate
Cộng đồng
Tiếng Việt
  • 简体中文
  • English
  • Tiếng Việt
  • 繁體中文
  • Español
  • Русский
  • Français (Afrique)
  • Português (Portugal)
  • Bahasa Indonesia
  • 日本語
  • بالعربية
  • Українська
  • Português (Brasil)