a16z Dẫn đầu Vòng tài trợ hạt giống 33 triệu USD — Cách Yupp Tận dụng Blockchain và Các Động lực để Định nghĩa lại Các Mô hình Đánh giá AI

Trung cấp6/19/2025, 2:54:41 AM
a16z đã dẫn dắt một vòng tài trợ hạt giống trị giá 33 triệu USD. Yupp tái định hình việc đánh giá mô hình AI như thế nào thông qua Blockchain và các cơ chế khuyến khích? Bài viết này chi tiết mô hình đánh giá crowdsourced của nó, hệ thống điểm VIBE, kiến trúc kỹ thuật và tầm nhìn phát triển, khám phá những khả năng mới tại giao điểm của AI và Web3.

Khi các ứng dụng AI thâm nhập vào nhiều ngành công nghiệp, việc đánh giá chính xác hiệu suất mô hình và tăng cường sự tin tưởng của người dùng đã trở thành một vấn đề cấp bách. Các đánh giá truyền thống thường dựa vào các cơ chế tập trung, khiến việc bao quát các kịch bản đa dạng trở nên khó khăn và không phản ánh đúng sở thích thực sự của người dùng; đồng thời, vấn đề "ảo giác" của mô hình thường xảy ra, khiến người dùng thường rơi vào các silo thông tin khi đưa ra lựa chọn.

Trong bối cảnh này, Yupp, như một nền tảng mới, đang cố gắng định hình lại việc khám phá, so sánh và sử dụng các mô hình AI với mô hình crowdsourcing độc đáo và cơ chế khuyến khích của mình, mang lại một sự thay đổi mô hình cho lĩnh vực đánh giá AI. Bài viết này sẽ đi sâu vào các cơ chế cốt lõi của Yupp, những điểm nổi bật về kỹ thuật, bối cảnh đội ngũ và tác động tiềm năng của nó đối với hệ sinh thái AI.

Nền tảng đội ngũ và tài chính: Được hỗ trợ bởi kinh nghiệm từ các gã khổng lồ công nghệ

Yupp tập trung vào việc giải quyết những thách thức đánh giá lâu dài trong lĩnh vực AI, cam kết xây dựng một thị trường phản hồi AI "không tin tưởng"—cho phép phản hồi đa dạng từ người dùng lưu thông tự do dưới sự bảo vệ của blockchain và các động lực kinh tế tiền điện tử, từ đó hình thành một lớp đánh giá mô hình mở rộng, công bằng và minh bạch. Bằng cách khuyến khích việc phân phối dữ liệu được chú thích thủ công chất lượng cao, Yupp có thể nhanh chóng nắm bắt những nhu cầu và sở thích thực sự của người dùng trong các tình huống khác nhau, giúp các nhà phát triển AI tối ưu hóa hiệu suất mô hình theo cách lặp lại.

Dự án được thành lập vào tháng 6 năm 2024 bởi Pankaj Gupta (Người đồng sáng lập và Giám đốc điều hành) và Gilad Mishne (Người đồng sáng lập và Trưởng bộ phận AI), với Nhà khoa học chính Jimmy Lin (Giáo sư tại Đại học Waterloo) cũng tham gia vào đội ngũ cốt lõi. Ba người đã từng làm việc cùng nhau tại Twitter vào năm 2010, nơi họ xây dựng và tối ưu hóa các hệ thống gợi ý và tìm kiếm quy mô lớn, và sau đó đã có kinh nghiệm phong phú tại Google và Coinbase.

Với tầm nhìn về sự phi tập trung và tính minh bạch của giá trị dữ liệu, có thể đáp ứng nhu cầu kép của các nhà sản xuất AI về đánh giá đáng tin cậy và sự tham gia của người dùng, cũng như hưởng lợi từ kinh nghiệm phong phú của đội ngũ cốt lõi, Yupp đã nhận được sự công nhận cao từ những nhân vật nổi tiếng trong ngành công nghệ và các nhà đầu tư mạo hiểm hàng đầu.

Tuần trước, Yupp đã công bố hoàn tất vòng tài trợ hạt giống trị giá 33 triệu đô la, do đối tác A16z Chris Dixon dẫn đầu. Các nhà đầu tư khác bao gồm Nhà khoa học trưởng của Google Jeff Dean, đồng sáng lập Twitter Biz Stone, đồng sáng lập Pinterest Evan Sharp, Giám đốc điều hành Perplexity Aravind Srinivas, Dan Boneh của Đại học Stanford, Chris Re, Nick McKeown, và Balaji Prabhakar, cùng với 45 thiên thần và giám đốc điều hành doanh nghiệp nổi tiếng khác, cũng như Coinbase Ventures.

Các Tính Năng Chính và Trải Nghiệm Người Dùng: Xây Dựng một "Quốc Hội AI"

Là một nền tảng đánh giá AI tập trung, Yupp tuân thủ triết lý "Mỗi AI cho mọi người", cho phép người dùng dễ dàng khám phá, so sánh và sử dụng các mô hình AI mới nhất. Khác với các phản hồi đơn lẻ truyền thống, Yupp trả về các câu trả lời từ hai (hoặc nhiều hơn) mô hình cùng lúc cho mỗi yêu cầu, hình thành một "nghị viện AI". Thiết kế này không chỉ đáp ứng nhu cầu của người dùng về sự lựa chọn đa dạng mà còn xác định hiệu quả các "ảo giác" tiềm năng mà các mô hình có thể sản sinh, giúp người dùng đưa ra quyết định thông minh hơn thông qua việc so sánh. Như CEO của Yupp, Pankaj Gupta đã phát biểu, việc xuất ra song song đặc biệt có lợi cho những người dùng lo lắng về lỗi phát sinh, vì họ có thể xác minh chéo các kết quả.

Nền tảng hiện hỗ trợ hơn 500 mô hình AI, bao gồm các lĩnh vực tạo văn bản và hình ảnh, bao gồm các mô hình nổi tiếng như ChatGPT, Claude, Gemini, DeepSeek, Grok, Llama và nhiều mô hình mới nổi khác. Để tối ưu hóa trải nghiệm hơn nữa, Yupp cũng đã ra mắt tính năng “QuickTake”, có thể tinh chế các phản hồi dài thành một tweet ngắn gọn.

Ngoài ra, Yupp đặt ưu tiên cao cho quyền riêng tư của người dùng: tất cả các bản ghi trò chuyện đều riêng tư theo mặc định trừ khi người dùng chủ động công khai chúng; ngay cả khi được chia sẻ công khai, không có thông tin cá nhân nào được tiết lộ. Người dùng có thể kiểm soát nội dung và phạm vi chia sẻ bất kỳ lúc nào.

Mô hình kinh tế và cơ chế khuyến khích: Đánh giá giá trị lao động dữ liệu

Yupp sẽ sử dụng phản hồi của người dùng miễn phí và đo lường việc sử dụng mô hình thông qua hệ thống "Yupp Points". Người dùng mới nhận 5000 điểm khi đăng ký và có thể kiếm thêm điểm bằng cách chấm điểm phản hồi của mô hình, chọn sở thích và giải thích lý do của mình. Chất lượng phản hồi càng cao, phần thưởng càng lớn, đảm bảo người dùng có thể sử dụng bền vững các mô hình cao cấp như Claude Opus 4 hoặc OpenAI o3 miễn phí. Nền tảng hứa hẹn rằng điểm sẽ chỉ tăng và tất cả các mô hình hiện tại đều có thể được trải nghiệm miễn phí.

Sau mỗi câu hỏi, người dùng sẽ nhận được hai phản hồi mẫu và có thể kiếm "thẻ cào kỹ thuật số" thông qua phản hồi, thưởng điểm Yupp dao động từ 0 đến 250. Mỗi 1000 điểm có thể được đổi lấy 1 đô la, với mức rút tối đa hàng ngày là 10 đô la và mức tối đa hàng tháng là 50 đô la. Điểm có thể được đổi lấy hơn 20 loại tiền tệ, bao gồm đô la và euro, với các đối tác bao gồm Stripe, PayPal và Coinbase. Đồng thời, nền tảng tích hợp Base Ethernet L2 và stablecoin Solana để cung cấp cho người dùng toàn cầu các phần thưởng ngay lập tức, miễn phí phí.

Như Pankaj Gupta đã nói, phản hồi chất lượng cao do người dùng tạo ra có giá trị hơn nhiều cho việc tinh chỉnh mô hình và học tăng cường của các công ty AI so với chính phần thưởng. Mặc dù thu nhập hàng tháng của người dùng có thể chỉ tương đương với vài cốc cà phê, nhưng dữ liệu chú thích trả phí này là rất quan trọng cho sự lặp lại của AI.

Để khuyến khích nhiều người tham gia hơn, Yupp cũng đã thiết lập một phần thưởng giới thiệu: người giới thiệu nhận 5000 điểm, và người được giới thiệu nhận 1000 điểm; hiện tại, người dùng mới đăng ký có thể nhận 5000 điểm, và người được giới thiệu nhận thêm 2500 điểm.

Yupp VIBE Rating: Một Nền Tảng Mới cho Đánh Giá AI

Để giải quyết các vấn đề hiện có về tính minh bạch không đủ trong bảng xếp hạng, thiếu công bằng và quyền truy cập không đồng đều vào dữ liệu đánh giá, Yupp đã ra mắt phiên bản beta của xếp hạng AI và hệ thống đánh giá “Yupp VIBE (Vibe Intelligence Benchmark) Score”. Hệ thống này tổng hợp dữ liệu sở thích được tạo ra bởi người dùng toàn cầu trong các tương tác tự nhiên, nhằm cung cấp kết quả đánh giá mạnh mẽ và đáng tin cậy.

Nguyên tắc đánh giá của Yupp bao gồm:

  • Độ bền: Đảm bảo tính đại diện (bao gồm nhiều kịch bản khác nhau), tính xác thực (phản ánh mối quan tâm của người dùng) và chống gian lận (kháng cự hành vi độc hại);
  • Độ tin cậy: Công bằng và trung lập (không thiên vị vào mô hình), minh bạch và công khai (công bố chi tiết về thuật toán xếp hạng), nghiêm ngặt và khoa học (tuân thủ các tiêu chuẩn đánh giá).

Nền tảng không chỉ thu thập sở thích nhị phân mà còn khuyến khích người dùng chỉ ra những ưu điểm và nhược điểm của các phản hồi (chẳng hạn như "đi thẳng vào vấn đề", "tốc độ nhanh", "phong cách tốt", v.v.), và tiến hành phân tích cụm dựa trên độ tuổi, trình độ giáo dục, nghề nghiệp và thông tin khác của người dùng để cho thấy sự khác biệt về sở thích giữa các nhóm khác nhau.

Về mặt kỹ thuật, Yupp đang khám phá việc sử dụng Blockchain, các nguyên tắc mật mã và chứng minh không kiến thức để đảm bảo rằng quá trình đánh giá công bằng, minh bạch và có thể xác minh. Đồng thời, nền tảng đã hợp tác với các nhà cung cấp dữ liệu AI chuyên nghiệp để hiệu chỉnh người chấm điểm thông qua xác minh lưu trữ và phát hiện chất lượng đa lớp nhằm loại bỏ dữ liệu độc hại.

Bảng xếp hạng gần đây đã được cập nhật, trình bày các điểm VIBE của các mô hình như GPT‑4.5 Preview, Claude Opus 4 và Claude Sonnet 4, cùng với tỷ lệ thắng, tỷ lệ không thích, tốc độ, độ trễ, cửa sổ ngữ cảnh và các chỉ số chi phí.

Lịch sử phát triển và Triển vọng tương lai

Yupp chính thức ra mắt vào ngày 13 tháng 6 năm 2025, sau sáu tháng thử nghiệm nội bộ. Kể từ khi ra mắt, sản phẩm đã liên tục cải tiến:

  • Hỗ trợ đa phương thức: Truy cập các mô hình như Dall‑E, Flux, Stable Diffusion, Luma Photon, Google Imagen 4, v.v., và hỗ trợ người dùng tải lên hình ảnh/PDF để hỏi.
  • Mở rộng phương thức tương tác: Thêm chức năng đầu vào giọng nói và đọc giọng nói;
  • Cập nhật mô hình: Dần dần giới thiệu DeepSeek R1/V3, Mistral Small 3, OpenAI o3-pro, Hermes 3, Amazon Nova Pro v1, Microsoft Phi series, và danh mục "mô hình MAX";
  • Thông tin thời gian thực: Chuyển các yêu cầu truy vấn trực tuyến đến Perplexity và Google Gemini Live, cùng với các trích dẫn có liên kết;
  • Cập nhật thanh toán: Thêm rút tiền qua US PayPal, Venmo và hỗ trợ 24 loại tiền tệ qua PayPal;
  • Chia sẻ Xuất: Hỗ trợ sao chép giữ định dạng, xuất PDF/Văn bản/Markdown và chia sẻ các phản hồi đơn lẻ hoặc toàn bộ cuộc trò chuyện theo nhu cầu;
  • Các hoạt động cộng đồng: Tổ chức các sự kiện như "Thử thách AI Prompt" với giải thưởng lên tới hàng chục nghìn điểm; các tính năng mới như trang hồ sơ cá nhân và tên trò chuyện được tạo bởi AI.

Sứ mệnh của Yupp là "trao quyền cho nhân loại để định hình tương lai của AI." Pankaj Gupta tin rằng sự phát triển của AI cần sự tham gia và đóng góp của mọi người. Thông qua phản hồi AI đa góc nhìn và phản hồi của người dùng, Yupp không chỉ giúp người dùng đưa ra quyết định tốt hơn mà còn cung cấp động lực liên tục cho sự tiến hóa của AI.

Cần lưu ý rằng một trong những đối thủ chính của Yupp là nền tảng đánh giá mô hình AI mở LMArena (trang web:https://lmarena.ai/),Trang web này rất phổ biến trong số các chuyên gia AI, nhưng nền tảng hiện đang ở giai đoạn khám phá thương mại và không cung cấp phần thưởng vật chất trực tiếp hoặc cơ chế khuyến khích điểm cho sự tham gia của người dùng bằng cách tận dụng công nghệ Blockchain.

Tổng thể, Yupp đã mở ra một con đường mới cho đánh giá AI với mô hình crowdsourced, cơ chế khuyến khích và hệ thống đánh giá được thúc đẩy bởi sở thích thực tế của người dùng. Nó không chỉ cung cấp cho người dùng một trải nghiệm tương tác AI miễn phí và đa dạng mà còn chuyển đổi phản hồi của người dùng thành dữ liệu huấn luyện có giá trị cao, thúc đẩy tối ưu hóa liên tục của mô hình. Với một đội ngũ dày dạn kinh nghiệm và sự hỗ trợ từ vốn đầu tư hàng đầu, Yupp được kỳ vọng sẽ đóng vai trò then chốt trong hệ sinh thái AI tương lai, hiện thực hóa tầm nhìn "AI cho mọi người, được định hình bởi mọi người."

Tuy nhiên, đối với Yupp, vừa mới ra mắt, cách để liên tục đảm bảo chất lượng dữ liệu, kháng cự các hành vi gian lận tiềm ẩn dưới sự tham gia của một lượng lớn người dùng, và tìm kiếm sự cân bằng giữa thương mại hóa và động lực cho người dùng vẫn sẽ là một hướng cần được khám phá và tối ưu hóa trong sự phát triển tương lai của nó.

Tuyên bố:

  1. Bài viết này được đăng lại từ [PANews] Bản quyền thuộc về tác giả gốc [Thâm Quyến] Nếu có bất kỳ phản đối nào đối với việc tái bản, vui lòng liên hệ Đội ngũ Gate LearnNhóm sẽ xử lý nó nhanh nhất có thể theo các quy trình liên quan.
  2. Tuyên bố: Quan điểm và ý kiến được trình bày trong bài viết này hoàn toàn là của tác giả và không cấu thành bất kỳ lời khuyên đầu tư nào.
  3. Các phiên bản ngôn ngữ khác của bài viết được dịch bởi đội ngũ Gate Learn, trừ khi có thông báo khác.GateTrong những trường hợp như vậy, việc sao chép, phát tán hoặc đạo văn các bài viết đã được dịch là bị cấm.

a16z Dẫn đầu Vòng tài trợ hạt giống 33 triệu USD — Cách Yupp Tận dụng Blockchain và Các Động lực để Định nghĩa lại Các Mô hình Đánh giá AI

Trung cấp6/19/2025, 2:54:41 AM
a16z đã dẫn dắt một vòng tài trợ hạt giống trị giá 33 triệu USD. Yupp tái định hình việc đánh giá mô hình AI như thế nào thông qua Blockchain và các cơ chế khuyến khích? Bài viết này chi tiết mô hình đánh giá crowdsourced của nó, hệ thống điểm VIBE, kiến trúc kỹ thuật và tầm nhìn phát triển, khám phá những khả năng mới tại giao điểm của AI và Web3.

Khi các ứng dụng AI thâm nhập vào nhiều ngành công nghiệp, việc đánh giá chính xác hiệu suất mô hình và tăng cường sự tin tưởng của người dùng đã trở thành một vấn đề cấp bách. Các đánh giá truyền thống thường dựa vào các cơ chế tập trung, khiến việc bao quát các kịch bản đa dạng trở nên khó khăn và không phản ánh đúng sở thích thực sự của người dùng; đồng thời, vấn đề "ảo giác" của mô hình thường xảy ra, khiến người dùng thường rơi vào các silo thông tin khi đưa ra lựa chọn.

Trong bối cảnh này, Yupp, như một nền tảng mới, đang cố gắng định hình lại việc khám phá, so sánh và sử dụng các mô hình AI với mô hình crowdsourcing độc đáo và cơ chế khuyến khích của mình, mang lại một sự thay đổi mô hình cho lĩnh vực đánh giá AI. Bài viết này sẽ đi sâu vào các cơ chế cốt lõi của Yupp, những điểm nổi bật về kỹ thuật, bối cảnh đội ngũ và tác động tiềm năng của nó đối với hệ sinh thái AI.

Nền tảng đội ngũ và tài chính: Được hỗ trợ bởi kinh nghiệm từ các gã khổng lồ công nghệ

Yupp tập trung vào việc giải quyết những thách thức đánh giá lâu dài trong lĩnh vực AI, cam kết xây dựng một thị trường phản hồi AI "không tin tưởng"—cho phép phản hồi đa dạng từ người dùng lưu thông tự do dưới sự bảo vệ của blockchain và các động lực kinh tế tiền điện tử, từ đó hình thành một lớp đánh giá mô hình mở rộng, công bằng và minh bạch. Bằng cách khuyến khích việc phân phối dữ liệu được chú thích thủ công chất lượng cao, Yupp có thể nhanh chóng nắm bắt những nhu cầu và sở thích thực sự của người dùng trong các tình huống khác nhau, giúp các nhà phát triển AI tối ưu hóa hiệu suất mô hình theo cách lặp lại.

Dự án được thành lập vào tháng 6 năm 2024 bởi Pankaj Gupta (Người đồng sáng lập và Giám đốc điều hành) và Gilad Mishne (Người đồng sáng lập và Trưởng bộ phận AI), với Nhà khoa học chính Jimmy Lin (Giáo sư tại Đại học Waterloo) cũng tham gia vào đội ngũ cốt lõi. Ba người đã từng làm việc cùng nhau tại Twitter vào năm 2010, nơi họ xây dựng và tối ưu hóa các hệ thống gợi ý và tìm kiếm quy mô lớn, và sau đó đã có kinh nghiệm phong phú tại Google và Coinbase.

Với tầm nhìn về sự phi tập trung và tính minh bạch của giá trị dữ liệu, có thể đáp ứng nhu cầu kép của các nhà sản xuất AI về đánh giá đáng tin cậy và sự tham gia của người dùng, cũng như hưởng lợi từ kinh nghiệm phong phú của đội ngũ cốt lõi, Yupp đã nhận được sự công nhận cao từ những nhân vật nổi tiếng trong ngành công nghệ và các nhà đầu tư mạo hiểm hàng đầu.

Tuần trước, Yupp đã công bố hoàn tất vòng tài trợ hạt giống trị giá 33 triệu đô la, do đối tác A16z Chris Dixon dẫn đầu. Các nhà đầu tư khác bao gồm Nhà khoa học trưởng của Google Jeff Dean, đồng sáng lập Twitter Biz Stone, đồng sáng lập Pinterest Evan Sharp, Giám đốc điều hành Perplexity Aravind Srinivas, Dan Boneh của Đại học Stanford, Chris Re, Nick McKeown, và Balaji Prabhakar, cùng với 45 thiên thần và giám đốc điều hành doanh nghiệp nổi tiếng khác, cũng như Coinbase Ventures.

Các Tính Năng Chính và Trải Nghiệm Người Dùng: Xây Dựng một "Quốc Hội AI"

Là một nền tảng đánh giá AI tập trung, Yupp tuân thủ triết lý "Mỗi AI cho mọi người", cho phép người dùng dễ dàng khám phá, so sánh và sử dụng các mô hình AI mới nhất. Khác với các phản hồi đơn lẻ truyền thống, Yupp trả về các câu trả lời từ hai (hoặc nhiều hơn) mô hình cùng lúc cho mỗi yêu cầu, hình thành một "nghị viện AI". Thiết kế này không chỉ đáp ứng nhu cầu của người dùng về sự lựa chọn đa dạng mà còn xác định hiệu quả các "ảo giác" tiềm năng mà các mô hình có thể sản sinh, giúp người dùng đưa ra quyết định thông minh hơn thông qua việc so sánh. Như CEO của Yupp, Pankaj Gupta đã phát biểu, việc xuất ra song song đặc biệt có lợi cho những người dùng lo lắng về lỗi phát sinh, vì họ có thể xác minh chéo các kết quả.

Nền tảng hiện hỗ trợ hơn 500 mô hình AI, bao gồm các lĩnh vực tạo văn bản và hình ảnh, bao gồm các mô hình nổi tiếng như ChatGPT, Claude, Gemini, DeepSeek, Grok, Llama và nhiều mô hình mới nổi khác. Để tối ưu hóa trải nghiệm hơn nữa, Yupp cũng đã ra mắt tính năng “QuickTake”, có thể tinh chế các phản hồi dài thành một tweet ngắn gọn.

Ngoài ra, Yupp đặt ưu tiên cao cho quyền riêng tư của người dùng: tất cả các bản ghi trò chuyện đều riêng tư theo mặc định trừ khi người dùng chủ động công khai chúng; ngay cả khi được chia sẻ công khai, không có thông tin cá nhân nào được tiết lộ. Người dùng có thể kiểm soát nội dung và phạm vi chia sẻ bất kỳ lúc nào.

Mô hình kinh tế và cơ chế khuyến khích: Đánh giá giá trị lao động dữ liệu

Yupp sẽ sử dụng phản hồi của người dùng miễn phí và đo lường việc sử dụng mô hình thông qua hệ thống "Yupp Points". Người dùng mới nhận 5000 điểm khi đăng ký và có thể kiếm thêm điểm bằng cách chấm điểm phản hồi của mô hình, chọn sở thích và giải thích lý do của mình. Chất lượng phản hồi càng cao, phần thưởng càng lớn, đảm bảo người dùng có thể sử dụng bền vững các mô hình cao cấp như Claude Opus 4 hoặc OpenAI o3 miễn phí. Nền tảng hứa hẹn rằng điểm sẽ chỉ tăng và tất cả các mô hình hiện tại đều có thể được trải nghiệm miễn phí.

Sau mỗi câu hỏi, người dùng sẽ nhận được hai phản hồi mẫu và có thể kiếm "thẻ cào kỹ thuật số" thông qua phản hồi, thưởng điểm Yupp dao động từ 0 đến 250. Mỗi 1000 điểm có thể được đổi lấy 1 đô la, với mức rút tối đa hàng ngày là 10 đô la và mức tối đa hàng tháng là 50 đô la. Điểm có thể được đổi lấy hơn 20 loại tiền tệ, bao gồm đô la và euro, với các đối tác bao gồm Stripe, PayPal và Coinbase. Đồng thời, nền tảng tích hợp Base Ethernet L2 và stablecoin Solana để cung cấp cho người dùng toàn cầu các phần thưởng ngay lập tức, miễn phí phí.

Như Pankaj Gupta đã nói, phản hồi chất lượng cao do người dùng tạo ra có giá trị hơn nhiều cho việc tinh chỉnh mô hình và học tăng cường của các công ty AI so với chính phần thưởng. Mặc dù thu nhập hàng tháng của người dùng có thể chỉ tương đương với vài cốc cà phê, nhưng dữ liệu chú thích trả phí này là rất quan trọng cho sự lặp lại của AI.

Để khuyến khích nhiều người tham gia hơn, Yupp cũng đã thiết lập một phần thưởng giới thiệu: người giới thiệu nhận 5000 điểm, và người được giới thiệu nhận 1000 điểm; hiện tại, người dùng mới đăng ký có thể nhận 5000 điểm, và người được giới thiệu nhận thêm 2500 điểm.

Yupp VIBE Rating: Một Nền Tảng Mới cho Đánh Giá AI

Để giải quyết các vấn đề hiện có về tính minh bạch không đủ trong bảng xếp hạng, thiếu công bằng và quyền truy cập không đồng đều vào dữ liệu đánh giá, Yupp đã ra mắt phiên bản beta của xếp hạng AI và hệ thống đánh giá “Yupp VIBE (Vibe Intelligence Benchmark) Score”. Hệ thống này tổng hợp dữ liệu sở thích được tạo ra bởi người dùng toàn cầu trong các tương tác tự nhiên, nhằm cung cấp kết quả đánh giá mạnh mẽ và đáng tin cậy.

Nguyên tắc đánh giá của Yupp bao gồm:

  • Độ bền: Đảm bảo tính đại diện (bao gồm nhiều kịch bản khác nhau), tính xác thực (phản ánh mối quan tâm của người dùng) và chống gian lận (kháng cự hành vi độc hại);
  • Độ tin cậy: Công bằng và trung lập (không thiên vị vào mô hình), minh bạch và công khai (công bố chi tiết về thuật toán xếp hạng), nghiêm ngặt và khoa học (tuân thủ các tiêu chuẩn đánh giá).

Nền tảng không chỉ thu thập sở thích nhị phân mà còn khuyến khích người dùng chỉ ra những ưu điểm và nhược điểm của các phản hồi (chẳng hạn như "đi thẳng vào vấn đề", "tốc độ nhanh", "phong cách tốt", v.v.), và tiến hành phân tích cụm dựa trên độ tuổi, trình độ giáo dục, nghề nghiệp và thông tin khác của người dùng để cho thấy sự khác biệt về sở thích giữa các nhóm khác nhau.

Về mặt kỹ thuật, Yupp đang khám phá việc sử dụng Blockchain, các nguyên tắc mật mã và chứng minh không kiến thức để đảm bảo rằng quá trình đánh giá công bằng, minh bạch và có thể xác minh. Đồng thời, nền tảng đã hợp tác với các nhà cung cấp dữ liệu AI chuyên nghiệp để hiệu chỉnh người chấm điểm thông qua xác minh lưu trữ và phát hiện chất lượng đa lớp nhằm loại bỏ dữ liệu độc hại.

Bảng xếp hạng gần đây đã được cập nhật, trình bày các điểm VIBE của các mô hình như GPT‑4.5 Preview, Claude Opus 4 và Claude Sonnet 4, cùng với tỷ lệ thắng, tỷ lệ không thích, tốc độ, độ trễ, cửa sổ ngữ cảnh và các chỉ số chi phí.

Lịch sử phát triển và Triển vọng tương lai

Yupp chính thức ra mắt vào ngày 13 tháng 6 năm 2025, sau sáu tháng thử nghiệm nội bộ. Kể từ khi ra mắt, sản phẩm đã liên tục cải tiến:

  • Hỗ trợ đa phương thức: Truy cập các mô hình như Dall‑E, Flux, Stable Diffusion, Luma Photon, Google Imagen 4, v.v., và hỗ trợ người dùng tải lên hình ảnh/PDF để hỏi.
  • Mở rộng phương thức tương tác: Thêm chức năng đầu vào giọng nói và đọc giọng nói;
  • Cập nhật mô hình: Dần dần giới thiệu DeepSeek R1/V3, Mistral Small 3, OpenAI o3-pro, Hermes 3, Amazon Nova Pro v1, Microsoft Phi series, và danh mục "mô hình MAX";
  • Thông tin thời gian thực: Chuyển các yêu cầu truy vấn trực tuyến đến Perplexity và Google Gemini Live, cùng với các trích dẫn có liên kết;
  • Cập nhật thanh toán: Thêm rút tiền qua US PayPal, Venmo và hỗ trợ 24 loại tiền tệ qua PayPal;
  • Chia sẻ Xuất: Hỗ trợ sao chép giữ định dạng, xuất PDF/Văn bản/Markdown và chia sẻ các phản hồi đơn lẻ hoặc toàn bộ cuộc trò chuyện theo nhu cầu;
  • Các hoạt động cộng đồng: Tổ chức các sự kiện như "Thử thách AI Prompt" với giải thưởng lên tới hàng chục nghìn điểm; các tính năng mới như trang hồ sơ cá nhân và tên trò chuyện được tạo bởi AI.

Sứ mệnh của Yupp là "trao quyền cho nhân loại để định hình tương lai của AI." Pankaj Gupta tin rằng sự phát triển của AI cần sự tham gia và đóng góp của mọi người. Thông qua phản hồi AI đa góc nhìn và phản hồi của người dùng, Yupp không chỉ giúp người dùng đưa ra quyết định tốt hơn mà còn cung cấp động lực liên tục cho sự tiến hóa của AI.

Cần lưu ý rằng một trong những đối thủ chính của Yupp là nền tảng đánh giá mô hình AI mở LMArena (trang web:https://lmarena.ai/),Trang web này rất phổ biến trong số các chuyên gia AI, nhưng nền tảng hiện đang ở giai đoạn khám phá thương mại và không cung cấp phần thưởng vật chất trực tiếp hoặc cơ chế khuyến khích điểm cho sự tham gia của người dùng bằng cách tận dụng công nghệ Blockchain.

Tổng thể, Yupp đã mở ra một con đường mới cho đánh giá AI với mô hình crowdsourced, cơ chế khuyến khích và hệ thống đánh giá được thúc đẩy bởi sở thích thực tế của người dùng. Nó không chỉ cung cấp cho người dùng một trải nghiệm tương tác AI miễn phí và đa dạng mà còn chuyển đổi phản hồi của người dùng thành dữ liệu huấn luyện có giá trị cao, thúc đẩy tối ưu hóa liên tục của mô hình. Với một đội ngũ dày dạn kinh nghiệm và sự hỗ trợ từ vốn đầu tư hàng đầu, Yupp được kỳ vọng sẽ đóng vai trò then chốt trong hệ sinh thái AI tương lai, hiện thực hóa tầm nhìn "AI cho mọi người, được định hình bởi mọi người."

Tuy nhiên, đối với Yupp, vừa mới ra mắt, cách để liên tục đảm bảo chất lượng dữ liệu, kháng cự các hành vi gian lận tiềm ẩn dưới sự tham gia của một lượng lớn người dùng, và tìm kiếm sự cân bằng giữa thương mại hóa và động lực cho người dùng vẫn sẽ là một hướng cần được khám phá và tối ưu hóa trong sự phát triển tương lai của nó.

Tuyên bố:

  1. Bài viết này được đăng lại từ [PANews] Bản quyền thuộc về tác giả gốc [Thâm Quyến] Nếu có bất kỳ phản đối nào đối với việc tái bản, vui lòng liên hệ Đội ngũ Gate LearnNhóm sẽ xử lý nó nhanh nhất có thể theo các quy trình liên quan.
  2. Tuyên bố: Quan điểm và ý kiến được trình bày trong bài viết này hoàn toàn là của tác giả và không cấu thành bất kỳ lời khuyên đầu tư nào.
  3. Các phiên bản ngôn ngữ khác của bài viết được dịch bởi đội ngũ Gate Learn, trừ khi có thông báo khác.GateTrong những trường hợp như vậy, việc sao chép, phát tán hoặc đạo văn các bài viết đã được dịch là bị cấm.
Bắt đầu giao dịch
Đăng ký và giao dịch để nhận phần thưởng USDTEST trị giá
$100
$5500