مع انتشار تطبيقات الذكاء الاصطناعي في مختلف الصناعات، أصبح تقييم أداء النماذج بدقة وتعزيز ثقة المستخدمين قضية ملحة. غالبًا ما تعتمد التقييمات التقليدية على آليات مركزية، مما يجعل من الصعب تغطية سيناريوهات متنوعة ويفشل في عكس تفضيلات المستخدمين الحقيقية؛ في الوقت نفسه، تظهر مشكلة "الهلاوس" في النماذج بشكل متكرر، مما يتسبب في دخول المستخدمين غالبًا في صوامع المعلومات عند اتخاذ الخيارات.
في هذا السياق، تحاول Yupp، كمنصة جديدة، إعادة تشكيل اكتشاف ومقارنة واستخدام نماذج الذكاء الاصطناعي من خلال نموذجها الفريد في جمع المعلومات والحوافز، مما يجلب تحولاً جذرياً في مجال تقييم الذكاء الاصطناعي. ستتناول هذه المقالة الآليات الأساسية لـ Yupp، والميزات التقنية، وخلفية الفريق، وتأثيرها المحتمل على نظام الذكاء الاصطناعي.
Yupp تركز على حل التحديات المستمرة في مجال الذكاء الاصطناعي، مكرسة لبناء سوق ملاحظات "موثوق" للذكاء الاصطناعي - مما يسمح بتداول ملاحظات المستخدمين المتنوعة بحرية تحت حماية البلوكتشين وحوافز الاقتصاد الرقمي، وبالتالي تشكيل طبقة تقييم نماذج قابلة للتوسع وعادلة وشفافة. من خلال تحفيز توزيع بيانات موسومة يدويًا عالية الجودة، يمكن لـ Yupp أن تلتقط بسرعة الاحتياجات والتفضيلات الحقيقية للمستخدمين في سيناريوهات مختلفة، مما يساعد مطوري الذكاء الاصطناعي على تحسين أداء النماذج بطريقة تكرارية.
تم تأسيس المشروع في يونيو 2024 بواسطة بانكاج غوبتا (المؤسس المشارك والرئيس التنفيذي) وجيلاد ميشني (المؤسس المشارك ورئيس الذكاء الاصطناعي)، مع مشاركة كبير العلماء جيمي لين (أستاذ في جامعة واترلو) أيضًا في الفريق الأساسي. لقد عمل الثلاثة معًا سابقًا في تويتر في عام 2010، حيث قاموا ببناء وتحسين أنظمة التوصيات والبحث على نطاق واسع، وحصلوا لاحقًا على خبرة واسعة في جوجل وكوينباس.
نظرًا لرؤيتها في اللامركزية وشفافية قيمة البيانات، والتي يمكن أن تلبي المطالب المزدوجة لمصنعي الذكاء الاصطناعي للتقييم الموثوق والمشاركة من قبل المستخدمين، فضلاً عن الاستفادة من الخبرة الغنية لفريقها الأساسي، حصلت Yupp على اعتراف عالٍ من شخصيات معروفة في صناعة التكنولوجيا وأفضل المستثمرين المغامرين.
الأسبوع الماضي، أعلنت Yupp عن إكمال جولة أولية للتمويل بقيمة 33 مليون دولار، بقيادة شريك A16z كريس ديكسون. تشمل المستثمرين الآخرين كبير علماء جوجل جيف دين، وشارك مؤسس تويتر بيز ستون، ومؤسس بينتيريست إيفان شارب، ومدير عام Perplexity أرافيند سرينيفاس، ودان بونه من جامعة ستانفورد، وكريس ري، ونيك مكيوون، وبالاجي برا بهكار، من بين 45 من الملائكة التنفيذيين المعروفين والشركات، بالإضافة إلى Coinbase Ventures.
كمنصة تقييم AI مركزية، يلتزم Yupp بفلسفة "كل AI للجميع"، مما يسمح للمستخدمين باكتشاف ومقارنة واستخدام أحدث نماذج AI بسهولة. على عكس الاستجابات الفردية التقليدية، يعود Yupp بالإجابات من نموذجين (أو حتى أكثر) في الوقت نفسه لكل طلب، مما يشكل "برلمان AI". لا يلبي هذا التصميم فقط مطالب المستخدمين للاختيارات المتنوعة بل يحدد أيضًا بشكل فعال "الهلاوس" المحتملة التي قد تنتجها النماذج، مما يساعد المستخدمين على اتخاذ قرارات أكثر إطلاعًا من خلال المقارنة. كما ذكر الرئيس التنفيذي لشركة Yupp بانكاج غوبتا، فإن المخرجات المتجاورة مفيدة بشكل خاص للمستخدمين القلقين بشأن أخطاء التوليد، حيث يمكنهم التحقق المتبادل من النتائج.
المنصة تدعم الآن أكثر من 500 نموذج ذكاء اصطناعي، تغطي مجالات توليد النصوص والصور، بما في ذلك نماذج معروفة مثل ChatGPT وClaude وGemini وDeepSeek وGrok وLlama والعديد من النماذج الناشئة. ولتحسين التجربة بشكل أكبر، أطلقت Yupp أيضًا ميزة "QuickTake"، التي يمكن أن تختصر الردود الطويلة إلى تغريدة مختصرة.
بالإضافة إلى ذلك، تعطي Yupp أولوية عالية لخصوصية المستخدم: جميع سجلات الدردشة خاصة بشكل افتراضي ما لم يقم المستخدم بجعلها عامة؛ حتى عند مشاركتها علنًا، لا يتم الكشف عن أي معلومات شخصية. يمكن للمستخدمين التحكم في محتوى ونطاق المشاركة في أي وقت.
ستستخدم Yupp تعليقات المستخدمين مجانًا وقياس استخدام النموذج من خلال نظام "نقاط Yupp". يتلقى المستخدمون الجدد 5000 نقطة عند التسجيل، ويمكنهم كسب المزيد من النقاط من خلال تقييم ردود النموذج، واختيار التفضيلات، وشرح أسبابهم. كلما كانت جودة التعليقات أعلى، كانت المكافآت أكبر، مما يضمن أن المستخدمين يمكنهم استخدام نماذج عالية الجودة مثل Claude Opus 4 أو OpenAI o3 مجانًا بشكل مستدام. تعد المنصة بأن النقاط ستزداد فقط وأن جميع النماذج الحالية يمكن تجربتها مجانًا.
بعد كل سؤال، سيحصل المستخدمون على ردين نموذجيين ويمكنهم كسب "بطاقة خدش رقمية" من خلال التعليقات، مما يكافئ نقاط Yupp تتراوح من 0 إلى 250. يمكن استبدال كل 1000 نقطة بدولار واحد، مع حد أقصى للسحب اليومي يبلغ 10 دولارات وحد أقصى شهري يبلغ 50 دولارًا. يمكن استبدال النقاط بأكثر من 20 عملة، بما في ذلك الدولار واليورو، مع شركاء مثل Stripe وPayPal وCoinbase. في الوقت نفسه، يقوم النظام الأساسي بدمج Base Ethernet L2 وStablecoins من Solana لتقديم مكافآت فورية خالية من الرسوم للمستخدمين في جميع أنحاء العالم.
كما قال بانكاج غوبتا، فإن التعليقات عالية الجودة التي ينتجها المستخدمون أكثر قيمة بكثير لتعديل نموذج الشركات العاملة في مجال الذكاء الاصطناعي والتعلم المعزز من المكافآت نفسها. على الرغم من أن أرباح المستخدمين الشهرية قد تعادل فقط بضع أكواب من القهوة، إلا أن بيانات التعليق المدفوعة هذه ضرورية لتكرار الذكاء الاصطناعي.
لتشجيع المزيد من الناس على المشاركة، أنشأت Yupp أيضًا مكافأة إحالة: يحصل المحيل على 5000 نقطة، ويحصل الشخص المُحال على 1000 نقطة؛ حاليًا، يمكن للمستخدمين الجدد المسجلين الحصول على 5000 نقطة، ويحصل الشخص المُحال على 2500 نقطة إضافية.
للتعامل مع القضايا الحالية المتعلقة بعدم كفاية الشفافية في التصنيفات، ونقص العدالة، وعدم التساوي في الوصول إلى بيانات التقييم، أطلقت Yupp نسخة تجريبية من تصنيف الذكاء الاصطناعي ونظام تصنيف "Yupp VIBE (مؤشر ذكاء الفيب)". يجمع هذا النظام بيانات التفضيل التي ينتجها المستخدمون العالميون في تفاعلات طبيعية، بهدف تقديم نتائج تقييم قوية وموثوقة.
تشمل مبادئ تقييم يوب:
تجمع المنصة ليس فقط التفضيلات الثنائية ولكنها تشجع أيضًا المستخدمين على الإشارة إلى مزايا وعيوب الردود (مثل "مباشر"، "سرعة عالية"، "أسلوب جيد"، وما إلى ذلك)، وتقوم بتحليل المجموعات بناءً على عمر المستخدمين، والتعليم، والمهنة، ومعلومات أخرى لتظهر الفروق في التفضيلات بين المجموعات المختلفة.
على المستوى التقني، تستكشف Yupp استخدام البلوكتشين، والبدائية التشفيرية، وإثباتات المعرفة الصفرية لضمان أن عملية التقييم عادلة وشفافة وقابلة للتحقق. في الوقت نفسه، قامت المنصة بالشراكة مع مزودي بيانات الذكاء الاصطناعي المحترفين لمعيرة المقيمين من خلال التحقق الأثري والكشف عن الجودة متعدد الطبقات للقضاء على البيانات الضارة.
تم تحديث قائمة المتصدرين الأخيرة، حيث تعرض درجات VIBE لنماذج مثل GPT‑4.5 Preview وClaude Opus 4 وClaude Sonnet 4، بالإضافة إلى معدلات فوزها، ومعدلات عدم الإعجاب، والسرعة، والكمون، ونافذة السياق، ومقاييس التكلفة.
تم إطلاق Yupp رسميًا في 13 يونيو 2025، بعد ستة أشهر من الاختبارات الداخلية. منذ إطلاقه، تم تحسين المنتج باستمرار:
تتمثل مهمة يوب في "تمكين الإنسانية من تشكيل مستقبل الذكاء الاصطناعي". يعتقد بانكاج غوبتا أن تطوير الذكاء الاصطناعي يتطلب مشاركة ومساهمة الجميع. من خلال استجابات الذكاء الاصطناعي متعددة الزوايا وتعليقات المستخدمين، لا يساعد يوب المستخدمين فقط في اتخاذ قرارات أفضل، بل يوفر أيضًا قوة دافعة مستمرة لتطور الذكاء الاصطناعي.
من الجدير بالذكر أن أحد المنافسين الرئيسيين لـ Yupp هو منصة تقييم نماذج الذكاء الاصطناعي المفتوحة LMArena (الموقع الإلكتروني:https://lmarena.ai/),يحظى موقع الويب بشعبية كبيرة بين محترفي الذكاء الاصطناعي ، لكن المنصة حاليا في مرحلة الاستكشاف التجاري ولا تقدم مكافآت مادية مباشرة أو آليات حوافز للنقاط لمشاركة المستخدم من خلال الاستفادة من تقنية Blockchain.
بشكل عام، فتحت Yupp طريقًا جديدًا لتقييم الذكاء الاصطناعي من خلال نموذجها المعتمد على الحشود، وآلية الحوافز، ونظام التقييم المدفوع بتفضيلات المستخدمين الحقيقيين. لا تقدم فقط للمستخدمين تجربة تفاعلية مجانية ومتنوعة للذكاء الاصطناعي، بل تحول أيضًا ملاحظات المستخدمين إلى بيانات تدريب عالية القيمة، مما يعزز التحسين المستمر للنموذج. مع فريق ذو خبرة ودعم من رأس المال من الدرجة الأولى، من المتوقع أن تلعب Yupp دورًا رئيسيًا في نظام الذكاء الاصطناعي المستقبلي، محققة رؤية "الذكاء الاصطناعي للجميع، بتشكيل من الجميع."
ومع ذلك، فإن Yupp، التي تم إطلاقها للتو، تحتاج إلى استكشاف وتحسين كيفية ضمان جودة البيانات باستمرار، ومقاومة السلوكيات الغش المحتملة تحت مشاركة عدد كبير من المستخدمين، وتحقيق التوازن بين التجارية والحوافز الموجهة للمستخدمين، وذلك سيكون اتجاهًا يحتاج إلى استكشاف وتحسين في تطورها المستقبلي.
مع انتشار تطبيقات الذكاء الاصطناعي في مختلف الصناعات، أصبح تقييم أداء النماذج بدقة وتعزيز ثقة المستخدمين قضية ملحة. غالبًا ما تعتمد التقييمات التقليدية على آليات مركزية، مما يجعل من الصعب تغطية سيناريوهات متنوعة ويفشل في عكس تفضيلات المستخدمين الحقيقية؛ في الوقت نفسه، تظهر مشكلة "الهلاوس" في النماذج بشكل متكرر، مما يتسبب في دخول المستخدمين غالبًا في صوامع المعلومات عند اتخاذ الخيارات.
في هذا السياق، تحاول Yupp، كمنصة جديدة، إعادة تشكيل اكتشاف ومقارنة واستخدام نماذج الذكاء الاصطناعي من خلال نموذجها الفريد في جمع المعلومات والحوافز، مما يجلب تحولاً جذرياً في مجال تقييم الذكاء الاصطناعي. ستتناول هذه المقالة الآليات الأساسية لـ Yupp، والميزات التقنية، وخلفية الفريق، وتأثيرها المحتمل على نظام الذكاء الاصطناعي.
Yupp تركز على حل التحديات المستمرة في مجال الذكاء الاصطناعي، مكرسة لبناء سوق ملاحظات "موثوق" للذكاء الاصطناعي - مما يسمح بتداول ملاحظات المستخدمين المتنوعة بحرية تحت حماية البلوكتشين وحوافز الاقتصاد الرقمي، وبالتالي تشكيل طبقة تقييم نماذج قابلة للتوسع وعادلة وشفافة. من خلال تحفيز توزيع بيانات موسومة يدويًا عالية الجودة، يمكن لـ Yupp أن تلتقط بسرعة الاحتياجات والتفضيلات الحقيقية للمستخدمين في سيناريوهات مختلفة، مما يساعد مطوري الذكاء الاصطناعي على تحسين أداء النماذج بطريقة تكرارية.
تم تأسيس المشروع في يونيو 2024 بواسطة بانكاج غوبتا (المؤسس المشارك والرئيس التنفيذي) وجيلاد ميشني (المؤسس المشارك ورئيس الذكاء الاصطناعي)، مع مشاركة كبير العلماء جيمي لين (أستاذ في جامعة واترلو) أيضًا في الفريق الأساسي. لقد عمل الثلاثة معًا سابقًا في تويتر في عام 2010، حيث قاموا ببناء وتحسين أنظمة التوصيات والبحث على نطاق واسع، وحصلوا لاحقًا على خبرة واسعة في جوجل وكوينباس.
نظرًا لرؤيتها في اللامركزية وشفافية قيمة البيانات، والتي يمكن أن تلبي المطالب المزدوجة لمصنعي الذكاء الاصطناعي للتقييم الموثوق والمشاركة من قبل المستخدمين، فضلاً عن الاستفادة من الخبرة الغنية لفريقها الأساسي، حصلت Yupp على اعتراف عالٍ من شخصيات معروفة في صناعة التكنولوجيا وأفضل المستثمرين المغامرين.
الأسبوع الماضي، أعلنت Yupp عن إكمال جولة أولية للتمويل بقيمة 33 مليون دولار، بقيادة شريك A16z كريس ديكسون. تشمل المستثمرين الآخرين كبير علماء جوجل جيف دين، وشارك مؤسس تويتر بيز ستون، ومؤسس بينتيريست إيفان شارب، ومدير عام Perplexity أرافيند سرينيفاس، ودان بونه من جامعة ستانفورد، وكريس ري، ونيك مكيوون، وبالاجي برا بهكار، من بين 45 من الملائكة التنفيذيين المعروفين والشركات، بالإضافة إلى Coinbase Ventures.
كمنصة تقييم AI مركزية، يلتزم Yupp بفلسفة "كل AI للجميع"، مما يسمح للمستخدمين باكتشاف ومقارنة واستخدام أحدث نماذج AI بسهولة. على عكس الاستجابات الفردية التقليدية، يعود Yupp بالإجابات من نموذجين (أو حتى أكثر) في الوقت نفسه لكل طلب، مما يشكل "برلمان AI". لا يلبي هذا التصميم فقط مطالب المستخدمين للاختيارات المتنوعة بل يحدد أيضًا بشكل فعال "الهلاوس" المحتملة التي قد تنتجها النماذج، مما يساعد المستخدمين على اتخاذ قرارات أكثر إطلاعًا من خلال المقارنة. كما ذكر الرئيس التنفيذي لشركة Yupp بانكاج غوبتا، فإن المخرجات المتجاورة مفيدة بشكل خاص للمستخدمين القلقين بشأن أخطاء التوليد، حيث يمكنهم التحقق المتبادل من النتائج.
المنصة تدعم الآن أكثر من 500 نموذج ذكاء اصطناعي، تغطي مجالات توليد النصوص والصور، بما في ذلك نماذج معروفة مثل ChatGPT وClaude وGemini وDeepSeek وGrok وLlama والعديد من النماذج الناشئة. ولتحسين التجربة بشكل أكبر، أطلقت Yupp أيضًا ميزة "QuickTake"، التي يمكن أن تختصر الردود الطويلة إلى تغريدة مختصرة.
بالإضافة إلى ذلك، تعطي Yupp أولوية عالية لخصوصية المستخدم: جميع سجلات الدردشة خاصة بشكل افتراضي ما لم يقم المستخدم بجعلها عامة؛ حتى عند مشاركتها علنًا، لا يتم الكشف عن أي معلومات شخصية. يمكن للمستخدمين التحكم في محتوى ونطاق المشاركة في أي وقت.
ستستخدم Yupp تعليقات المستخدمين مجانًا وقياس استخدام النموذج من خلال نظام "نقاط Yupp". يتلقى المستخدمون الجدد 5000 نقطة عند التسجيل، ويمكنهم كسب المزيد من النقاط من خلال تقييم ردود النموذج، واختيار التفضيلات، وشرح أسبابهم. كلما كانت جودة التعليقات أعلى، كانت المكافآت أكبر، مما يضمن أن المستخدمين يمكنهم استخدام نماذج عالية الجودة مثل Claude Opus 4 أو OpenAI o3 مجانًا بشكل مستدام. تعد المنصة بأن النقاط ستزداد فقط وأن جميع النماذج الحالية يمكن تجربتها مجانًا.
بعد كل سؤال، سيحصل المستخدمون على ردين نموذجيين ويمكنهم كسب "بطاقة خدش رقمية" من خلال التعليقات، مما يكافئ نقاط Yupp تتراوح من 0 إلى 250. يمكن استبدال كل 1000 نقطة بدولار واحد، مع حد أقصى للسحب اليومي يبلغ 10 دولارات وحد أقصى شهري يبلغ 50 دولارًا. يمكن استبدال النقاط بأكثر من 20 عملة، بما في ذلك الدولار واليورو، مع شركاء مثل Stripe وPayPal وCoinbase. في الوقت نفسه، يقوم النظام الأساسي بدمج Base Ethernet L2 وStablecoins من Solana لتقديم مكافآت فورية خالية من الرسوم للمستخدمين في جميع أنحاء العالم.
كما قال بانكاج غوبتا، فإن التعليقات عالية الجودة التي ينتجها المستخدمون أكثر قيمة بكثير لتعديل نموذج الشركات العاملة في مجال الذكاء الاصطناعي والتعلم المعزز من المكافآت نفسها. على الرغم من أن أرباح المستخدمين الشهرية قد تعادل فقط بضع أكواب من القهوة، إلا أن بيانات التعليق المدفوعة هذه ضرورية لتكرار الذكاء الاصطناعي.
لتشجيع المزيد من الناس على المشاركة، أنشأت Yupp أيضًا مكافأة إحالة: يحصل المحيل على 5000 نقطة، ويحصل الشخص المُحال على 1000 نقطة؛ حاليًا، يمكن للمستخدمين الجدد المسجلين الحصول على 5000 نقطة، ويحصل الشخص المُحال على 2500 نقطة إضافية.
للتعامل مع القضايا الحالية المتعلقة بعدم كفاية الشفافية في التصنيفات، ونقص العدالة، وعدم التساوي في الوصول إلى بيانات التقييم، أطلقت Yupp نسخة تجريبية من تصنيف الذكاء الاصطناعي ونظام تصنيف "Yupp VIBE (مؤشر ذكاء الفيب)". يجمع هذا النظام بيانات التفضيل التي ينتجها المستخدمون العالميون في تفاعلات طبيعية، بهدف تقديم نتائج تقييم قوية وموثوقة.
تشمل مبادئ تقييم يوب:
تجمع المنصة ليس فقط التفضيلات الثنائية ولكنها تشجع أيضًا المستخدمين على الإشارة إلى مزايا وعيوب الردود (مثل "مباشر"، "سرعة عالية"، "أسلوب جيد"، وما إلى ذلك)، وتقوم بتحليل المجموعات بناءً على عمر المستخدمين، والتعليم، والمهنة، ومعلومات أخرى لتظهر الفروق في التفضيلات بين المجموعات المختلفة.
على المستوى التقني، تستكشف Yupp استخدام البلوكتشين، والبدائية التشفيرية، وإثباتات المعرفة الصفرية لضمان أن عملية التقييم عادلة وشفافة وقابلة للتحقق. في الوقت نفسه، قامت المنصة بالشراكة مع مزودي بيانات الذكاء الاصطناعي المحترفين لمعيرة المقيمين من خلال التحقق الأثري والكشف عن الجودة متعدد الطبقات للقضاء على البيانات الضارة.
تم تحديث قائمة المتصدرين الأخيرة، حيث تعرض درجات VIBE لنماذج مثل GPT‑4.5 Preview وClaude Opus 4 وClaude Sonnet 4، بالإضافة إلى معدلات فوزها، ومعدلات عدم الإعجاب، والسرعة، والكمون، ونافذة السياق، ومقاييس التكلفة.
تم إطلاق Yupp رسميًا في 13 يونيو 2025، بعد ستة أشهر من الاختبارات الداخلية. منذ إطلاقه، تم تحسين المنتج باستمرار:
تتمثل مهمة يوب في "تمكين الإنسانية من تشكيل مستقبل الذكاء الاصطناعي". يعتقد بانكاج غوبتا أن تطوير الذكاء الاصطناعي يتطلب مشاركة ومساهمة الجميع. من خلال استجابات الذكاء الاصطناعي متعددة الزوايا وتعليقات المستخدمين، لا يساعد يوب المستخدمين فقط في اتخاذ قرارات أفضل، بل يوفر أيضًا قوة دافعة مستمرة لتطور الذكاء الاصطناعي.
من الجدير بالذكر أن أحد المنافسين الرئيسيين لـ Yupp هو منصة تقييم نماذج الذكاء الاصطناعي المفتوحة LMArena (الموقع الإلكتروني:https://lmarena.ai/),يحظى موقع الويب بشعبية كبيرة بين محترفي الذكاء الاصطناعي ، لكن المنصة حاليا في مرحلة الاستكشاف التجاري ولا تقدم مكافآت مادية مباشرة أو آليات حوافز للنقاط لمشاركة المستخدم من خلال الاستفادة من تقنية Blockchain.
بشكل عام، فتحت Yupp طريقًا جديدًا لتقييم الذكاء الاصطناعي من خلال نموذجها المعتمد على الحشود، وآلية الحوافز، ونظام التقييم المدفوع بتفضيلات المستخدمين الحقيقيين. لا تقدم فقط للمستخدمين تجربة تفاعلية مجانية ومتنوعة للذكاء الاصطناعي، بل تحول أيضًا ملاحظات المستخدمين إلى بيانات تدريب عالية القيمة، مما يعزز التحسين المستمر للنموذج. مع فريق ذو خبرة ودعم من رأس المال من الدرجة الأولى، من المتوقع أن تلعب Yupp دورًا رئيسيًا في نظام الذكاء الاصطناعي المستقبلي، محققة رؤية "الذكاء الاصطناعي للجميع، بتشكيل من الجميع."
ومع ذلك، فإن Yupp، التي تم إطلاقها للتو، تحتاج إلى استكشاف وتحسين كيفية ضمان جودة البيانات باستمرار، ومقاومة السلوكيات الغش المحتملة تحت مشاركة عدد كبير من المستخدمين، وتحقيق التوازن بين التجارية والحوافز الموجهة للمستخدمين، وذلك سيكون اتجاهًا يحتاج إلى استكشاف وتحسين في تطورها المستقبلي.