موظفو OpenAI ينتقدون علنًا نتائج اختبارات XAI الأخيرة لنموذج الذكاء الاصطناعي Grok3 بأنها مضللة

robot
إنشاء الملخص قيد التقدم

في رسالة ChainCatcher ، وفقًا لتقرير من Jinshi ، اتهم أحد موظفي OpenAI شركة XAI التابعة لماسك علنًا ، مشيرًا إلى أن نتائج اختبار المعيار لنموذج AI Grok3 الجديد الذي أطلقته مضللة. بالنسبة لهذا الأمر ، أكد مؤسس شركة XAI إيغور بابوشكين (Igor Babushkin) أن الشركة ليست غير ملائمة. تشير رسوم بيانية XAI إلى أن أداء نسختي Grok3 - Grok3 Reasoning Beta وGrok3 mini Reasoning - كان أفضل من النموذج القوي الحالي o3-mini-high لدى OpenAI على AIME 2025. ومع ذلك، لاحظ موظفو OpenAI بسرعة على منصة X أن رسوم بيانية XAI لم تتضمن درجة o3-mini-high في شرط "cons@64" في AIME 2025. بوبوش جين ادعى على منصة X أن OpenAI قد نشرت في الماضي رسوم بيانية للاختبارات الخادعة المشابهة. على الرغم من أن هذه الرسوم البيانية تستخدم لمقارنة أداء نماذجها الخاصة.

XAI-6.17%
GROK-4.81%
شاهد النسخة الأصلية
قد تحتوي هذه الصفحة على محتوى من جهات خارجية، يتم تقديمه لأغراض إعلامية فقط (وليس كإقرارات/ضمانات)، ولا ينبغي اعتباره موافقة على آرائه من قبل Gate، ولا بمثابة نصيحة مالية أو مهنية. انظر إلى إخلاء المسؤولية للحصول على التفاصيل.
  • أعجبني
  • تعليق
  • مشاركة
تعليق
0/400
لا توجد تعليقات
  • تثبيت