لم أستطع تجاوز سبب دفع زوك 15 مليار دولار للاستحواذ على 15 موظفًا من شركة سكيل إيه آي (شركة بيانات)
لذلك قمت بالغوص العميق وأعتقد أنني اكتشفت الأمر:
نحن لا نفد من البيانات. في الواقع، إنه العكس.
تنتج سيارة ذاتية القيادة واحدة 2 تيرابايت (، أي ما يعادل 800,000 كتاب ) من البيانات في الساعة.
المشكلة هي أن البيانات فوضى، وليس من السهل إدخالها في نموذج لغوي كبير للتدريب، لذا يتم إلقاؤها في مقبرة بيانات ليحلها شخص آخر (لا أحد يفعل ذلك).
ندرة شديدة في مهندسي البيانات الجيدين
المقبرة التي ذكرتها أعلاه هي في الحقيقة منجم ذهب إذا استطعت الترتيب من خلالها
المشكلة هي أن عددًا قليلًا جدًا من الناس لديهم العقول أو الوقت. أعتقد أن هذا هو السبب في أن زوك دفع 15 مليار دولار لموظفي scaleAI
البيانات عالية الجودة أكثر قيمة بكثير من "كمية" البيانات
خصوصًا لنماذج ما بعد التدريب (eg وقت اختبار الحساب).
كما أنه يتطلب حوسبة أقل مما يقلل من تكلفة تدريب النماذج.
لذا إذا كان بإمكان فريق التدريب الخاص بك 1. تصنيف بيانات عالية الجودة 2. حقنها في مرحلة ما بعد التدريب و 3. تقليل التكاليف - فسوف تفوز في سباق الذكاء الاصطناعي (priceless).
قد تحتوي هذه الصفحة على محتوى من جهات خارجية، يتم تقديمه لأغراض إعلامية فقط (وليس كإقرارات/ضمانات)، ولا ينبغي اعتباره موافقة على آرائه من قبل Gate، ولا بمثابة نصيحة مالية أو مهنية. انظر إلى إخلاء المسؤولية للحصول على التفاصيل.
لم أستطع تجاوز سبب دفع زوك 15 مليار دولار للاستحواذ على 15 موظفًا من شركة سكيل إيه آي (شركة بيانات)
لذلك قمت بالغوص العميق وأعتقد أنني اكتشفت الأمر:
نحن لا نفد من البيانات. في الواقع، إنه العكس.
تنتج سيارة ذاتية القيادة واحدة 2 تيرابايت (، أي ما يعادل 800,000 كتاب ) من البيانات في الساعة.
المشكلة هي أن البيانات فوضى، وليس من السهل إدخالها في نموذج لغوي كبير للتدريب، لذا يتم إلقاؤها في مقبرة بيانات ليحلها شخص آخر (لا أحد يفعل ذلك).
ندرة شديدة في مهندسي البيانات الجيدين
المقبرة التي ذكرتها أعلاه هي في الحقيقة منجم ذهب إذا استطعت الترتيب من خلالها
المشكلة هي أن عددًا قليلًا جدًا من الناس لديهم العقول أو الوقت. أعتقد أن هذا هو السبب في أن زوك دفع 15 مليار دولار لموظفي scaleAI
البيانات عالية الجودة أكثر قيمة بكثير من "كمية" البيانات
خصوصًا لنماذج ما بعد التدريب (eg وقت اختبار الحساب).
كما أنه يتطلب حوسبة أقل مما يقلل من تكلفة تدريب النماذج.
لذا إذا كان بإمكان فريق التدريب الخاص بك 1. تصنيف بيانات عالية الجودة 2. حقنها في مرحلة ما بعد التدريب و 3. تقليل التكاليف - فسوف تفوز في سباق الذكاء الاصطناعي (priceless).