الكأس المقدسة للذكاء الاصطناعي للعملات المشفرة: استكشاف الحدود للتدريب اللامركزي
في سلسلة القيمة الكاملة للذكاء الاصطناعي، يعتبر تدريب النماذج هو المرحلة الأكثر استهلاكًا للموارد والأعلى في عتبة التكنولوجيا، حيث يحدد بشكل مباشر الحد الأعلى لقدرة النموذج وفعالية تطبيقه الفعلية. بالمقارنة مع الاستدعاءات الخفيفة في مرحلة الاستدلال، يتطلب عملية التدريب استثمارًا مستمرًا في قدرات حسابية ضخمة، وعمليات معالجة بيانات معقدة، ودعم خوارزميات تحسين عالية الكثافة، مما يجعلها "صناعة ثقيلة" حقيقية لبناء أنظمة الذكاء الاصطناعي. من منظور نماذج الهيكلية، يمكن تقسيم أساليب التدريب إلى أربع فئات: التدريب المركزي، التدريب الموزع، التعلم الفيدرالي، والتدريب اللامركزي الذي يتم مناقشته في هذه المقالة.
التدريب المركزي هو الطريقة التقليدية الأكثر شيوعًا، حيث يتم تنفيذ جميع عمليات التدريب من قبل مؤسسة واحدة في مجموعة محلية عالية الأداء، من الأجهزة، والبرمجيات الأساسية، ونظام جدولة المجموعات، إلى جميع مكونات إطار التدريب التي يتم تنسيق تشغيلها بواسطة نظام تحكم موحد. هذه البنية التحتية المتكاملة تتيح مشاركة الذاكرة، وتزامن التدرجات، وآلية التحمل للأخطاء لتحقيق أقصى كفاءة، وهي مناسبة جدًا لتدريب النماذج الكبيرة مثل GPT و Gemini، ولها مزايا الكفاءة العالية، والموارد القابلة للتحكم، لكنها في الوقت نفسه تواجه مشكلات احتكار البيانات، وحواجز الموارد، واستهلاك الطاقة، ومخاطر النقاط الفردية.
تدريب موزع هو الطريقة السائدة حاليًا لتدريب النماذج الكبيرة، والجوهر هو تقسيم مهمة تدريب النموذج ثم توزيعها على عدة آلات لتنفيذها بشكل متعاون، من أجل تجاوز اختناقات الحوسبة والتخزين على جهاز واحد. على الرغم من أن لديها خصائص "موزعة" من الناحية الفيزيائية، إلا أن النظام الكلي لا يزال يتم التحكم فيه من قبل مؤسسات مركزية تدير التنسيق والتزامن، وغالبًا ما يعمل في بيئة شبكة محلية سريعة، من خلال تقنية NVLink للاتصال السريع، يتم تنسيق جميع المهام الفرعية بواسطة العقدة الرئيسية. تشمل الطرق الرئيسية:
التوازي البياني: كل عقدة تدرب معلمات بيانات مختلفة مشتركة، تحتاج إلى مطابقة أوزان النموذج
التوازي النموذجي: نشر أجزاء مختلفة من النموذج على عقد مختلفة لتحقيق قابلية توسيع قوية
الأنابيب المتوازية: تنفيذ تسلسلي على مراحل، مما يزيد من معدل الإنتاج
توازي التنسور: تقسيم دقيق لحساب المصفوفات، تعزيز مدى التوازي
التدريب الموزع هو مزيج من "التحكم المركزي + التنفيذ الموزع"، مقارنةً بمدير واحد يقود عن بُعد تعاون موظفين من عدة "مكاتب" لإنجاز المهام. حاليًا، يتم تدريب جميع النماذج الكبيرة السائدة تقريبًا بهذه الطريقة.
اللامركزية التدريبية تمثل مسارًا مستقبليًا أكثر انفتاحًا وخصائص مقاومة للرقابة. تتمثل ميزتها الأساسية في: عدة عقد غير موثوقة تتعاون لإكمال مهام التدريب دون منسق مركزي، عادةً من خلال بروتوكولات تدفع توزيع المهام والتعاون، وتساعد آليات التحفيز المشفرة في ضمان نزاهة المساهمات. تشمل التحديات الرئيسية التي تواجه هذا النموذج:
صعوبة التجانس وتقسيم المهام: صعوبة تنسيق الأجهزة اللامركزية، وكفاءة تقسيم المهام منخفضة
عنق زجاجة كفاءة الاتصال: الاتصال الشبكي غير مستقر، وعائق تزامن التدرج واضح
نقص التنفيذ الموثوق: نقص في بيئة التنفيذ الموثوقة، مما يجعل من الصعب التحقق مما إذا كانت العقدة تشارك فعليًا في الحساب.
نقص التنسيق الموحد: لا يوجد جهاز توجيه مركزي، توزيع المهام، وآلية التراجع عن الأخطاء معقدة
يمكن فهم التدريب اللامركزي على أنه: مجموعة من المتطوعين من جميع أنحاء العالم، يساهمون كل منهم بقوة حسابية لتدريب النموذج بالتعاون، لكن "التدريب اللامركزي الكبير القابل للتطبيق حقًا" لا يزال تحديًا هندسيًا نظاميًا، يتضمن بنية النظام، بروتوكولات الاتصال، أمان التشفير، آليات الاقتصاد، والتحقق من النموذج، ولكن ما إذا كان يمكن "التعاون بشكل فعال + تحفيز الصدق + النتائج الصحيحة" لا يزال في مرحلة استكشاف النموذج الأولي المبكر.
تعتبر التعلم الفيدرالي شكلًا انتقاليًا بين التوزيع واللامركزية، حيث يبرز أهمية الاحتفاظ بالبيانات محليًا، وتجميع معلمات النموذج مركزيًا، مما يجعله مناسبًا للسيناريوهات التي تركز على الامتثال للخصوصية. يتمتع التعلم الفيدرالي بهيكل هندسي للتدريب الموزع وقدرة على التعاون المحلي، بينما يمتلك أيضًا ميزة توزيع البيانات في التدريب اللامركزي، ولكنه لا يزال يعتمد على جهة تنسيق موثوقة، ولا يتمتع بخصائص مفتوحة تمامًا ومقاومة للرقابة. يمكن اعتباره نوعًا من "اللامركزية الخاضعة للرقابة" في سياقات الامتثال للخصوصية، حيث يكون في مهام التدريب، وهيكل الثقة وآليات الاتصال بشكل نسبي أكثر اعتدالًا، مما يجعله أكثر ملاءمة كهيكل نشر انتقالي في الصناعة.
اللامركزية تدريب الحدود، الفرص والواقع المسار
من حيث نماذج التدريب، فإن التدريب اللامركزي لا يناسب جميع أنواع المهام. في بعض السيناريوهات، بسبب تعقيد هيكل المهمة، ومتطلبات الموارد العالية للغاية، أو صعوبة التعاون، فإنه بطبيعته غير مناسب لإكماله بكفاءة بين العقد غير المتجانسة والموثوقة. على سبيل المثال، يعتمد تدريب النماذج الكبيرة غالبًا على ذاكرة عالية، وزمن استجابة منخفض، وعرض نطاق ترددي عالي، مما يجعل من الصعب تقسيمه ومزامنته بشكل فعال في الشبكات المفتوحة؛ كما أن المهام التي تفرض قيودًا قوية على الخصوصية والامتثال القانوني والأخلاقي لا يمكن مشاركتها بشكل مفتوح؛ بينما تفتقر المهام التي تفتقر إلى أساس تحفيز التعاون إلى حافز خارجي للمشاركة. هذه الحدود تشكل معًا القيود الواقعية الحالية للتدريب اللامركزي.
لكن هذا لا يعني أن التدريب اللامركزي هو مقولة زائفة. في الواقع، في أنواع المهام ذات الهيكل الخفيف، وسهولة التوازي، والحوافز، يظهر التدريب اللامركزي آفاق تطبيق واضحة. بما في ذلك، على سبيل المثال لا الحصر: ضبط LoRA، مهام التدريب اللاحق المتوافقة مع السلوك مثل RLHF، DPO(، مهام تدريب وتوسيم البيانات المcrowd، تدريب نماذج الأساس الصغيرة القابلة للتحكم في الموارد، وكذلك سيناريوهات التدريب التعاوني التي تشارك فيها الأجهزة الطرفية. تتمتع هذه المهام بشكل عام بخصائص عالية من التوازي، وقلة الربط، وتحمل القوة الحاسوبية غير المتجانسة، مما يجعلها مناسبة للغاية للتدريب التعاوني من خلال الشبكات P2P، بروتوكول Swarm، المحسنات الموزعة، وغيرها.
![كأس القدر للذكاء الاصطناعي: استكشاف جوانب التدريب اللامركزية])https://img-cdn.gateio.im/webp-social/moments-adb92bc4dfbaf26863cb0b4bb1081cd7.webp(
تحليل مشاريع التدريب الكلاسيكية اللامركزية
تشمل المشاريع الرائدة في مجال التدريب اللامركزي والتعلم الفيدرالي حاليًا على شبكة البلوكشين كل من Prime Intellect وPluralis.ai وGensyn وNous Research وFlock.io. من حيث الابتكار التكنولوجي وصعوبة التنفيذ الهندسي، قدمت Prime Intellect وNous Research وPluralis.ai العديد من الاستكشافات الأصلية في تصميم النظام والخوارزميات، مما يمثل الاتجاهات الرائدة في الأبحاث النظرية الحالية؛ بينما تعتبر مسارات التنفيذ لـ Gensyn وFlock.io واضحة نسبيًا، حيث يمكن رؤية التقدم الهندسي الأولي. ستقوم هذه المقالة بتحليل التقنيات الأساسية وهياكل الهندسة وراء هذه المشاريع الخمسة بالتتابع، بالإضافة إلى مناقشة الفروق والعلاقات التكاملية بينها في نظام التدريب على الذكاء الاصطناعي اللامركزي.
) Prime Intellect: رائد الشبكات التعاونية لزيادة التعلم القابل للتحقق من مسارات التدريب
تسعى Prime Intellect لبناء شبكة تدريب AI لا تحتاج إلى ثقة، مما يسمح لأي شخص بالمشاركة في التدريب والحصول على مكافآت موثوقة مقابل مساهماته الحسابية. تأمل Prime Intellect في بناء نظام تدريب AI اللامركزي القابل للتحقق، المفتوح، والمجهز بآلية تحفيز من خلال ثلاثة مكونات رئيسية: PRIME-RL + TOPLOC + SHARDCAST.
01، هيكل بروتوكول Prime Intellect و قيمة الوحدات الأساسية
![كأس المقدس للذكاء الاصطناعي: استكشاف متقدم للتدريب اللامركزي]###https://img-cdn.gateio.im/webp-social/moments-69eb6c2dab3d6284b890285c71e7a47f.webp(
)# 02، شرح آلية التدريب الرئيسية لـ Prime Intellect
#PRIME-RL: بنية مهمة التعلم المعزز غير المتزامن المفككة
PRIME-RL هو إطار نمذجة المهام والتنفيذ المخصص من Prime Intellect لمشاهد التدريب اللامركزية، مصمم خصيصًا للشبكات غير المتجانسة والمشاركة غير المتزامنة. يستخدم التعلم المعزز كهدف تكييف أولوي، مما يفصل بشكل هيكلي بين عملية التدريب والاستدلال وتحميل الأوزان، مما يسمح لكل عقدة تدريب بإكمال دورة المهام بشكل مستقل محليًا، والتعاون من خلال واجهات معيارية وآليات التحقق والتجميع. مقارنةً بعمليات التعلم الخاضع للإشراف التقليدية، يعد PRIME-RL أكثر ملاءمة لتحقيق التدريب المرن في بيئات بدون جدولة مركزية، مما يقلل من تعقيد النظام ويضع الأساس لدعم المهام المتعددة بالتوازي وتطور الاستراتيجيات.
#TOPLOC: آلية التحقق من سلوك التدريب الخفيف الوزن
TOPLOC هو آلية جوهرية للتدريب القابلة للتحقق اقترحها Prime Intellect، تُستخدم لتحديد ما إذا كان العقدة قد أكملت فعلاً تعلم استراتيجية فعالة استناداً إلى بيانات المراقبة. على عكس الحلول الثقيلة مثل ZKML، لا يعتمد TOPLOC على إعادة حساب النموذج بالكامل، بل يكمل التحقق الهيكلي الخفيف من خلال تحليل المسارات المحلية بين "سلسلة المراقبة ↔ تحديث الاستراتيجية". للمرة الأولى، يحول المسارات السلوكية خلال عملية التدريب إلى كائنات قابلة للتحقق، وهو الابتكار الرئيسي لتحقيق توزيع مكافآت التدريب دون الحاجة إلى الثقة، ويقدم مساراً قابلاً للتطبيق لبناء شبكة تدريب تعاونية لامركزية قابلة للتدقيق والتحفيز.
#SHARDCAST: بروتوكول تجميع ونشر الأوزان غير المتزامن
SHARDCAST هو بروتوكول نشر ودمج الوزن مصمم من قبل Prime Intellect، تم تحسينه خصيصًا للبيئات الشبكية الحقيقية التي تعاني من عدم التزامن، والقيود على النطاق الترددي، وتغير حالة العقد. إنه يجمع بين آلية نشر gossip واستراتيجيات التزامن المحلي، مما يسمح لعدة عقد بتقديم تحديثات جزئية بشكل مستمر في حالة عدم التزامن، مما يحقق التقارب التدريجي للوزن والتطور متعدد الإصدارات. مقارنة بأساليب AllReduce المركزية أو المتزامنة، فإن SHARDCAST يعزز بشكل ملحوظ قابلية التوسع والقدرة على تحمل الأخطاء في التدريب اللامركزي، وهو الأساس الرئيسي لبناء توافق الوزن المستقر والتدريب المستمر والتكرار.
#OpenDiLoCo: إطار الاتصال غير المتزامن النادر
OpenDiLoCo هو إطار عمل لتحسين الاتصالات تم تحقيقه بشكل مستقل ومفتوح المصدر من قبل فريق Prime Intellect بناءً على مفهوم DiLoCo الذي اقترحته DeepMind، وهو مصمم خصيصًا للتحديات الشائعة في التدريب اللامركزي مثل قيود النطاق الترددي وتنوع الأجهزة وعدم استقرار العقد. يعتمد هيكله على التوازي البيانات، من خلال بناء هياكل تخطيط نادرة مثل Ring وExpander وSmall-World، مما يتجنب ارتفاع تكاليف الاتصال العالمية ويعتمد فقط على عقد الجوار المحلية لإكمال تدريب النموذج التعاوني. بالجمع بين التحديثات غير المتزامنة وآلية تحمل الأخطاء، يجعل OpenDiLoCo وحدات معالجة الرسوميات الاستهلاكية والأجهزة الطرفية قادرة على المشاركة بشكل مستقر في مهام التدريب، مما يعزز بشكل كبير إمكانية المشاركة في التدريب التعاوني العالمي، ويعتبر أحد البنى التحتية الأساسية للاتصالات لبناء شبكة تدريب لامركزية.
#PCCL: مكتبة الاتصالات التعاونية
PCCL هو مكتبة اتصالات خفيفة الوزن تم تصميمها من قبل Prime Intellect لبيئة تدريب الذكاء الاصطناعي اللامركزية، تهدف إلى حل عنق الزجاجة في التكيف الخاص بمكتبات الاتصالات التقليدية على الأجهزة المتنوعة والشبكات ذات النطاق الترددي المنخفض. يدعم PCCL التوبولوجيا المتناثرة، وضغط التدرجات، والتزامن بدقة منخفضة واستعادة النقاط، ويمكن تشغيله على وحدات معالجة الرسوميات الاستهلاكية والعقد غير المستقرة، وهو المكون الأساسي الذي يدعم قدرة الاتصال غير المتزامن لبروتوكول OpenDiLoCo. إنه يعزز بشكل ملحوظ من قدرة تحمل عرض النطاق الترددي لشبكات التدريب وتوافق الأجهزة، مما يفتح "آخر كيلومتر" من البنية التحتية للاتصالات لبناء شبكة تدريب تعاونية مفتوحة حقًا ودون حاجة للثقة.
03، شبكة Prime Intellect التحفيزية وتقسيم الأدوار
بنت Prime Intellect شبكة تدريب قابلة للتحقق، بدون إذن، وتحتوي على آلية تحفيز اقتصادية، مما يتيح لأي شخص الانخراط في المهام والحصول على مكافآت بناءً على المساهمات الحقيقية. يعتمد تشغيل البروتوكول على ثلاث فئات من الأدوار الأساسية:
عقد التدريب: تنفيذ التدريب المحلي، تقديم تحديثات الوزن ومسارات الملاحظة
عقدة التحقق: استخدام آلية TOPLOC للتحقق من صحة سلوك التدريب والمشاركة في حساب المكافآت وتجميع الاستراتيجيات
تتضمن العملية الأساسية للبروتوكول نشر المهام، تدريب العقد، التحقق من المسارات، تجميع الأوزان ### SHARDCAST ( وتوزيع المكافآت، مما يشكل حلقة تحفيز تدور حول "سلوك التدريب الحقيقي".
![كأس圣Crypto AI: استكشاف الحدود للتدريب اللامركزي])https://img-cdn.gateio.im/webp-social/moments-b11af8d10db6e8baa0c19e87aa18dd82.webp(
)# 04، INTELLECT-2: إصدار أول نموذج تدريب قابل للتحقق اللامركزية
أطلقت Prime Intellect في مايو 2025 نموذج INTELLECT-2، وهو أول نموذج تعلم معزز كبير يتم تدريبه بواسطة تعاون غير متزامن ولامركزي بدون ثقة. حجم المعلمات يصل إلى 32B. تم تدريب نموذج INTELLECT-2 بالتعاون بين أكثر من 100 عقدة GPU متغايرة منتشرة عبر ثلاث قارات، باستخدام بنية غير متزامنة بالكامل، حيث تجاوزت مدة التدريب 400 ساعة، مما يظهر جدوى واستقرار الشبكة التعاونية غير المتزامنة. هذا النموذج ليس فقط إنجازًا في الأداء، بل يمثل أيضًا التنفيذ النظامي الأول لنموذج "التدريب هو التوافق" الذي اقترحته Prime Intellect. يدمج INTELLECT-2 بروتوكولات أساسية مثل PRIME-RL وTOPLOC وSHARDCAST، مما يرمز إلى التدريب اللامركزي.
قد تحتوي هذه الصفحة على محتوى من جهات خارجية، يتم تقديمه لأغراض إعلامية فقط (وليس كإقرارات/ضمانات)، ولا ينبغي اعتباره موافقة على آرائه من قبل Gate، ولا بمثابة نصيحة مالية أو مهنية. انظر إلى إخلاء المسؤولية للحصول على التفاصيل.
تسجيلات الإعجاب 16
أعجبني
16
7
مشاركة
تعليق
0/400
mev_me_maybe
· منذ 4 س
التدريب الحقيقي مكلف وبطيء من يستطيع التحمل؟
شاهد النسخة الأصليةرد0
WhaleWatcher
· منذ 4 س
لا يمكن الحديث عن اللامركزية بدون إصلاح رسوم دخول التدريب
شاهد النسخة الأصليةرد0
MissedAirdropBro
· منذ 4 س
مرة أخرى سنقوم بصنع مجموعة كبيرة من أجهزة التعدين للثراء
شاهد النسخة الأصليةرد0
WagmiWarrior
· منذ 4 س
هذه النكهة صحيحة جداً
شاهد النسخة الأصليةرد0
SellTheBounce
· منذ 4 س
آه، إنها فرصة أخرى تتبعها رؤوس الأموال، ولا تختلف جوهريًا عن الدورة السابقة.
شاهد النسخة الأصليةرد0
CommunitySlacker
· منذ 4 س
العنوان: "استكشاف تدريب الذكاء الاصطناعي اللامركزي: Prime Intellect و Pluralis يقودان المقدمة"
اللامركزية AI التدريب الاستكشافي: Prime Intellect و Pluralis يقودان الطليعة
الكأس المقدسة للذكاء الاصطناعي للعملات المشفرة: استكشاف الحدود للتدريب اللامركزي
في سلسلة القيمة الكاملة للذكاء الاصطناعي، يعتبر تدريب النماذج هو المرحلة الأكثر استهلاكًا للموارد والأعلى في عتبة التكنولوجيا، حيث يحدد بشكل مباشر الحد الأعلى لقدرة النموذج وفعالية تطبيقه الفعلية. بالمقارنة مع الاستدعاءات الخفيفة في مرحلة الاستدلال، يتطلب عملية التدريب استثمارًا مستمرًا في قدرات حسابية ضخمة، وعمليات معالجة بيانات معقدة، ودعم خوارزميات تحسين عالية الكثافة، مما يجعلها "صناعة ثقيلة" حقيقية لبناء أنظمة الذكاء الاصطناعي. من منظور نماذج الهيكلية، يمكن تقسيم أساليب التدريب إلى أربع فئات: التدريب المركزي، التدريب الموزع، التعلم الفيدرالي، والتدريب اللامركزي الذي يتم مناقشته في هذه المقالة.
التدريب المركزي هو الطريقة التقليدية الأكثر شيوعًا، حيث يتم تنفيذ جميع عمليات التدريب من قبل مؤسسة واحدة في مجموعة محلية عالية الأداء، من الأجهزة، والبرمجيات الأساسية، ونظام جدولة المجموعات، إلى جميع مكونات إطار التدريب التي يتم تنسيق تشغيلها بواسطة نظام تحكم موحد. هذه البنية التحتية المتكاملة تتيح مشاركة الذاكرة، وتزامن التدرجات، وآلية التحمل للأخطاء لتحقيق أقصى كفاءة، وهي مناسبة جدًا لتدريب النماذج الكبيرة مثل GPT و Gemini، ولها مزايا الكفاءة العالية، والموارد القابلة للتحكم، لكنها في الوقت نفسه تواجه مشكلات احتكار البيانات، وحواجز الموارد، واستهلاك الطاقة، ومخاطر النقاط الفردية.
تدريب موزع هو الطريقة السائدة حاليًا لتدريب النماذج الكبيرة، والجوهر هو تقسيم مهمة تدريب النموذج ثم توزيعها على عدة آلات لتنفيذها بشكل متعاون، من أجل تجاوز اختناقات الحوسبة والتخزين على جهاز واحد. على الرغم من أن لديها خصائص "موزعة" من الناحية الفيزيائية، إلا أن النظام الكلي لا يزال يتم التحكم فيه من قبل مؤسسات مركزية تدير التنسيق والتزامن، وغالبًا ما يعمل في بيئة شبكة محلية سريعة، من خلال تقنية NVLink للاتصال السريع، يتم تنسيق جميع المهام الفرعية بواسطة العقدة الرئيسية. تشمل الطرق الرئيسية:
التدريب الموزع هو مزيج من "التحكم المركزي + التنفيذ الموزع"، مقارنةً بمدير واحد يقود عن بُعد تعاون موظفين من عدة "مكاتب" لإنجاز المهام. حاليًا، يتم تدريب جميع النماذج الكبيرة السائدة تقريبًا بهذه الطريقة.
اللامركزية التدريبية تمثل مسارًا مستقبليًا أكثر انفتاحًا وخصائص مقاومة للرقابة. تتمثل ميزتها الأساسية في: عدة عقد غير موثوقة تتعاون لإكمال مهام التدريب دون منسق مركزي، عادةً من خلال بروتوكولات تدفع توزيع المهام والتعاون، وتساعد آليات التحفيز المشفرة في ضمان نزاهة المساهمات. تشمل التحديات الرئيسية التي تواجه هذا النموذج:
يمكن فهم التدريب اللامركزي على أنه: مجموعة من المتطوعين من جميع أنحاء العالم، يساهمون كل منهم بقوة حسابية لتدريب النموذج بالتعاون، لكن "التدريب اللامركزي الكبير القابل للتطبيق حقًا" لا يزال تحديًا هندسيًا نظاميًا، يتضمن بنية النظام، بروتوكولات الاتصال، أمان التشفير، آليات الاقتصاد، والتحقق من النموذج، ولكن ما إذا كان يمكن "التعاون بشكل فعال + تحفيز الصدق + النتائج الصحيحة" لا يزال في مرحلة استكشاف النموذج الأولي المبكر.
تعتبر التعلم الفيدرالي شكلًا انتقاليًا بين التوزيع واللامركزية، حيث يبرز أهمية الاحتفاظ بالبيانات محليًا، وتجميع معلمات النموذج مركزيًا، مما يجعله مناسبًا للسيناريوهات التي تركز على الامتثال للخصوصية. يتمتع التعلم الفيدرالي بهيكل هندسي للتدريب الموزع وقدرة على التعاون المحلي، بينما يمتلك أيضًا ميزة توزيع البيانات في التدريب اللامركزي، ولكنه لا يزال يعتمد على جهة تنسيق موثوقة، ولا يتمتع بخصائص مفتوحة تمامًا ومقاومة للرقابة. يمكن اعتباره نوعًا من "اللامركزية الخاضعة للرقابة" في سياقات الامتثال للخصوصية، حيث يكون في مهام التدريب، وهيكل الثقة وآليات الاتصال بشكل نسبي أكثر اعتدالًا، مما يجعله أكثر ملاءمة كهيكل نشر انتقالي في الصناعة.
اللامركزية تدريب الحدود، الفرص والواقع المسار
من حيث نماذج التدريب، فإن التدريب اللامركزي لا يناسب جميع أنواع المهام. في بعض السيناريوهات، بسبب تعقيد هيكل المهمة، ومتطلبات الموارد العالية للغاية، أو صعوبة التعاون، فإنه بطبيعته غير مناسب لإكماله بكفاءة بين العقد غير المتجانسة والموثوقة. على سبيل المثال، يعتمد تدريب النماذج الكبيرة غالبًا على ذاكرة عالية، وزمن استجابة منخفض، وعرض نطاق ترددي عالي، مما يجعل من الصعب تقسيمه ومزامنته بشكل فعال في الشبكات المفتوحة؛ كما أن المهام التي تفرض قيودًا قوية على الخصوصية والامتثال القانوني والأخلاقي لا يمكن مشاركتها بشكل مفتوح؛ بينما تفتقر المهام التي تفتقر إلى أساس تحفيز التعاون إلى حافز خارجي للمشاركة. هذه الحدود تشكل معًا القيود الواقعية الحالية للتدريب اللامركزي.
لكن هذا لا يعني أن التدريب اللامركزي هو مقولة زائفة. في الواقع، في أنواع المهام ذات الهيكل الخفيف، وسهولة التوازي، والحوافز، يظهر التدريب اللامركزي آفاق تطبيق واضحة. بما في ذلك، على سبيل المثال لا الحصر: ضبط LoRA، مهام التدريب اللاحق المتوافقة مع السلوك مثل RLHF، DPO(، مهام تدريب وتوسيم البيانات المcrowd، تدريب نماذج الأساس الصغيرة القابلة للتحكم في الموارد، وكذلك سيناريوهات التدريب التعاوني التي تشارك فيها الأجهزة الطرفية. تتمتع هذه المهام بشكل عام بخصائص عالية من التوازي، وقلة الربط، وتحمل القوة الحاسوبية غير المتجانسة، مما يجعلها مناسبة للغاية للتدريب التعاوني من خلال الشبكات P2P، بروتوكول Swarm، المحسنات الموزعة، وغيرها.
![كأس القدر للذكاء الاصطناعي: استكشاف جوانب التدريب اللامركزية])https://img-cdn.gateio.im/webp-social/moments-adb92bc4dfbaf26863cb0b4bb1081cd7.webp(
تحليل مشاريع التدريب الكلاسيكية اللامركزية
تشمل المشاريع الرائدة في مجال التدريب اللامركزي والتعلم الفيدرالي حاليًا على شبكة البلوكشين كل من Prime Intellect وPluralis.ai وGensyn وNous Research وFlock.io. من حيث الابتكار التكنولوجي وصعوبة التنفيذ الهندسي، قدمت Prime Intellect وNous Research وPluralis.ai العديد من الاستكشافات الأصلية في تصميم النظام والخوارزميات، مما يمثل الاتجاهات الرائدة في الأبحاث النظرية الحالية؛ بينما تعتبر مسارات التنفيذ لـ Gensyn وFlock.io واضحة نسبيًا، حيث يمكن رؤية التقدم الهندسي الأولي. ستقوم هذه المقالة بتحليل التقنيات الأساسية وهياكل الهندسة وراء هذه المشاريع الخمسة بالتتابع، بالإضافة إلى مناقشة الفروق والعلاقات التكاملية بينها في نظام التدريب على الذكاء الاصطناعي اللامركزي.
) Prime Intellect: رائد الشبكات التعاونية لزيادة التعلم القابل للتحقق من مسارات التدريب
تسعى Prime Intellect لبناء شبكة تدريب AI لا تحتاج إلى ثقة، مما يسمح لأي شخص بالمشاركة في التدريب والحصول على مكافآت موثوقة مقابل مساهماته الحسابية. تأمل Prime Intellect في بناء نظام تدريب AI اللامركزي القابل للتحقق، المفتوح، والمجهز بآلية تحفيز من خلال ثلاثة مكونات رئيسية: PRIME-RL + TOPLOC + SHARDCAST.
01، هيكل بروتوكول Prime Intellect و قيمة الوحدات الأساسية
![كأس المقدس للذكاء الاصطناعي: استكشاف متقدم للتدريب اللامركزي]###https://img-cdn.gateio.im/webp-social/moments-69eb6c2dab3d6284b890285c71e7a47f.webp(
)# 02، شرح آلية التدريب الرئيسية لـ Prime Intellect
#PRIME-RL: بنية مهمة التعلم المعزز غير المتزامن المفككة
PRIME-RL هو إطار نمذجة المهام والتنفيذ المخصص من Prime Intellect لمشاهد التدريب اللامركزية، مصمم خصيصًا للشبكات غير المتجانسة والمشاركة غير المتزامنة. يستخدم التعلم المعزز كهدف تكييف أولوي، مما يفصل بشكل هيكلي بين عملية التدريب والاستدلال وتحميل الأوزان، مما يسمح لكل عقدة تدريب بإكمال دورة المهام بشكل مستقل محليًا، والتعاون من خلال واجهات معيارية وآليات التحقق والتجميع. مقارنةً بعمليات التعلم الخاضع للإشراف التقليدية، يعد PRIME-RL أكثر ملاءمة لتحقيق التدريب المرن في بيئات بدون جدولة مركزية، مما يقلل من تعقيد النظام ويضع الأساس لدعم المهام المتعددة بالتوازي وتطور الاستراتيجيات.
#TOPLOC: آلية التحقق من سلوك التدريب الخفيف الوزن
TOPLOC هو آلية جوهرية للتدريب القابلة للتحقق اقترحها Prime Intellect، تُستخدم لتحديد ما إذا كان العقدة قد أكملت فعلاً تعلم استراتيجية فعالة استناداً إلى بيانات المراقبة. على عكس الحلول الثقيلة مثل ZKML، لا يعتمد TOPLOC على إعادة حساب النموذج بالكامل، بل يكمل التحقق الهيكلي الخفيف من خلال تحليل المسارات المحلية بين "سلسلة المراقبة ↔ تحديث الاستراتيجية". للمرة الأولى، يحول المسارات السلوكية خلال عملية التدريب إلى كائنات قابلة للتحقق، وهو الابتكار الرئيسي لتحقيق توزيع مكافآت التدريب دون الحاجة إلى الثقة، ويقدم مساراً قابلاً للتطبيق لبناء شبكة تدريب تعاونية لامركزية قابلة للتدقيق والتحفيز.
#SHARDCAST: بروتوكول تجميع ونشر الأوزان غير المتزامن
SHARDCAST هو بروتوكول نشر ودمج الوزن مصمم من قبل Prime Intellect، تم تحسينه خصيصًا للبيئات الشبكية الحقيقية التي تعاني من عدم التزامن، والقيود على النطاق الترددي، وتغير حالة العقد. إنه يجمع بين آلية نشر gossip واستراتيجيات التزامن المحلي، مما يسمح لعدة عقد بتقديم تحديثات جزئية بشكل مستمر في حالة عدم التزامن، مما يحقق التقارب التدريجي للوزن والتطور متعدد الإصدارات. مقارنة بأساليب AllReduce المركزية أو المتزامنة، فإن SHARDCAST يعزز بشكل ملحوظ قابلية التوسع والقدرة على تحمل الأخطاء في التدريب اللامركزي، وهو الأساس الرئيسي لبناء توافق الوزن المستقر والتدريب المستمر والتكرار.
#OpenDiLoCo: إطار الاتصال غير المتزامن النادر
OpenDiLoCo هو إطار عمل لتحسين الاتصالات تم تحقيقه بشكل مستقل ومفتوح المصدر من قبل فريق Prime Intellect بناءً على مفهوم DiLoCo الذي اقترحته DeepMind، وهو مصمم خصيصًا للتحديات الشائعة في التدريب اللامركزي مثل قيود النطاق الترددي وتنوع الأجهزة وعدم استقرار العقد. يعتمد هيكله على التوازي البيانات، من خلال بناء هياكل تخطيط نادرة مثل Ring وExpander وSmall-World، مما يتجنب ارتفاع تكاليف الاتصال العالمية ويعتمد فقط على عقد الجوار المحلية لإكمال تدريب النموذج التعاوني. بالجمع بين التحديثات غير المتزامنة وآلية تحمل الأخطاء، يجعل OpenDiLoCo وحدات معالجة الرسوميات الاستهلاكية والأجهزة الطرفية قادرة على المشاركة بشكل مستقر في مهام التدريب، مما يعزز بشكل كبير إمكانية المشاركة في التدريب التعاوني العالمي، ويعتبر أحد البنى التحتية الأساسية للاتصالات لبناء شبكة تدريب لامركزية.
#PCCL: مكتبة الاتصالات التعاونية
PCCL هو مكتبة اتصالات خفيفة الوزن تم تصميمها من قبل Prime Intellect لبيئة تدريب الذكاء الاصطناعي اللامركزية، تهدف إلى حل عنق الزجاجة في التكيف الخاص بمكتبات الاتصالات التقليدية على الأجهزة المتنوعة والشبكات ذات النطاق الترددي المنخفض. يدعم PCCL التوبولوجيا المتناثرة، وضغط التدرجات، والتزامن بدقة منخفضة واستعادة النقاط، ويمكن تشغيله على وحدات معالجة الرسوميات الاستهلاكية والعقد غير المستقرة، وهو المكون الأساسي الذي يدعم قدرة الاتصال غير المتزامن لبروتوكول OpenDiLoCo. إنه يعزز بشكل ملحوظ من قدرة تحمل عرض النطاق الترددي لشبكات التدريب وتوافق الأجهزة، مما يفتح "آخر كيلومتر" من البنية التحتية للاتصالات لبناء شبكة تدريب تعاونية مفتوحة حقًا ودون حاجة للثقة.
03، شبكة Prime Intellect التحفيزية وتقسيم الأدوار
بنت Prime Intellect شبكة تدريب قابلة للتحقق، بدون إذن، وتحتوي على آلية تحفيز اقتصادية، مما يتيح لأي شخص الانخراط في المهام والحصول على مكافآت بناءً على المساهمات الحقيقية. يعتمد تشغيل البروتوكول على ثلاث فئات من الأدوار الأساسية:
تتضمن العملية الأساسية للبروتوكول نشر المهام، تدريب العقد، التحقق من المسارات، تجميع الأوزان ### SHARDCAST ( وتوزيع المكافآت، مما يشكل حلقة تحفيز تدور حول "سلوك التدريب الحقيقي".
![كأس圣Crypto AI: استكشاف الحدود للتدريب اللامركزي])https://img-cdn.gateio.im/webp-social/moments-b11af8d10db6e8baa0c19e87aa18dd82.webp(
)# 04، INTELLECT-2: إصدار أول نموذج تدريب قابل للتحقق اللامركزية
أطلقت Prime Intellect في مايو 2025 نموذج INTELLECT-2، وهو أول نموذج تعلم معزز كبير يتم تدريبه بواسطة تعاون غير متزامن ولامركزي بدون ثقة. حجم المعلمات يصل إلى 32B. تم تدريب نموذج INTELLECT-2 بالتعاون بين أكثر من 100 عقدة GPU متغايرة منتشرة عبر ثلاث قارات، باستخدام بنية غير متزامنة بالكامل، حيث تجاوزت مدة التدريب 400 ساعة، مما يظهر جدوى واستقرار الشبكة التعاونية غير المتزامنة. هذا النموذج ليس فقط إنجازًا في الأداء، بل يمثل أيضًا التنفيذ النظامي الأول لنموذج "التدريب هو التوافق" الذي اقترحته Prime Intellect. يدمج INTELLECT-2 بروتوكولات أساسية مثل PRIME-RL وTOPLOC وSHARDCAST، مما يرمز إلى التدريب اللامركزي.
هل يمكننا فعل ذلك؟? التدريب المركز يموت ببطء