Merkeziyetsizlik AI eğitimi keşfi: Prime Intellect ve Pluralis öncülük ediyor

Crypto AI'nin Kutsal Kâsesi: Merkeziyetsizlik Eğitiminde Öncelikli Keşifler

AI'nin tüm değer zincirinde, model eğitimi en fazla kaynak tüketen ve en yüksek teknik engellere sahip aşamadır, doğrudan modelin yetenek sınırını ve gerçek uygulama etkisini belirler. Çıkarım aşamasındaki hafif çağrılara kıyasla, eğitim süreci sürekli büyük ölçekli hesaplama gücü yatırımı, karmaşık veri işleme süreçleri ve yüksek yoğunluklu optimizasyon algoritmaları desteği gerektirir, bu da AI sistemlerinin inşasında gerçek bir "ağır sanayi"dir. Mimari paradigmalar açısından, eğitim yöntemleri dört kategoriye ayrılabilir: merkezi eğitim, dağıtık eğitim, federatif öğrenme ve bu makalede odaklanılan Merkeziyetsizlik eğitimi.

Crypto AI'nin Kutsal Kâsesi: Merkeziyetsizlikle Eğitimin Sınırlarını Keşfetmek

Merkeziyetsiz eğitim en yaygın geleneksel yöntemdir; tek bir kuruluş, yerel yüksek performanslı kümeler içinde tüm eğitim süreçlerini tamamlar; donanım, alt yazılım, küme planlama sistemi ve eğitim çerçevesinin tüm bileşenleri, tek bir kontrol sistemi tarafından koordine edilerek çalışır. Bu derin işbirliği mimarisi, bellek paylaşımı, gradyan senkronizasyonu ve hata toleransı mekanizmalarının verimliliğini en üst düzeye çıkarır ve GPT, Gemini gibi büyük ölçekli modellerin eğitimi için son derece uygundur; yüksek verimlilik ve kontrol edilebilir kaynaklar avantajına sahiptir ancak aynı zamanda veri tekelciliği, kaynak engelleri, enerji tüketimi ve tek nokta riski gibi sorunları da barındırır.

Dağıtık eğitim, günümüzde büyük model eğitiminin ana akım yöntemidir. Temelinde, model eğitim görevlerinin parçalanarak birden fazla makineye dağıtılması ve birlikte çalıştırılması yatar; bu sayede tek bir makinenin hesaplama ve depolama darboğazlarını aşmak hedeflenir. Fiziksel olarak "dağıtık" özelliklere sahip olmasına rağmen, genel olarak merkezi bir kuruluş tarafından kontrol edilen, zamanlaması ve senkronizasyonu sağlanan bir yapıdadır. Genellikle yüksek hızlı yerel alan ağlarında çalışır ve NVLink yüksek hızlı bağlantı teknolojisi ile ana düğüm, her bir alt görevi koordine eder. Ana akım yöntemler şunlardır:

  • Veri paralelliği: Her düğüm farklı veri parametreleri eğitir, model ağırlıklarının eşleşmesi gerekir.
  • Model paralelliği: Modelin farklı kısımlarını farklı düğümlere dağıtarak güçlü ölçeklenebilirlik sağlamak.
  • Boru hattı paralel: Aşamalı seri yürütme, verimliliği artırır
  • Tensor paralelliği: Matris hesaplamalarını ince bir şekilde bölmek, paralel parçalama derecesini artırmak

Dağıtık eğitim, "merkezi kontrol + dağıtık yürütme" kombinasyonudur, aynı patronun uzaktan birden fazla "ofis" çalışanını iş birliği yaparak görev tamamlamasını yönetmesine benzer. Şu anda neredeyse tüm ana akım büyük modeller bu şekilde eğitim almaktadır.

Merkeziyetsizlik eğitimi, daha açık ve sansüre dayanıklı bir gelecek yolu anlamına gelir. Temel özelliği, merkezi bir koordinatör olmaksızın güvenmeyen birden fazla düğümün işbirliği yaparak eğitim görevlerini tamamlamasıdır; genellikle protokoller aracılığıyla görev dağıtımı ve işbirliği sağlanır ve katkıların dürüstlüğünü sağlamak için şifreleme teşvik mekanizmaları kullanılır. Bu modelin karşılaştığı ana zorluklar şunlardır:

  • Cihaz heterojenliği ve bölme zorluğu: Heterojen cihazların koordinasyonu zor, görev bölme verimliliği düşük
  • İletişim verimliliği darboğazı: Ağ iletişimi istikrarsız, gradyan senkronizasyonu darboğazı belirgin.
  • Güvenilir yürütme eksikliği: Güvenilir bir yürütme ortamının olmaması, düğümlerin gerçekten hesaplamaya katılıp katılmadığını doğrulamayı zorlaştırıyor.
  • Birlikte koordine eksikliği: Merkezi bir kontrol merkezi yok, görev dağıtımı ve hata geri alma mekanizması karmaşık.

Merkeziyetsizlik eğitimi, dünyanın dört bir yanındaki gönüllülerin, kendi hesaplama güçlerini katkıda bulunarak modeli birlikte eğittiği şeklinde anlaşılabilir. Ancak "gerçekten uygulanabilir büyük ölçekli merkeziyetsizlik eğitimi", sistem mimarisi, iletişim protokolleri, kriptografik güvenlik, ekonomik mekanizmalar, model doğrulama gibi birçok düzeyi içeren sistematik bir mühendislik zorluğudur. Ancak "etkili iş birliği + dürüstlük teşviki + doğru sonuçlar" sağlanıp sağlanamayacağı henüz erken prototip keşif aşamasındadır.

Federated learning, bir geçiş biçimi olarak dağıtık ve Merkeziyetsizlik arasında, verilerin yerel olarak saklanmasını ve model parametrelerinin merkezi olarak toplanmasını vurgular; gizlilik uyumuna önem veren senaryolar için uygundur. Federated learning, dağıtık eğitim mühendislik yapısını ve yerel iş birliği yeteneğini taşırken, aynı zamanda Merkeziyetsizlik eğitiminde verilerin dağılma avantajını da sunar. Ancak, hala güvenilir bir koordinatöre bağımlıdır ve tamamen açık ve sansüre dirençli özelliklere sahip değildir. Gizlilik uyumu senaryolarında "kontrollü Merkeziyetsizlik" çözümü olarak görülebilir; eğitim görevleri, güven yapılandırması ve iletişim mekanizmaları açısından görece ılımlıdır ve endüstride geçici dağıtım mimarisi olarak daha uygundur.

Crypto AI'nin Kutsal Kâsesi: Merkeziyetsizlik Eğitiminin Sınırları

Merkeziyetsizlik eğitiminde sınırlar, fırsatlar ve gerçek yollar

Eğitim paradigması açısından, Merkeziyetsizlik eğitim her görev tipi için uygun değildir. Bazı senaryolarda, görev yapısının karmaşık olması, kaynak gereksinimlerinin son derece yüksek olması veya iş birliği zorluğu nedeniyle, doğal olarak heterojen, güvenilir olmayan düğümler arasında verimli bir şekilde tamamlanması mümkün değildir. Örneğin, büyük model eğitimi genellikle yüksek bellek, düşük gecikme ve yüksek bant genişliği gerektirir, bu nedenle açık ağda etkili bir şekilde bölünmesi ve senkronize edilmesi zordur; veri gizliliği ve egemenlik kısıtlamaları olan görevler, yasal uyumluluk ve etik kısıtlamalar nedeniyle açık bir şekilde paylaşılamaz; iş birliği teşviklerinin eksik olduğu görevler ise dış katılım motivasyonundan yoksundur. Bu sınırlar, mevcut Merkeziyetsizlik eğitimine ilişkin gerçek kısıtlamaları oluşturmaktadır.

Ancak bu, merkeziyetsizlik eğitimlerinin bir safsata olduğu anlamına gelmez. Aslında, yapı olarak hafif, kolay paralelize edilebilen ve teşvik edici görev türlerinde merkeziyetsizlik eğitimi belirgin uygulama potansiyeli göstermektedir. Bunlar arasında ancak bunlarla sınırlı olmamak üzere: LoRA ince ayarı, davranış hizalaması türü son eğitim görevleri (, RLHF, DPO ), veri kalabalığı eğitim ve etiketleme görevleri, kaynak kontrol edilebilir küçük temel model eğitimi ve kenar cihazların katıldığı işbirlikçi eğitim senaryoları bulunmaktadır. Bu görevler genellikle yüksek paralelizm, düşük bağlanabilirlik ve heterojen hesap gücüne tolerans özelliklerine sahiptir, bu nedenle P2P ağları, Swarm protokolü, dağıtık optimizatörler gibi yöntemlerle işbirlikçi eğitim için son derece uygundur.

Crypto AI'nin Kutsal Kâsesi: Merkeziyetsizlik Eğitiminde Öncelikli Keşif

Merkeziyetsizlik Eğitim Klasik Proje Analizi

Şu anda Merkeziyetsizlik eğitim ve federated öğrenme öncülüğünde, temsil niteliği taşıyan blockchain projeleri arasında Prime Intellect, Pluralis.ai, Gensyn, Nous Research ve Flock.io bulunmaktadır. Teknik yenilikçilik ve mühendislik uygulama zorluğu açısından, Prime Intellect, Nous Research ve Pluralis.ai sistem mimarisi ve algoritma tasarımında birçok özgün keşif önermiştir ve mevcut teorik araştırmanın öncü yönlerini temsil etmektedir; Gensyn ve Flock.io'nun gerçekleştirme yolları ise görece daha net olup, ilk mühendislik ilerlemelerini görmek mümkündür. Bu makalede, bu beş projenin arkasındaki temel teknolojiler ve mühendislik mimarisi sırasıyla analiz edilecek ve Merkeziyetsizlik AI eğitim sistemindeki farklılıkları ve tamamlayıcı ilişkileri daha da araştırılacaktır.

Prime Intellect: Eğitim izleri doğrulanabilir güçlendirme öğrenimi işbirlikçi ağ öncüsü

Prime Intellect, güvene ihtiyaç duymayan bir AI eğitim ağı inşa etmeye kendini adamıştır; böylece herkes eğitim sürecine katılabilir ve hesaplama katkıları için güvenilir ödüller alabilir. Prime Intellect, PRIME-RL + TOPLOC + SHARDCAST üç temel modül aracılığıyla, doğrulanabilir, açık ve teşvik mekanizmaları eksiksiz bir AI merkeziyetsiz eğitim sistemi oluşturmayı hedeflemektedir.

01, Prime Intellect protokol yığını yapısı ve ana modül değeri

Crypto AI'nin Kutsal Kâsesi: Merkeziyetsizlik Eğitiminde Sınırları Zorlamak

02, Prime Intellect eğitiminin ana mekanizmalarının detaylı açıklaması

#PRIME-RL: Ayrık Asenkron Güçlendirme Öğrenme Görev Mimarisi

PRIME-RL, Prime Intellect tarafından Merkeziyetsizlik eğitim senaryoları için özel olarak tasarlanmış bir görev modelleme ve yürütme çerçevesidir ve heterojen ağlar ile eşzamanlı katılımcılar için tasarlanmıştır. Güçlendirilmiş öğrenmeyi öncelikli uyumlu nesne olarak kullanır, eğitim, çıkarım ve ağırlık yükleme süreçlerini yapısal olarak ayrıştırır, böylece her eğitim düğümü yerel olarak bağımsız bir şekilde görev döngüsünü tamamlayabilir ve standart arayüzler aracılığıyla doğrulama ve birleştirme mekanizmalarıyla işbirliği yapabilir. Geleneksel denetimli öğrenme süreçlerine kıyasla, PRIME-RL, merkezi bir zamanlama ortamında esnek eğitim gerçekleştirmek için daha uygundur, böylece sistem karmaşıklığını azaltır ve çoklu görev paralelliğini ve strateji evrimini desteklemek için bir temel oluşturur.

#TOPLOC:Hafif Eğitim Davranış Doğrulama Mekanizması

TOPLOC, Prime Intellect tarafından önerilen, bir düğümün gerçekten gözlem verilerine dayanarak etkili bir strateji öğrenimi gerçekleştirip gerçekleştirmediğini belirlemek için kullanılan eğitim doğrulanabilirlik çekirdek mekanizmasıdır. ZKML gibi ağır çözümlerden farklı olarak, TOPLOC tam model yeniden hesaplamasına dayanmaz, bunun yerine "gözlem dizisi↔strateji güncellemesi" arasındaki yerel tutarlılık izlerini analiz ederek hafif yapısal doğrulamayı tamamlar. Eğitim sürecindeki davranış izlerini doğrulanabilir nesnelere dönüştüren ilk yöntemdir, güvene dayanmayan eğitim ödül dağıtımını gerçekleştirmenin anahtar yeniliğidir ve denetlenebilir, teşvik edici bir merkeziyetsiz işbirliği eğitim ağı oluşturmak için uygulanabilir bir yol sunar.

#SHARDCAST: Asenkron Ağırlık Toplama ve Yayılma Protokolü

SHARDCAST, Prime Intellect tarafından tasarlanan ağırlık yayılımı ve toplama protokolüdür, asenkron, bant genişliği kısıtlı ve düğüm durumu değişken olan gerçek ağ ortamı için optimize edilmiştir. Gossip yayılım mekanizması ve yerel senkronizasyon stratejisini birleştirerek, birden fazla düğümün senkronize olmayan durumlarda sürekli kısmi güncellemeler sunmasına olanak tanır, ağırlıkların kademeli yakınsamasını ve çoklu versiyon evrimini gerçekleştirir. Merkezi veya senkronize AllReduce yöntemlerine kıyasla, SHARDCAST merkeziyetsizlik eğitiminin ölçeklenebilirliğini ve hata toleransını önemli ölçüde artırır, istikrarlı ağırlık konsensüsü ve sürekli eğitim iterasyonu için temel bir yapı taşını oluşturur.

#OpenDiLoCo: Seyrek Asenkron İletişim Çerçevesi

OpenDiLoCo, Prime Intellect ekibi tarafından DeepMind'ın önerdiği DiLoCo fikrini bağımsız olarak gerçekleştirdiği ve açık kaynak olarak sunduğu bir iletişim optimizasyon çerçevesidir; merkeziyetsiz eğitimde yaygın olan bant genişliği kısıtlamaları, cihaz heterojenliği ve düğüm istikrarsızlığı gibi zorluklara özel olarak tasarlanmıştır. Mimarisi veri paralelliğine dayanmaktadır ve Ring, Expander, Small-World gibi seyrek topoloji yapıları oluşturarak, küresel senkronizasyonun yüksek iletişim maliyetlerinden kaçınmakta ve model işbirliği eğitimini yalnızca yerel komşu düğümlere dayanarak tamamlamaktadır. Asenkron güncellemeler ve kesinti toleransı mekanizması ile bir araya geldiğinde, OpenDiLoCo, tüketici sınıfı GPU'ların ve kenar cihazların da eğitim görevlerine istikrarlı bir şekilde katılmasını sağlar ve küresel işbirliği eğitimine katılımı önemli ölçüde artırır; bu, merkeziyetsiz eğitim ağları oluşturmanın temel iletişim altyapılarından biridir.

#PCCL: İşbirliği İletişim Kütüphanesi

PCCL, Prime Intellect tarafından merkeziyetsiz AI eğitim ortamı için özel olarak tasarlanmış hafif bir iletişim kütüphanesidir. Geleneksel iletişim kütüphanelerinin heterojen cihazlar ve düşük bant genişliği ağlarındaki uyum sorunlarını çözmeyi amaçlamaktadır. PCCL, seyrek topolojiyi, gradyan sıkıştırmayı, düşük hassasiyet senkronizasyonunu ve kesintiden kurtarmayı destekler, tüketici sınıfı GPU'larda ve istikrarsız düğümlerde çalışabilir. OpenDiLoCo protokolünün asenkron iletişim yeteneklerini destekleyen alt bileşendir. Eğitim ağının bant genişliği toleransını ve cihaz uyumluluğunu önemli ölçüde artırarak, gerçek anlamda açık ve güvene dayanmayan işbirlikçi eğitim ağını inşa etmek için "son bir mil" iletişim temellerini sağlamlaştırmaktadır.

03, Prime Intellect teşvik ağı ve rol dağılımı

Prime Intellect, herkesin görevlere katılabileceği ve gerçek katkılara dayalı ödüller alabileceği, izin gerektirmeyen, doğrulanabilir ve ekonomik teşvik mekanizması olan bir eğitim ağı inşa etti. Protokol, üç ana rol temelinde çalışır:

  • Görev başlatıcısı: eğitim ortamını, başlangıç modelini, ödül fonksiyonunu ve doğrulama standartlarını tanımlamak
  • Eğitim düğümü: Yerel eğitim gerçekleştirin, ağırlık güncellemelerini ve gözlem izlerini gönderin
  • Doğrulama Düğümleri: TOPLOC mekanizmasını kullanarak eğitim davranışının gerçekliğini doğrular ve ödül hesaplaması ile strateji birleştirmesine katılır.

Protokolün ana akışı, görev yayınlama, düğüm eğitimi, iz doğrulama, ağırlık toplama (SHARDCAST) ve ödül dağıtımını içerir ve "gerçek eğitim davranışı" etrafında dönen bir teşvik kapalı döngü oluşturur.

Crypto AI'nin Kutsal Kâsesi: Merkeziyetsizlik Eğitiminin Sınırları

04, INTELLECT-2: İlk doğrulanabilir Merkeziyetsizlik eğitim modelinin yayımlanması

Prime Intellect, Mayıs 2025'te INTELLECT-2'yi piyasaya sürdü. Bu, dünya çapında asenkron, güvene dayanmayan Merkeziyetsizlik düğümlerinin iş birliği ile eğitilen ilk büyük ölçekli pekiştirme öğrenme modelidir ve parametre ölçeği 32B'ye ulaşmaktadır. INTELLECT-2 modeli, üç kıtada bulunan 100'den fazla GPU heterojen düğüm tarafından iş birliği ile eğitilmiş olup, tamamen asenkron bir mimari kullanmaktadır. Eğitim süresi 400 saati aşmakta ve asenkron iş birliği ağının uygulanabilirliği ile istikrarını göstermektedir. Bu model, yalnızca performans açısından bir atılım değil, aynı zamanda Prime Intellect'in "eğitim, konsensüs demektir" paradigmasının ilk sistematik uygulanmasıdır. INTELLECT-2, Merkeziyetsizlik eğitimini simgeleyen PRIME-RL, TOPLOC ve SHARDCAST gibi temel protokol modüllerini entegre etmiştir.

PRIME0.18%
View Original
This page may contain third-party content, which is provided for information purposes only (not representations/warranties) and should not be considered as an endorsement of its views by Gate, nor as financial or professional advice. See Disclaimer for details.
  • Reward
  • 7
  • Share
Comment
0/400
mev_me_maybevip
· 4h ago
Gerçek eğitim hem pahalı hem de yavaş. Kim dayanabilir ki?
View OriginalReply0
WhaleWatchervip
· 4h ago
Eğitim gemiye binin ücreti reformu olmadan merkeziyetsizlikten bahsedilemez.
View OriginalReply0
MissedAirdropBrovip
· 4h ago
Yine büyük bir Mining Ekipmanı dalgası kurup zengin olacağım.
View OriginalReply0
WagmiWarriorvip
· 4h ago
Bu tat çok doğru.
View OriginalReply0
SellTheBouncevip
· 4h ago
Ah, bir başka sermaye peşinde koşma fırsatı, bir önceki döngüyle pek bir farkı yok.
View OriginalReply0
CommunitySlackervip
· 4h ago
Başlık: "Merkeziyetsizlik AI Eğitimi Keşfi: Prime Intellect ve Pluralis Sınırları Zorluyor"

Böyle yapabilir miyiz? ? Merkeziyetsiz eğitim yavaşlatıyor.
View OriginalReply0
Trade Crypto Anywhere Anytime
qrCode
Scan to download Gate app
Community
  • 简体中文
  • English
  • Tiếng Việt
  • 繁體中文
  • Español
  • Русский
  • Français (Afrique)
  • Português (Portugal)
  • Bahasa Indonesia
  • 日本語
  • بالعربية
  • Українська
  • Português (Brasil)