Crypto AI'nin Kutsal Kasesi: Merkeziyetsizlik Eğitiminin Sınırlarını Keşfetmek
AI'nin tüm değer zincirinde, model eğitimi en fazla kaynak tüketen, en yüksek teknik engel içeren aşamadır ve doğrudan modelin kapasite sınırını ve pratik uygulama etkisini belirler. Çıkarım aşamasının hafif çağrımlarına kıyasla, eğitim süreci sürekli olarak büyük ölçekli hesaplama gücü yatırımı, karmaşık veri işleme süreçleri ve yüksek yoğunluklu optimizasyon algoritmaları desteği gerektirir; bu, AI sistemlerinin inşası için gerçek bir "ağır sanayi"dir. Mimari paradigmalar açısından, eğitim yöntemleri dört kategoriye ayrılabilir: merkezi eğitim, dağıtık eğitim, federatif öğrenme ve bu makalede odaklanılan Merkeziyetsizlik eğitimi.
Merkeziyetsizlik eğitimi, tek bir kurumun yerel yüksek performanslı kümeler içinde tüm eğitim sürecini tamamladığı en yaygın geleneksel yöntemdir; donanım, alt yazılım, küme zamanlama sistemi ve eğitim çerçevesi gibi tüm bileşenler tek bir kontrol sistemi tarafından koordine edilir. Bu derin iş birliği mimarisi, bellek paylaşımı, gradyan senkronizasyonu ve hata toleransı mekanizmalarının verimliliğini en üst düzeye çıkarır ve GPT, Gemini gibi büyük ölçekli modellerin eğitimi için oldukça uygundur. Yüksek verimlilik ve kaynak kontrolü avantajlarına sahipken, aynı zamanda veri tekelciliği, kaynak engelleri, enerji tüketimi ve tek nokta riski gibi sorunlar da taşımaktadır.
Dağıtık eğitim, günümüzde büyük model eğitiminin ana akım yöntemidir; bunun temelinde model eğitim görevlerinin parçalanarak birden fazla makineye dağıtılması ve birlikte çalıştırılması yatar, bu sayede tek bir makinenin hesaplama ve depolama darboğazlarını aşmak mümkün olur. Fiziksel olarak "dağıtık" özelliklere sahip olmasına rağmen, genel olarak merkezi bir kuruluş tarafından kontrol edilmekte ve senkronize edilmektedir; genellikle yüksek hızlı yerel ağ ortamlarında çalışmakta, NVLink yüksek hızlı bağlantı teknolojisi aracılığıyla ana düğüm, çeşitli alt görevleri koordine etmektedir. Ana akım yöntemler şunları içermektedir:
Veri paralelliği: Her düğüm farklı veri parametrelerini eğitir, model ağırlıklarının eşleşmesi gerekir.
Model paralelliği: Modelin farklı kısımlarını farklı düğümlerde dağıtarak güçlü ölçeklenebilirlik sağlama
Boru hattı paralel: Aşamalı seri yürütme, verimliliği artırır
Tensör paralelliği: Matris hesaplamalarını ince ayar ile bölmek, paralel granülasyonu artırmak.
Dağıtık eğitim, "merkezî kontrol + dağıtık yürütme" kombinasyonudur; aynı patronun uzaktan birden fazla "ofis" çalışanını iş birliği yaparak görevleri tamamlamasıyla benzerlik gösterir. Şu anda neredeyse tüm ana akım büyük modeller (GPT-4, Gemini, LLaMA vb. ) bu yöntemle eğitim tamamlamaktadır.
Merkeziyetsizlik eğitimi, daha açık ve sansüre dirençli bir gelecek yolu temsil eder. Temel özellikleri şunlardır: Birbirine güvenmeyen birden fazla düğüm (, ev bilgisayarları, bulut GPU'ları veya kenar cihazları ), merkezi bir koordinatör olmadan eğitim görevlerini işbirliği içinde tamamlayabilir, genellikle protokoller aracılığıyla görev dağılımı ve işbirliği sağlanır, katkının dürüstlüğünü garanti etmek için şifreli teşvik mekanizmaları kullanılır. Bu modelin karşılaştığı ana zorluklar şunlardır:
Cihaz heterojenliği ve bölme zorluğu: Heterojen cihazların koordinasyonu zor, görev bölme verimliliği düşük
İletişim verimliliği darboğazı: Ağ iletişimi istikrarsız, gradyan senkronizasyon darboğazı belirgin
Birlikte koordine eksikliği: Merkezi bir denetleyici yok, görev dağıtımı ve istisna geri alma mekanizması karmaşık.
Merkeziyetsizlik eğitimi, dünya genelindeki gönüllülerin her birinin hesap gücünü katkıda bulunarak model eğitimi yaptığı bir süreç olarak anlaşılabilir. Ancak "gerçekten uygulanabilir büyük ölçekli merkeziyetsizlik eğitimi" hala sistematik bir mühendislik zorluğudur; sistem mimarisi, iletişim protokolleri, kriptografik güvenlik, ekonomik mekanizmalar, model doğrulama gibi birçok alanı kapsamaktadır. Ancak "işbirliği etkin + dürüstlüğü teşvik etme + sonuçların doğruluğu" konuları hala erken prototip keşif aşamasındadır.
Federated öğrenme, dağıtılmışlık ile Merkeziyetsizlik arasında bir geçiş biçimi olarak, verilerin yerel olarak saklanmasını ve model parametrelerinin merkezi bir şekilde toplanmasını vurgular, gizlilik uyumuna önem verilen senaryolar için uygundur (, örneğin sağlık ve finans ). Federated öğrenme, dağıtılmış eğitim mühendislik yapısına ve yerel işbirliği yeteneğine sahipken, aynı zamanda Merkeziyetsizlik eğitiminin veri dağıtım avantajlarını da taşır, ancak yine de güvenilir bir koordinatöre bağımlıdır ve tamamen açık ve sansüre dayanıklı özelliklere sahip değildir. Gizlilik uyumu senaryolarında "kontrollü merkeziyetsizlik" çözümü olarak görülebilir; eğitim görevleri, güven yapısı ve iletişim mekanizması açısından oldukça ılımlıdır ve endüstride geçiş aşaması olarak daha uygundur.
Merkeziyetsizlik eğitiminin sınırları, fırsatları ve gerçek yolları
Eğitim paradigması açısından, merkeziyetsiz eğitim tüm görev türleri için uygun değildir. Bazı senaryolar, görev yapısının karmaşık olması, kaynak gereksinimlerinin son derece yüksek olması veya işbirliği zorluğu gibi nedenlerle, doğal olarak heterojen, güvenilmeyen düğümler arasında verimli bir şekilde tamamlanmak için uygun değildir. Örneğin, büyük model eğitimi genellikle yüksek bellek, düşük gecikme ve yüksek bant genişliği gerektirir ve açık ağda etkili bir şekilde bölünmesi ve senkronize edilmesi zordur; veri gizliliği ve egemenlik kısıtlamaları güçlü olan görevler (, sağlık, finans gibi, yasal uyum ve etik kısıtlamalar nedeniyle açık bir şekilde paylaşılamaz; işbirliği teşvik temeli eksik olan görevler ), şirket kapalı kaynak modelleri veya dahili prototip eğitimi ( ise dış katılım motivasyonundan yoksundur. Bu sınırlar, mevcut merkeziyetsiz eğitimin gerçek kısıtlamalarını oluşturmaktadır.
Ancak bu, merkeziyetsizlik eğitimlerinin bir safsata olduğu anlamına gelmez. Aslında, yapısı hafif, kolay paralel hale getirilebilen ve teşvik edici görev türlerinde, merkeziyetsizlik eğitimi belirgin bir uygulama potansiyeli göstermektedir. Bunlar arasında, ancak bunlarla sınırlı olmamak kaydıyla: LoRA ince ayarı, ) RLHF gibi davranış uyumu sonrası eğitim görevleri, ( DPO, veri kalabalığı eğitim ve etiketleme görevleri, kaynak kontrol edilebilir küçük temel model eğitimi ve kenar cihazların katıldığı işbirlikçi eğitim senaryoları yer almaktadır. Bu görevler genel olarak yüksek paralelizm, düşük bağlılık ve heterojen hesaplama gücüne tolerans özelliklerine sahiptir ve P2P ağları, Swarm protokolleri, dağıtık optimizatörler gibi yöntemlerle işbirlikçi eğitim için oldukça uygundur.
![Crypto AI'nin Kutsal Kâsesi: Merkeziyetsizlik Eğitiminin Sınırları])https://img-cdn.gateio.im/webp-social/moments-adb92bc4dfbaf26863cb0b4bb1081cd7.webp(
Merkeziyetsizlik eğitim klasik proje analizi
Şu anda Merkeziyetsizlik eğitim ve federatif öğrenme öncülüğünde, temsilci blockchain projeleri arasında Prime Intellect, Pluralis.ai, Gensyn, Nous Research ve Flock.io bulunmaktadır. Teknik yenilikçilik ve mühendislik uygulama zorluğu açısından, Prime Intellect, Nous Research ve Pluralis.ai sistem mimarisi ve algoritma tasarımı konusunda birçok özgün keşif önermiştir ve mevcut teorik araştırmaların öncü yönlerini temsil etmektedir; Gensyn ve Flock.io'nun uygulama yolları ise görece daha net olup, ilk mühendislik ilerlemeleri görülmektedir. Bu makalede, bu beş projenin arkasındaki temel teknolojiler ve mühendislik mimarileri sırayla analiz edilecek ve Merkeziyetsizlik AI eğitim sistemindeki farklılıkları ve tamamlayıcı ilişkileri daha da tartışacaktır.
) Prime Intellect: Eğitilen izlerin doğrulanabilir güçlendirme öğrenme işbirliği ağı öncüsü
Prime Intellect, güvene ihtiyaç duymayan bir AI eğitim ağı inşa etmeye adanmıştır; böylece herkes eğitim sürecine katılabilir ve hesaplama katkıları için güvenilir ödüller alabilir. Prime Intellect, PRIME-RL + TOPLOC + SHARDCAST üç ana modülü aracılığıyla, doğrulanabilirlik, açıklık ve teşvik mekanizmalarının tamamlandığı merkeziyetsiz bir AI eğitim sistemi oluşturmayı hedeflemektedir.
01, Prime Intellect protokol yığını yapısı ve ana modül değerleri
![Crypto AI'nin Kutsal Kasesi: Merkeziyetsizlikte Eğitimdeki Öncü Keşif]###https://img-cdn.gateio.im/webp-social/moments-69eb6c2dab3d6284b890285c71e7a47f.webp(
)# 02, Prime Intellect eğitim ana mekanizması ayrıntılı açıklaması
#PRIME-RL: Ayrık Asenkron Pekiştirme Öğrenme Görev Mimarisi
PRIME-RL, Prime Intellect tarafından Merkeziyetsizlik eğitim senaryoları için özel olarak tasarlanmış bir görev modelleme ve yürütme çerçevesidir ve heterojen ağlar ile eşzamanlı katılımcılar için özel olarak tasarlanmıştır. Güçlendirilmiş öğrenmeyi öncelikli uyum nesnesi olarak kullanır, eğitim, çıkarım ve ağırlık yükleme süreçlerini yapısal olarak ayrıştırır, böylece her eğitim düğümü yerel olarak bağımsız olarak görev döngüsünü tamamlayabilir ve standart arayüzler aracılığıyla doğrulama ve toplama mekanizmaları ile iş birliği yapabilir. Geleneksel denetimli öğrenme süreçlerine kıyasla, PRIME-RL merkezi bir zamanlayıcı olmayan ortamlarda esnek eğitimi gerçekleştirmek için daha uygundur, bu hem sistem karmaşıklığını azaltır hem de çoklu görev paralelliğini ve strateji evrimini desteklemek için bir temel oluşturur.
![Crypto AI'nin Kutsal Kâsesi: Merkeziyetsizlik Eğitiminin Sınırları]###https://img-cdn.gateio.im/webp-social/moments-b11af8d10db6e8baa0c19e87aa18dd82.webp(
#TOPLOC:Hafif Ağırlıklı Eğitim Davranış Doğrulama Mekanizması
TOPLOC)Güvenilir Gözlem & Politika-Yerellik Kontrolü(, Prime Intellect tarafından önerilen, bir düğümün gerçekten gözlem verilerine dayalı olarak etkili bir strateji öğrenimi gerçekleştirip gerçekleştirmediğini belirlemek için kullanılan eğitimde doğrulanabilirlik çekirdek mekanizmasıdır. ZKML gibi ağır çözümlerden farklı olarak, TOPLOC, tüm modeli yeniden hesaplamaya dayanmaz, bunun yerine "gözlem dizisi↔strateji güncelleme" arasındaki yerel tutarlılık izini analiz ederek hafif yapı doğrulamasını tamamlar. Eğitim sürecindeki davranış izlerini doğrulanabilir nesnelere dönüştüren ilk uygulamadır ve güvene dayanmayan eğitim ödül dağıtımını sağlamak için kritik bir yenilik olup, denetlenebilir ve teşvik edilebilir merkeziyetsizlik işbirlikçi eğitim ağı inşası için uygulanabilir bir yol sunmaktadır.
![Crypto AI'nin Kutsal Kâsesi: Merkeziyetsizlik eğitiminde öncü keşif])https://img-cdn.gateio.im/webp-social/moments-0a322ea8b70c3d00d8d99606559c1864.webp(
#SHARDCAST: Asenkron Ağırlık Birleştirme ve Yayılma Protokolü
SHARDCAST, Prime Intellect tarafından tasarlanan ağırlık yayılımı ve toplama protokolüdür, asenkron, bant genişliği kısıtlı ve düğüm durumu değişken gerçek ağ ortamları için optimize edilmiştir. Gossip yayılım mekanizması ile yerel senkronizasyon stratejisini birleştirerek, birden fazla düğümün senkronize olmayan durumlarda sürekli olarak kısmi güncellemeler göndermesine izin verir, ağırlıkların kademeli olarak yakınsamasını ve çoklu versiyon evrimini sağlar. Merkezi veya senkronize AllReduce yöntemlerine kıyasla, SHARDCAST, Merkeziyetsizlik eğitiminin ölçeklenebilirliğini ve hata toleransını önemli ölçüde artırır, istikrarlı ağırlık konsensüsü ve sürekli eğitim iterasyonu için temel bir yapı taşını oluşturur.
![Crypto AI'nın Kutsal Kâsesi: Merkeziyetsizlik Eğitiminde Sınırları Zorlamak])https://img-cdn.gateio.im/webp-social/moments-f86b109da66a0a4c9239221650a4a0a8.webp(
#OpenDiLoCo: Seyrek Asenkron İletişim Çerçevesi
OpenDiLoCo, Prime Intellect ekibinin DeepMind tarafından önerilen DiLoCo anlayışını bağımsız olarak gerçekleştirdiği ve açık kaynak olarak sunduğu bir iletişim optimizasyon çerçevesidir. Bu çerçeve, merkeziyetsizlik eğitiminde yaygın olarak karşılaşılan bant genişliği kısıtlılığı, cihaz heterojenliği ve düğüm istikrarsızlığı gibi zorluklar için özel olarak tasarlanmıştır. Mimari, veri paralelliğine dayanmakta olup, Ring, Expander, Small-World gibi seyrek topoloji yapıları oluşturarak, küresel senkronizasyonun yüksek iletişim maliyetlerini önler ve yalnızca yerel komşu düğümlere bağımlı kalarak model işbirliği eğitimini tamamlar. Asenkron güncellemeler ve kesinti tolerans mekanizması ile bir araya getirildiğinde, OpenDiLoCo, tüketici sınıfı GPU’ların ve kenar cihazlarının eğitim görevlerine istikrarlı bir şekilde katılmasını sağlar, küresel işbirliği eğitimine katılabilirliği önemli ölçüde artırır ve merkeziyetsizlik eğitim ağı inşa etmek için kritik bir iletişim altyapılarından biri haline gelir.
#PCCL: İşbirliği İletişim Kütüphanesi
PCCL)Prime Collective Communication Library(, Prime Intellect tarafından Merkeziyetsizlik AI eğitim ortamı için özel olarak tasarlanmış hafif bir iletişim kütüphanesidir ve NCCL, Gloo) gibi geleneksel iletişim kütüphanelerinin heterojen cihazlarda ve düşük bant genişliğine sahip ağlardaki uyum sorunlarını çözmeyi amaçlamaktadır. PCCL, seyrek topolojiyi, gradyan sıkıştırmayı, düşük hassasiyetli senkronizasyonu ve kesintiden geri yüklemeyi destekler, tüketici sınıfı GPU'larda ve kararsız düğümlerde çalışabilir, OpenDiLoCo protokolünün asenkron iletişim yeteneklerini destekleyen temel bileşendir. Eğitim ağının bant genişliği toleransını ve cihaz uyumluluğunu önemli ölçüde artırır, gerçekten açık ve güvene ihtiyaç duymayan işbirlikçi eğitim ağlarını kurmanın "son mil" iletişim temelini sağlamlaştırır.
(# 03, Prime Intellect teşvik ağı ve rol dağılımı
Prime Intellect, herkesin görevlere katılabileceği ve gerçek katkılara dayalı ödüller alabileceği, izin gerektirmeyen, doğrulanabilir ve ekonomik teşvik mekanizmasına sahip bir eğitim ağı inşa etti. Protokol, üç ana rolün etrafında çalışır:
Görev başlatıcısı: Eğitim ortamını, başlangıç modelini, ödül fonksiyonunu ve doğrulama standartlarını tanımlar.
Eğitim düğümü: Yerel eğitim gerçekleştirin, ağırlık güncellemelerini ve gözlem izini gönderin
Doğrulama Düğümleri: Eğitim davranışının gerçekliğini doğrulamak için TOPLOC mekanizmasını kullanır ve ödül hesaplaması ile strateji birleştirmeye katılır.
Protokolün ana süreçleri, görev yayınlama, düğüm eğitimi, iz doğrulama, ağırlık birleştirme )SHARDCAST### ve ödül dağıtımını içerir ve "gerçek eğitim davranışı" etrafında bir yapı oluşturur.
This page may contain third-party content, which is provided for information purposes only (not representations/warranties) and should not be considered as an endorsement of its views by Gate, nor as financial or professional advice. See Disclaimer for details.
21 Likes
Reward
21
5
Share
Comment
0/400
CoinBasedThinking
· 07-22 13:38
Web3 acemisi gerçekten AI'yi anladı
View OriginalReply0
RugDocScientist
· 07-21 10:28
Ah, dört tür antrenman yöntemi beni başım döndürecek.
View OriginalReply0
BlockchainWorker
· 07-21 10:21
Makale yazmak, oldukça derin.
View OriginalReply0
ProveMyZK
· 07-21 10:19
Bu kaynak tüketimi çok fazla, fakirler bunu nerede oynayabilir?
Merkeziyetsizlik AI eğitiminin öncü keşifleri: teoriden pratiğe
Crypto AI'nin Kutsal Kasesi: Merkeziyetsizlik Eğitiminin Sınırlarını Keşfetmek
AI'nin tüm değer zincirinde, model eğitimi en fazla kaynak tüketen, en yüksek teknik engel içeren aşamadır ve doğrudan modelin kapasite sınırını ve pratik uygulama etkisini belirler. Çıkarım aşamasının hafif çağrımlarına kıyasla, eğitim süreci sürekli olarak büyük ölçekli hesaplama gücü yatırımı, karmaşık veri işleme süreçleri ve yüksek yoğunluklu optimizasyon algoritmaları desteği gerektirir; bu, AI sistemlerinin inşası için gerçek bir "ağır sanayi"dir. Mimari paradigmalar açısından, eğitim yöntemleri dört kategoriye ayrılabilir: merkezi eğitim, dağıtık eğitim, federatif öğrenme ve bu makalede odaklanılan Merkeziyetsizlik eğitimi.
Merkeziyetsizlik eğitimi, tek bir kurumun yerel yüksek performanslı kümeler içinde tüm eğitim sürecini tamamladığı en yaygın geleneksel yöntemdir; donanım, alt yazılım, küme zamanlama sistemi ve eğitim çerçevesi gibi tüm bileşenler tek bir kontrol sistemi tarafından koordine edilir. Bu derin iş birliği mimarisi, bellek paylaşımı, gradyan senkronizasyonu ve hata toleransı mekanizmalarının verimliliğini en üst düzeye çıkarır ve GPT, Gemini gibi büyük ölçekli modellerin eğitimi için oldukça uygundur. Yüksek verimlilik ve kaynak kontrolü avantajlarına sahipken, aynı zamanda veri tekelciliği, kaynak engelleri, enerji tüketimi ve tek nokta riski gibi sorunlar da taşımaktadır.
Dağıtık eğitim, günümüzde büyük model eğitiminin ana akım yöntemidir; bunun temelinde model eğitim görevlerinin parçalanarak birden fazla makineye dağıtılması ve birlikte çalıştırılması yatar, bu sayede tek bir makinenin hesaplama ve depolama darboğazlarını aşmak mümkün olur. Fiziksel olarak "dağıtık" özelliklere sahip olmasına rağmen, genel olarak merkezi bir kuruluş tarafından kontrol edilmekte ve senkronize edilmektedir; genellikle yüksek hızlı yerel ağ ortamlarında çalışmakta, NVLink yüksek hızlı bağlantı teknolojisi aracılığıyla ana düğüm, çeşitli alt görevleri koordine etmektedir. Ana akım yöntemler şunları içermektedir:
Dağıtık eğitim, "merkezî kontrol + dağıtık yürütme" kombinasyonudur; aynı patronun uzaktan birden fazla "ofis" çalışanını iş birliği yaparak görevleri tamamlamasıyla benzerlik gösterir. Şu anda neredeyse tüm ana akım büyük modeller (GPT-4, Gemini, LLaMA vb. ) bu yöntemle eğitim tamamlamaktadır.
Merkeziyetsizlik eğitimi, daha açık ve sansüre dirençli bir gelecek yolu temsil eder. Temel özellikleri şunlardır: Birbirine güvenmeyen birden fazla düğüm (, ev bilgisayarları, bulut GPU'ları veya kenar cihazları ), merkezi bir koordinatör olmadan eğitim görevlerini işbirliği içinde tamamlayabilir, genellikle protokoller aracılığıyla görev dağılımı ve işbirliği sağlanır, katkının dürüstlüğünü garanti etmek için şifreli teşvik mekanizmaları kullanılır. Bu modelin karşılaştığı ana zorluklar şunlardır:
Merkeziyetsizlik eğitimi, dünya genelindeki gönüllülerin her birinin hesap gücünü katkıda bulunarak model eğitimi yaptığı bir süreç olarak anlaşılabilir. Ancak "gerçekten uygulanabilir büyük ölçekli merkeziyetsizlik eğitimi" hala sistematik bir mühendislik zorluğudur; sistem mimarisi, iletişim protokolleri, kriptografik güvenlik, ekonomik mekanizmalar, model doğrulama gibi birçok alanı kapsamaktadır. Ancak "işbirliği etkin + dürüstlüğü teşvik etme + sonuçların doğruluğu" konuları hala erken prototip keşif aşamasındadır.
Federated öğrenme, dağıtılmışlık ile Merkeziyetsizlik arasında bir geçiş biçimi olarak, verilerin yerel olarak saklanmasını ve model parametrelerinin merkezi bir şekilde toplanmasını vurgular, gizlilik uyumuna önem verilen senaryolar için uygundur (, örneğin sağlık ve finans ). Federated öğrenme, dağıtılmış eğitim mühendislik yapısına ve yerel işbirliği yeteneğine sahipken, aynı zamanda Merkeziyetsizlik eğitiminin veri dağıtım avantajlarını da taşır, ancak yine de güvenilir bir koordinatöre bağımlıdır ve tamamen açık ve sansüre dayanıklı özelliklere sahip değildir. Gizlilik uyumu senaryolarında "kontrollü merkeziyetsizlik" çözümü olarak görülebilir; eğitim görevleri, güven yapısı ve iletişim mekanizması açısından oldukça ılımlıdır ve endüstride geçiş aşaması olarak daha uygundur.
Merkeziyetsizlik eğitiminin sınırları, fırsatları ve gerçek yolları
Eğitim paradigması açısından, merkeziyetsiz eğitim tüm görev türleri için uygun değildir. Bazı senaryolar, görev yapısının karmaşık olması, kaynak gereksinimlerinin son derece yüksek olması veya işbirliği zorluğu gibi nedenlerle, doğal olarak heterojen, güvenilmeyen düğümler arasında verimli bir şekilde tamamlanmak için uygun değildir. Örneğin, büyük model eğitimi genellikle yüksek bellek, düşük gecikme ve yüksek bant genişliği gerektirir ve açık ağda etkili bir şekilde bölünmesi ve senkronize edilmesi zordur; veri gizliliği ve egemenlik kısıtlamaları güçlü olan görevler (, sağlık, finans gibi, yasal uyum ve etik kısıtlamalar nedeniyle açık bir şekilde paylaşılamaz; işbirliği teşvik temeli eksik olan görevler ), şirket kapalı kaynak modelleri veya dahili prototip eğitimi ( ise dış katılım motivasyonundan yoksundur. Bu sınırlar, mevcut merkeziyetsiz eğitimin gerçek kısıtlamalarını oluşturmaktadır.
Ancak bu, merkeziyetsizlik eğitimlerinin bir safsata olduğu anlamına gelmez. Aslında, yapısı hafif, kolay paralel hale getirilebilen ve teşvik edici görev türlerinde, merkeziyetsizlik eğitimi belirgin bir uygulama potansiyeli göstermektedir. Bunlar arasında, ancak bunlarla sınırlı olmamak kaydıyla: LoRA ince ayarı, ) RLHF gibi davranış uyumu sonrası eğitim görevleri, ( DPO, veri kalabalığı eğitim ve etiketleme görevleri, kaynak kontrol edilebilir küçük temel model eğitimi ve kenar cihazların katıldığı işbirlikçi eğitim senaryoları yer almaktadır. Bu görevler genel olarak yüksek paralelizm, düşük bağlılık ve heterojen hesaplama gücüne tolerans özelliklerine sahiptir ve P2P ağları, Swarm protokolleri, dağıtık optimizatörler gibi yöntemlerle işbirlikçi eğitim için oldukça uygundur.
![Crypto AI'nin Kutsal Kâsesi: Merkeziyetsizlik Eğitiminin Sınırları])https://img-cdn.gateio.im/webp-social/moments-adb92bc4dfbaf26863cb0b4bb1081cd7.webp(
Merkeziyetsizlik eğitim klasik proje analizi
Şu anda Merkeziyetsizlik eğitim ve federatif öğrenme öncülüğünde, temsilci blockchain projeleri arasında Prime Intellect, Pluralis.ai, Gensyn, Nous Research ve Flock.io bulunmaktadır. Teknik yenilikçilik ve mühendislik uygulama zorluğu açısından, Prime Intellect, Nous Research ve Pluralis.ai sistem mimarisi ve algoritma tasarımı konusunda birçok özgün keşif önermiştir ve mevcut teorik araştırmaların öncü yönlerini temsil etmektedir; Gensyn ve Flock.io'nun uygulama yolları ise görece daha net olup, ilk mühendislik ilerlemeleri görülmektedir. Bu makalede, bu beş projenin arkasındaki temel teknolojiler ve mühendislik mimarileri sırayla analiz edilecek ve Merkeziyetsizlik AI eğitim sistemindeki farklılıkları ve tamamlayıcı ilişkileri daha da tartışacaktır.
) Prime Intellect: Eğitilen izlerin doğrulanabilir güçlendirme öğrenme işbirliği ağı öncüsü
Prime Intellect, güvene ihtiyaç duymayan bir AI eğitim ağı inşa etmeye adanmıştır; böylece herkes eğitim sürecine katılabilir ve hesaplama katkıları için güvenilir ödüller alabilir. Prime Intellect, PRIME-RL + TOPLOC + SHARDCAST üç ana modülü aracılığıyla, doğrulanabilirlik, açıklık ve teşvik mekanizmalarının tamamlandığı merkeziyetsiz bir AI eğitim sistemi oluşturmayı hedeflemektedir.
01, Prime Intellect protokol yığını yapısı ve ana modül değerleri
![Crypto AI'nin Kutsal Kasesi: Merkeziyetsizlikte Eğitimdeki Öncü Keşif]###https://img-cdn.gateio.im/webp-social/moments-69eb6c2dab3d6284b890285c71e7a47f.webp(
)# 02, Prime Intellect eğitim ana mekanizması ayrıntılı açıklaması
#PRIME-RL: Ayrık Asenkron Pekiştirme Öğrenme Görev Mimarisi
PRIME-RL, Prime Intellect tarafından Merkeziyetsizlik eğitim senaryoları için özel olarak tasarlanmış bir görev modelleme ve yürütme çerçevesidir ve heterojen ağlar ile eşzamanlı katılımcılar için özel olarak tasarlanmıştır. Güçlendirilmiş öğrenmeyi öncelikli uyum nesnesi olarak kullanır, eğitim, çıkarım ve ağırlık yükleme süreçlerini yapısal olarak ayrıştırır, böylece her eğitim düğümü yerel olarak bağımsız olarak görev döngüsünü tamamlayabilir ve standart arayüzler aracılığıyla doğrulama ve toplama mekanizmaları ile iş birliği yapabilir. Geleneksel denetimli öğrenme süreçlerine kıyasla, PRIME-RL merkezi bir zamanlayıcı olmayan ortamlarda esnek eğitimi gerçekleştirmek için daha uygundur, bu hem sistem karmaşıklığını azaltır hem de çoklu görev paralelliğini ve strateji evrimini desteklemek için bir temel oluşturur.
![Crypto AI'nin Kutsal Kâsesi: Merkeziyetsizlik Eğitiminin Sınırları]###https://img-cdn.gateio.im/webp-social/moments-b11af8d10db6e8baa0c19e87aa18dd82.webp(
#TOPLOC:Hafif Ağırlıklı Eğitim Davranış Doğrulama Mekanizması
TOPLOC)Güvenilir Gözlem & Politika-Yerellik Kontrolü(, Prime Intellect tarafından önerilen, bir düğümün gerçekten gözlem verilerine dayalı olarak etkili bir strateji öğrenimi gerçekleştirip gerçekleştirmediğini belirlemek için kullanılan eğitimde doğrulanabilirlik çekirdek mekanizmasıdır. ZKML gibi ağır çözümlerden farklı olarak, TOPLOC, tüm modeli yeniden hesaplamaya dayanmaz, bunun yerine "gözlem dizisi↔strateji güncelleme" arasındaki yerel tutarlılık izini analiz ederek hafif yapı doğrulamasını tamamlar. Eğitim sürecindeki davranış izlerini doğrulanabilir nesnelere dönüştüren ilk uygulamadır ve güvene dayanmayan eğitim ödül dağıtımını sağlamak için kritik bir yenilik olup, denetlenebilir ve teşvik edilebilir merkeziyetsizlik işbirlikçi eğitim ağı inşası için uygulanabilir bir yol sunmaktadır.
![Crypto AI'nin Kutsal Kâsesi: Merkeziyetsizlik eğitiminde öncü keşif])https://img-cdn.gateio.im/webp-social/moments-0a322ea8b70c3d00d8d99606559c1864.webp(
#SHARDCAST: Asenkron Ağırlık Birleştirme ve Yayılma Protokolü
SHARDCAST, Prime Intellect tarafından tasarlanan ağırlık yayılımı ve toplama protokolüdür, asenkron, bant genişliği kısıtlı ve düğüm durumu değişken gerçek ağ ortamları için optimize edilmiştir. Gossip yayılım mekanizması ile yerel senkronizasyon stratejisini birleştirerek, birden fazla düğümün senkronize olmayan durumlarda sürekli olarak kısmi güncellemeler göndermesine izin verir, ağırlıkların kademeli olarak yakınsamasını ve çoklu versiyon evrimini sağlar. Merkezi veya senkronize AllReduce yöntemlerine kıyasla, SHARDCAST, Merkeziyetsizlik eğitiminin ölçeklenebilirliğini ve hata toleransını önemli ölçüde artırır, istikrarlı ağırlık konsensüsü ve sürekli eğitim iterasyonu için temel bir yapı taşını oluşturur.
![Crypto AI'nın Kutsal Kâsesi: Merkeziyetsizlik Eğitiminde Sınırları Zorlamak])https://img-cdn.gateio.im/webp-social/moments-f86b109da66a0a4c9239221650a4a0a8.webp(
#OpenDiLoCo: Seyrek Asenkron İletişim Çerçevesi
OpenDiLoCo, Prime Intellect ekibinin DeepMind tarafından önerilen DiLoCo anlayışını bağımsız olarak gerçekleştirdiği ve açık kaynak olarak sunduğu bir iletişim optimizasyon çerçevesidir. Bu çerçeve, merkeziyetsizlik eğitiminde yaygın olarak karşılaşılan bant genişliği kısıtlılığı, cihaz heterojenliği ve düğüm istikrarsızlığı gibi zorluklar için özel olarak tasarlanmıştır. Mimari, veri paralelliğine dayanmakta olup, Ring, Expander, Small-World gibi seyrek topoloji yapıları oluşturarak, küresel senkronizasyonun yüksek iletişim maliyetlerini önler ve yalnızca yerel komşu düğümlere bağımlı kalarak model işbirliği eğitimini tamamlar. Asenkron güncellemeler ve kesinti tolerans mekanizması ile bir araya getirildiğinde, OpenDiLoCo, tüketici sınıfı GPU’ların ve kenar cihazlarının eğitim görevlerine istikrarlı bir şekilde katılmasını sağlar, küresel işbirliği eğitimine katılabilirliği önemli ölçüde artırır ve merkeziyetsizlik eğitim ağı inşa etmek için kritik bir iletişim altyapılarından biri haline gelir.
#PCCL: İşbirliği İletişim Kütüphanesi
PCCL)Prime Collective Communication Library(, Prime Intellect tarafından Merkeziyetsizlik AI eğitim ortamı için özel olarak tasarlanmış hafif bir iletişim kütüphanesidir ve NCCL, Gloo) gibi geleneksel iletişim kütüphanelerinin heterojen cihazlarda ve düşük bant genişliğine sahip ağlardaki uyum sorunlarını çözmeyi amaçlamaktadır. PCCL, seyrek topolojiyi, gradyan sıkıştırmayı, düşük hassasiyetli senkronizasyonu ve kesintiden geri yüklemeyi destekler, tüketici sınıfı GPU'larda ve kararsız düğümlerde çalışabilir, OpenDiLoCo protokolünün asenkron iletişim yeteneklerini destekleyen temel bileşendir. Eğitim ağının bant genişliği toleransını ve cihaz uyumluluğunu önemli ölçüde artırır, gerçekten açık ve güvene ihtiyaç duymayan işbirlikçi eğitim ağlarını kurmanın "son mil" iletişim temelini sağlamlaştırır.
(# 03, Prime Intellect teşvik ağı ve rol dağılımı
Prime Intellect, herkesin görevlere katılabileceği ve gerçek katkılara dayalı ödüller alabileceği, izin gerektirmeyen, doğrulanabilir ve ekonomik teşvik mekanizmasına sahip bir eğitim ağı inşa etti. Protokol, üç ana rolün etrafında çalışır:
Protokolün ana süreçleri, görev yayınlama, düğüm eğitimi, iz doğrulama, ağırlık birleştirme )SHARDCAST### ve ödül dağıtımını içerir ve "gerçek eğitim davranışı" etrafında bir yapı oluşturur.