الكأس المقدسة للذكاء الاصطناعي في العملات الرقمية: استكشاف الحدود للتدريب اللامركزي
في سلسلة القيمة الكاملة للذكاء الاصطناعي، يُعتبر تدريب النموذج هو المرحلة الأكثر استهلاكًا للموارد والأعلى من حيث العوائق التقنية، حيث يحدد مباشرة الحد الأقصى لقدرات النموذج وفعالية تطبيقه الفعلية. بالمقارنة مع الاستدعاءات الخفيفة في مرحلة الاستدلال، تتطلب عملية التدريب استثمارًا مستمرًا في قوة الحوسبة الكبيرة، وعمليات معالجة بيانات معقدة، ودعم خوارزميات تحسين عالية الكثافة، مما يجعلها "الصناعة الثقيلة" الحقيقية لبناء أنظمة الذكاء الاصطناعي. من حيث نمط البنية، يمكن تصنيف طرق التدريب إلى أربع فئات: التدريب المركزي، التدريب الموزع، التعلم الفيدرالي، والتدريب اللامركزي الذي يتم التركيز عليه في هذه المقالة.
تعتبر عملية التدريب المركزية هي الطريقة التقليدية الأكثر شيوعًا، حيث يتم تنفيذ جميع عمليات التدريب من قبل مؤسسة واحدة داخل مجموعة عالية الأداء محليًا، حيث يتم تنسيق تشغيل جميع مكونات الأجهزة والبرامج الأساسية ونظام جدولة المجموعة وإطار التدريب بواسطة نظام تحكم موحد. تتيح هذه المعمارية المتكاملة الكفاءة المثلى لمشاركة الذاكرة ومزامنة التدرجات وآليات تحمل الأخطاء، مما يجعلها مناسبة جدًا لتدريب النماذج الكبيرة مثل GPT وGemini، وتتميز بكفاءتها العالية وقابلية التحكم في الموارد، ولكنها تعاني في الوقت نفسه من مشاكل احتكار البيانات، وحواجز الموارد، واستهلاك الطاقة، ومخاطر النقاط الفردية.
التدريب الموزع هو الطريقة السائدة حاليًا في تدريب النماذج الكبيرة، حيث يكمن جوهره في تقسيم مهمة تدريب النموذج إلى مهام أصغر وتوزيعها على عدة آلات للتنفيذ التعاوني، لتجاوز قيود حسابات وتخزين الآلة الواحدة. على الرغم من أن لديها خصائص "اللامركزية" من الناحية الفيزيائية، إلا أن المجموعة لا تزال تحت سيطرة مؤسسة مركزية للتحكم في الجدولة والمزامنة، وغالبًا ما تعمل في بيئة شبكة محلية سريعة، من خلال تقنية ناقل الاتصال السريع NVLink، حيث يقوم العقدة الرئيسية بتنسيق المهام الفرعية بشكل موحد. تشمل الطرق الرئيسية:
التوازي البياني: كل عقدة تدرب معلمات بيانات مختلفة تتم مشاركة الوزن النموذجي، يجب مطابقتها
التوازي في النموذج: نشر أجزاء مختلفة من النموذج على عقد مختلفة لتحقيق توسع قوي
الأنابيب المتوازية: التنفيذ التسلسلي على مراحل، مما يزيد من معدل النقل
توازي المصفوفات: تقسيم دقيق لحساب المصفوفات، لتحسين درجة التوازي
التدريب الموزع هو مزيج من "التحكم المركزي + التنفيذ الموزع"، يشبه توجيه نفس المدير لعدة "مكاتب" من الموظفين للعمل معًا لإكمال المهام. حاليًا، يتم تدريب جميع النماذج الكبيرة السائدة تقريبًا بهذه الطريقة.
تدريب اللامركزية يمثل مسارًا مستقبليًا أكثر انفتاحًا وخصائص مقاومة للرقابة. تتمثل ميزته الأساسية في: عدة عقد غير موثوقة تتعاون لإكمال مهام التدريب دون منسق مركزي، وعادةً ما يتم دفع توزيع المهام والتعاون من خلال البروتوكولات، وبدعم من آلية تحفيز مشفرة لضمان نزاهة المساهمات. التحديات الرئيسية التي يواجهها هذا النموذج تشمل:
صعوبة التوافق بين الأجهزة المتنوعة وتقسيم المهام: صعوبة التنسيق بين الأجهزة المتنوعة، وانخفاض كفاءة تقسيم المهام
عائق كفاءة الاتصال: الاتصال الشبكي غير مستقر، وعائق تزامن التدرج واضح
نقص التنفيذ الموثوق: عدم وجود بيئة تنفيذ موثوقة، مما يجعل من الصعب التحقق مما إذا كانت العقدة تشارك فعليًا في الحساب.
نقص التنسيق الموحد: لا يوجد جهاز تحكم مركزي، توزيع المهام وآلية التراجع عن الاستثناءات معقدة
يمكن فهم التدريب اللامركزي على أنه: مجموعة من المتطوعين العالميين، يساهم كل منهم بقوة الحوسبة لتدريب النموذج بشكل تعاوني، لكن "التدريب اللامركزي الكبير القابل للتطبيق حقًا" لا يزال يمثل تحديًا هندسيًا نظاميًا، ويتعلق ببنية النظام، بروتوكولات الاتصال، أمان التشفير، الآليات الاقتصادية، والتحقق من النموذج، لكن ما إذا كان يمكن "التعاون بفعالية + تحفيز النزاهة + الحصول على نتائج صحيحة" لا يزال في مرحلة استكشاف النموذج الأولي المبكر.
تعتبر التعلم الفيدرالي شكلاً انتقالياً بين التوزيع واللامركزية، حيث يركز على الاحتفاظ بالبيانات محليًا، وتجميع معلمات النموذج مركزيًا، وهو مناسب للسيناريوهات التي تركز على الامتثال للخصوصية. يتميز التعلم الفيدرالي بالهيكل الهندسي للتدريب الموزع وقدرته على التعاون المحلي، بينما يتمتع أيضًا بميزة توزيع البيانات في التدريب اللامركزي، ولكنه لا يزال يعتمد على جهة تنسيق موثوقة، ولا يتمتع بخصائص الانفتاح الكامل ومقاومة الرقابة. يمكن اعتباره نوعًا من "اللامركزية المراقبة" في سيناريو الامتثال للخصوصية، حيث تكون مهام التدريب، وهياكل الثقة، وآليات الاتصال متوازنة نسبيًا، مما يجعله أكثر ملاءمة كنموذج نشر انتقالي في الصناعة.
حدود التدريب اللامركزي، الفرص والمسارات الواقعية
من حيث نمط التدريب، فإن التدريب اللامركزي لا يناسب جميع أنواع المهام. في بعض السيناريوهات، بسبب تعقيد هيكل المهمة، وارتفاع متطلبات الموارد، أو صعوبة التعاون، فمن الطبيعي أنه لا يصلح لإكماله بشكل فعال بين العقد غير المتجانسة والموثوقة. على سبيل المثال، يعتمد تدريب النماذج الكبيرة غالبًا على ذاكرة عالية، وزمن تأخير منخفض، وعرض نطاق ترددي عالٍ، مما يجعل من الصعب تقسيمه ومزامنته بشكل فعال في الشبكات المفتوحة؛ وتكون المهام التي تخضع لقيود صارمة على الخصوصية والامتثال القانوني والأخلاقي غير قادرة على المشاركة المفتوحة؛ بينما تفتقر المهام التي تفتقر إلى حوافز التعاون إلى دوافع المشاركة الخارجية. تشكل هذه الحدود مجتمعة القيود الواقعية الحالية للتدريب اللامركزي.
لكن هذا لا يعني أن التدريب اللامركزي هو مفهوم زائف. في الواقع، يظهر التدريب اللامركزي آفاق تطبيق واضحة في أنواع المهام التي تتميز بخفة الهيكل، وسهولة التوازي، والتحفيز. بما في ذلك، ولكن لا تقتصر على: ضبط LoRA، ومهام التدريب اللاحقة المتوافقة مع السلوك، وتدريب البيانات الجماعية ومهام التسمية، وتدريب النماذج الأساسية الصغيرة القابلة للتحكم في الموارد، بالإضافة إلى سيناريوهات التدريب التعاوني بمشاركة الأجهزة الطرفية. تتمتع هذه المهام بخصائص التوازي العالي، وانخفاض الترابط، وتحمل القدرات الحاسوبية غير المتجانسة، مما يجعلها مناسبة جداً للتدريب التعاوني من خلال الشبكات P2P، وبروتوكولات Swarm، والمحسنات الموزعة.
تحليل مشاريع التدريب الكلاسيكية اللامركزية
في الوقت الحالي، تشمل المشاريع البارزة في مجال التدريب اللامركزي والتعلم الفيدرالي في مجال blockchain بشكل رئيسي Prime Intellect و Pluralis.ai و Gensyn و Nous Research و Flock.io. من حيث الابتكار التكنولوجي وصعوبة التنفيذ الهندسي، قدمت Prime Intellect و Nous Research و Pluralis.ai العديد من الاستكشافات الأصلية في تصميم النظام والخوارزميات، مما يمثل الاتجاهات الرائدة في البحث النظري الحالي؛ بينما تعتبر طرق التنفيذ الخاصة بـ Gensyn و Flock.io واضحة نسبيًا، حيث يمكن رؤية تقدم هندسي أولي. ستقوم هذه المقالة بتحليل التقنيات الأساسية والهياكل الهندسية وراء هذه المشاريع الخمسة بالتتابع، وستستكشف المزيد من الاختلافات والعلاقات التكميلية في نظام التدريب اللامركزي للذكاء الاصطناعي.
Prime Intellect: رائد الشبكات التعاونية في التعلم المعزز القابل للتحقق من مسارات التدريب
تسعى Prime Intellect إلى بناء شبكة تدريب ذكاء اصطناعي غير موثوقة، تتيح لأي شخص المشاركة في التدريب، والحصول على مكافآت موثوقة مقابل مساهماته الحسابية. تأمل Prime Intellect في إنشاء نظام تدريب ذكاء اصطناعي اللامركزي ذو قابلية للتحقق، والانفتاح، وآلية تحفيز شاملة من خلال ثلاثة وحدات رئيسية: PRIME-RL + TOPLOC + SHARDCAST.
01، هيكل بروتوكول Prime Intellect والقيمة الأساسية للوحدات الرئيسية
02، شرح آلية التدريب الرئيسية لـ Prime Intellect
#PRIME-RL: هيكل مهمة التعلم المعزز غير المتزامن المفكك
PRIME-RL هو إطار نمذجة وتنفيذ المهام المخصص من Prime Intellect لسيناريوهات التدريب اللامركزية، مصمم خصيصًا للشبكات المتنوعة والمشاركة غير المتزامنة. يعتمد على التعلم المعزز كهدف تكييفي رئيسي، حيث يفصل هيكليًا بين عملية التدريب والاستنتاج وتحميل الأوزان، مما يسمح لكل عقدة تدريب بإكمال حلقة المهام بشكل مستقل محليًا، والتعاون من خلال واجهات موحدة وآليات التحقق والتجميع. بالمقارنة مع عمليات التعلم المراقب التقليدية، يعتبر PRIME-RL أكثر ملاءمة لتحقيق التدريب المرن في بيئات بدون جدولة مركزية، مما يقلل من تعقيد النظام ويضع الأساس لدعم المهام المتعددة بشكل متوازي وتطور الاستراتيجيات.
#TOPLOC:آلية تحقق سلوك التدريب الخفيف
TOPLOC هو آلية أساسية للتحقق من القابلية للتدريب التي اقترحها Prime Intellect، تُستخدم لتحديد ما إذا كان العقدة قد أكملت فعليًا تعلم استراتيجية فعالة بناءً على بيانات المراقبة. على عكس الحلول الثقيلة مثل ZKML، لا يعتمد TOPLOC على إعادة حساب النموذج بالكامل، بل يُكمل التحقق الهيكلي الخفيف من خلال تحليل "تسلسل المراقبة ↔ تحديث الاستراتيجية" بين مسارات الاتساق المحلي. إنه يحول للمرة الأولى مسارات السلوك أثناء عملية التدريب إلى كائنات قابلة للتحقق، وهو الابتكار الرئيسي لتحقيق توزيع مكافآت التدريب بدون ثقة، مما يوفر طريقًا قابلاً للتطبيق لبناء شبكة تدريب تعاونية لامركزية قابلة للتدقيق والتحفيز.
#SHARDCAST: بروتوكول تجميع ونشر الوزن غير المتزامن
SHARDCAST هو بروتوكول لنشر الوزن وتجميعه مصمم من قبل Prime Intellect، ومُحسن خصيصًا للبيئات الشبكية الحقيقية التي تتميز بالتأخير، وقيود النطاق الترددي، وتغير حالة العقد. يجمع بين آلية نشر gossip واستراتيجيات التزامن المحلي، مما يسمح لعدة عقد بتقديم تحديثات جزئية باستمرار في حالات غير متزامنة، مما يحقق التقارب التدريجي للأوزان وتطورات متعددة النسخ. مقارنةً بأساليب AllReduce المركزية أو المتزامنة، يُحسن SHARDCAST بشكل كبير قابلية التوسع والقدرة على تحمل الأخطاء في التدريب اللامركزي، وهو الأساس الرئيسي لبناء توافق مستقر للأوزان والتدريب المستمر.
#OpenDiLoCo: إطار الاتصال غير المتزامن النادر
OpenDiLoCo هو إطار تحسين الاتصالات تم تطويره بشكل مستقل ومفتوح المصدر من قبل فريق Prime Intellect استنادًا إلى مفهوم DiLoCo الذي طرحته DeepMind، وهو مصمم خصيصًا للتحديات الشائعة مثل قيود النطاق الترددي، وتنوع الأجهزة، وعدم استقرار العقد في التدريب اللامركزي. يعتمد هيكله على البيانات المتوازية، من خلال بناء هياكل طوبولوجية متفرقة مثل Ring وExpander وSmall-World، مما يتجنب تكاليف الاتصالات العالية الناتجة عن التزامن العالمي، ويعتمد فقط على العقد المجاورة المحلية لإكمال تدريب النماذج بشكل متعاون. مع الجمع بين التحديثات غير المتزامنة وآلية تحمل النقاط الفاشلة، يسمح OpenDiLoCo لمجموعات GPU الاستهلاكية والأجهزة الطرفية بالمشاركة بشكل مستقر في مهام التدريب، مما يعزز بشكل ملحوظ إمكانية المشاركة في التدريب التعاوني العالمي، ويعتبر أحد البنى التحتية الأساسية للتواصل لبناء شبكة تدريب لامركزية.
#PCCL: مكتبة الاتصالات التعاونية
PCCL هو مكتبة اتصالات خفيفة الوزن مصممة خصيصًا من قبل Prime Intellect لبيئة تدريب AI اللامركزية، تهدف إلى حل عنق الزجاجة في التكيف الذي تعاني منه المكتبات التقليدية في الأجهزة المتنوعة والشبكات منخفضة النطاق الترددي. يدعم PCCL التوبولوجيا المتناثرة، وضغط التدرجات، والتزامن بدقة منخفضة، واستعادة النقاط المقطوعة، ويمكن تشغيله على وحدات معالجة الرسوميات الاستهلاكية والعقد غير المستقرة، وهو المكون الأساسي الذي يدعم قدرة الاتصال غير المتزامن لبروتوكول OpenDiLoCo. لقد زاد بشكل كبير من قدرة تحمل النطاق الترددي لشبكة التدريب وتوافق الأجهزة، مما يمهد الطريق لبناء شبكة تدريب تعاونية حقيقية مفتوحة وغير موثوقة من خلال توفير "آخر كيلومتر" من البنية التحتية للاتصالات.
03، Prime Intellect شبكة التحفيز وتقسيم الأدوار
بني Prime Intellect شبكة تدريب يمكن التحقق منها بدون إذن، مزودة بآلية تحفيزية اقتصادية، مما يسمح لأي شخص بالمشاركة في المهام والحصول على مكافآت بناءً على المساهمات الحقيقية. تعمل البروتوكولات بناءً على ثلاث فئات من الأدوار الأساسية:
عقد تدريب: تنفيذ التدريب المحلي، تقديم تحديثات الوزن ومسارات الملاحظة
عقدة التحقق: استخدام آلية TOPLOC للتحقق من صحة سلوك التدريب والمشاركة في حساب المكافآت وتجميع الاستراتيجيات
تشمل العملية الأساسية للبروتوكول نشر المهام، تدريب العقد، التحقق من المسارات، تجميع الأوزان، وتوزيع المكافآت، مما يشكل حلقة تحفيز حول "السلوك التدريبي الحقيقي".
04، INTELLECT-2: أول نشر لنموذج تدريب قابل للتحقق اللامركزية
أصدرت Prime Intellect في مايو 2025 INTELLECT-2، وهو أول نموذج كبير للتعلم المعزز تم تدريبه بواسطة تعاون عقد لا مركزي غير موثوق به وذو أسلوب غير متزامن، حيث يصل حجم المعلمات إلى 32B. تم تدريب نموذج INTELLECT-2 بالتعاون بين أكثر من 100 عقدة GPU متباينة منتشرة عبر ثلاث قارات، باستخدام بنية غير متزامنة بالكامل، حيث استغرق التدريب أكثر من 400 ساعة، مما يظهر جدوى واستقرار الشبكة التعاونية غير المتزامنة. لا يمثل هذا النموذج مجرد اختراق في الأداء، بل هو أيضًا التطبيق النظامي الأول لنموذج "التدريب هو الإجماع" الذي اقترحته Prime Intellect. يدمج INTELLECT-2 بروتوكولات أساسية مثل PRIME-RL وTOPLOC وSHARDCAST، مما يمثل أول تحقيق للشبكة التدريبية اللامركزية.
قد تحتوي هذه الصفحة على محتوى من جهات خارجية، يتم تقديمه لأغراض إعلامية فقط (وليس كإقرارات/ضمانات)، ولا ينبغي اعتباره موافقة على آرائه من قبل Gate، ولا بمثابة نصيحة مالية أو مهنية. انظر إلى إخلاء المسؤولية للحصول على التفاصيل.
تسجيلات الإعجاب 9
أعجبني
9
4
إعادة النشر
مشاركة
تعليق
0/400
PermabullPete
· منذ 12 س
من غير المستغرب أن الاحترافيين يقولون إن الذكاء الاصطناعي يحرق بطاقات الرسوم.
شاهد النسخة الأصليةرد0
BrokenDAO
· منذ 12 س
مرة أخرى يتم الترويج لسرد مثالي زائف حول اللامركزية. في النهاية، لا بد من الاعتماد على المؤسسات في توزيع قوة الحوسبة، ولا يمكن لمستثمري التجزئة اللعب.
استكشاف تدريب الذكاء الاصطناعي اللامركزي: تحليل التقنيات الرائدة من Prime Intellect إلى Pluralis
الكأس المقدسة للذكاء الاصطناعي في العملات الرقمية: استكشاف الحدود للتدريب اللامركزي
في سلسلة القيمة الكاملة للذكاء الاصطناعي، يُعتبر تدريب النموذج هو المرحلة الأكثر استهلاكًا للموارد والأعلى من حيث العوائق التقنية، حيث يحدد مباشرة الحد الأقصى لقدرات النموذج وفعالية تطبيقه الفعلية. بالمقارنة مع الاستدعاءات الخفيفة في مرحلة الاستدلال، تتطلب عملية التدريب استثمارًا مستمرًا في قوة الحوسبة الكبيرة، وعمليات معالجة بيانات معقدة، ودعم خوارزميات تحسين عالية الكثافة، مما يجعلها "الصناعة الثقيلة" الحقيقية لبناء أنظمة الذكاء الاصطناعي. من حيث نمط البنية، يمكن تصنيف طرق التدريب إلى أربع فئات: التدريب المركزي، التدريب الموزع، التعلم الفيدرالي، والتدريب اللامركزي الذي يتم التركيز عليه في هذه المقالة.
تعتبر عملية التدريب المركزية هي الطريقة التقليدية الأكثر شيوعًا، حيث يتم تنفيذ جميع عمليات التدريب من قبل مؤسسة واحدة داخل مجموعة عالية الأداء محليًا، حيث يتم تنسيق تشغيل جميع مكونات الأجهزة والبرامج الأساسية ونظام جدولة المجموعة وإطار التدريب بواسطة نظام تحكم موحد. تتيح هذه المعمارية المتكاملة الكفاءة المثلى لمشاركة الذاكرة ومزامنة التدرجات وآليات تحمل الأخطاء، مما يجعلها مناسبة جدًا لتدريب النماذج الكبيرة مثل GPT وGemini، وتتميز بكفاءتها العالية وقابلية التحكم في الموارد، ولكنها تعاني في الوقت نفسه من مشاكل احتكار البيانات، وحواجز الموارد، واستهلاك الطاقة، ومخاطر النقاط الفردية.
التدريب الموزع هو الطريقة السائدة حاليًا في تدريب النماذج الكبيرة، حيث يكمن جوهره في تقسيم مهمة تدريب النموذج إلى مهام أصغر وتوزيعها على عدة آلات للتنفيذ التعاوني، لتجاوز قيود حسابات وتخزين الآلة الواحدة. على الرغم من أن لديها خصائص "اللامركزية" من الناحية الفيزيائية، إلا أن المجموعة لا تزال تحت سيطرة مؤسسة مركزية للتحكم في الجدولة والمزامنة، وغالبًا ما تعمل في بيئة شبكة محلية سريعة، من خلال تقنية ناقل الاتصال السريع NVLink، حيث يقوم العقدة الرئيسية بتنسيق المهام الفرعية بشكل موحد. تشمل الطرق الرئيسية:
التدريب الموزع هو مزيج من "التحكم المركزي + التنفيذ الموزع"، يشبه توجيه نفس المدير لعدة "مكاتب" من الموظفين للعمل معًا لإكمال المهام. حاليًا، يتم تدريب جميع النماذج الكبيرة السائدة تقريبًا بهذه الطريقة.
تدريب اللامركزية يمثل مسارًا مستقبليًا أكثر انفتاحًا وخصائص مقاومة للرقابة. تتمثل ميزته الأساسية في: عدة عقد غير موثوقة تتعاون لإكمال مهام التدريب دون منسق مركزي، وعادةً ما يتم دفع توزيع المهام والتعاون من خلال البروتوكولات، وبدعم من آلية تحفيز مشفرة لضمان نزاهة المساهمات. التحديات الرئيسية التي يواجهها هذا النموذج تشمل:
يمكن فهم التدريب اللامركزي على أنه: مجموعة من المتطوعين العالميين، يساهم كل منهم بقوة الحوسبة لتدريب النموذج بشكل تعاوني، لكن "التدريب اللامركزي الكبير القابل للتطبيق حقًا" لا يزال يمثل تحديًا هندسيًا نظاميًا، ويتعلق ببنية النظام، بروتوكولات الاتصال، أمان التشفير، الآليات الاقتصادية، والتحقق من النموذج، لكن ما إذا كان يمكن "التعاون بفعالية + تحفيز النزاهة + الحصول على نتائج صحيحة" لا يزال في مرحلة استكشاف النموذج الأولي المبكر.
تعتبر التعلم الفيدرالي شكلاً انتقالياً بين التوزيع واللامركزية، حيث يركز على الاحتفاظ بالبيانات محليًا، وتجميع معلمات النموذج مركزيًا، وهو مناسب للسيناريوهات التي تركز على الامتثال للخصوصية. يتميز التعلم الفيدرالي بالهيكل الهندسي للتدريب الموزع وقدرته على التعاون المحلي، بينما يتمتع أيضًا بميزة توزيع البيانات في التدريب اللامركزي، ولكنه لا يزال يعتمد على جهة تنسيق موثوقة، ولا يتمتع بخصائص الانفتاح الكامل ومقاومة الرقابة. يمكن اعتباره نوعًا من "اللامركزية المراقبة" في سيناريو الامتثال للخصوصية، حيث تكون مهام التدريب، وهياكل الثقة، وآليات الاتصال متوازنة نسبيًا، مما يجعله أكثر ملاءمة كنموذج نشر انتقالي في الصناعة.
حدود التدريب اللامركزي، الفرص والمسارات الواقعية
من حيث نمط التدريب، فإن التدريب اللامركزي لا يناسب جميع أنواع المهام. في بعض السيناريوهات، بسبب تعقيد هيكل المهمة، وارتفاع متطلبات الموارد، أو صعوبة التعاون، فمن الطبيعي أنه لا يصلح لإكماله بشكل فعال بين العقد غير المتجانسة والموثوقة. على سبيل المثال، يعتمد تدريب النماذج الكبيرة غالبًا على ذاكرة عالية، وزمن تأخير منخفض، وعرض نطاق ترددي عالٍ، مما يجعل من الصعب تقسيمه ومزامنته بشكل فعال في الشبكات المفتوحة؛ وتكون المهام التي تخضع لقيود صارمة على الخصوصية والامتثال القانوني والأخلاقي غير قادرة على المشاركة المفتوحة؛ بينما تفتقر المهام التي تفتقر إلى حوافز التعاون إلى دوافع المشاركة الخارجية. تشكل هذه الحدود مجتمعة القيود الواقعية الحالية للتدريب اللامركزي.
لكن هذا لا يعني أن التدريب اللامركزي هو مفهوم زائف. في الواقع، يظهر التدريب اللامركزي آفاق تطبيق واضحة في أنواع المهام التي تتميز بخفة الهيكل، وسهولة التوازي، والتحفيز. بما في ذلك، ولكن لا تقتصر على: ضبط LoRA، ومهام التدريب اللاحقة المتوافقة مع السلوك، وتدريب البيانات الجماعية ومهام التسمية، وتدريب النماذج الأساسية الصغيرة القابلة للتحكم في الموارد، بالإضافة إلى سيناريوهات التدريب التعاوني بمشاركة الأجهزة الطرفية. تتمتع هذه المهام بخصائص التوازي العالي، وانخفاض الترابط، وتحمل القدرات الحاسوبية غير المتجانسة، مما يجعلها مناسبة جداً للتدريب التعاوني من خلال الشبكات P2P، وبروتوكولات Swarm، والمحسنات الموزعة.
تحليل مشاريع التدريب الكلاسيكية اللامركزية
في الوقت الحالي، تشمل المشاريع البارزة في مجال التدريب اللامركزي والتعلم الفيدرالي في مجال blockchain بشكل رئيسي Prime Intellect و Pluralis.ai و Gensyn و Nous Research و Flock.io. من حيث الابتكار التكنولوجي وصعوبة التنفيذ الهندسي، قدمت Prime Intellect و Nous Research و Pluralis.ai العديد من الاستكشافات الأصلية في تصميم النظام والخوارزميات، مما يمثل الاتجاهات الرائدة في البحث النظري الحالي؛ بينما تعتبر طرق التنفيذ الخاصة بـ Gensyn و Flock.io واضحة نسبيًا، حيث يمكن رؤية تقدم هندسي أولي. ستقوم هذه المقالة بتحليل التقنيات الأساسية والهياكل الهندسية وراء هذه المشاريع الخمسة بالتتابع، وستستكشف المزيد من الاختلافات والعلاقات التكميلية في نظام التدريب اللامركزي للذكاء الاصطناعي.
Prime Intellect: رائد الشبكات التعاونية في التعلم المعزز القابل للتحقق من مسارات التدريب
تسعى Prime Intellect إلى بناء شبكة تدريب ذكاء اصطناعي غير موثوقة، تتيح لأي شخص المشاركة في التدريب، والحصول على مكافآت موثوقة مقابل مساهماته الحسابية. تأمل Prime Intellect في إنشاء نظام تدريب ذكاء اصطناعي اللامركزي ذو قابلية للتحقق، والانفتاح، وآلية تحفيز شاملة من خلال ثلاثة وحدات رئيسية: PRIME-RL + TOPLOC + SHARDCAST.
01، هيكل بروتوكول Prime Intellect والقيمة الأساسية للوحدات الرئيسية
02، شرح آلية التدريب الرئيسية لـ Prime Intellect
#PRIME-RL: هيكل مهمة التعلم المعزز غير المتزامن المفكك
PRIME-RL هو إطار نمذجة وتنفيذ المهام المخصص من Prime Intellect لسيناريوهات التدريب اللامركزية، مصمم خصيصًا للشبكات المتنوعة والمشاركة غير المتزامنة. يعتمد على التعلم المعزز كهدف تكييفي رئيسي، حيث يفصل هيكليًا بين عملية التدريب والاستنتاج وتحميل الأوزان، مما يسمح لكل عقدة تدريب بإكمال حلقة المهام بشكل مستقل محليًا، والتعاون من خلال واجهات موحدة وآليات التحقق والتجميع. بالمقارنة مع عمليات التعلم المراقب التقليدية، يعتبر PRIME-RL أكثر ملاءمة لتحقيق التدريب المرن في بيئات بدون جدولة مركزية، مما يقلل من تعقيد النظام ويضع الأساس لدعم المهام المتعددة بشكل متوازي وتطور الاستراتيجيات.
#TOPLOC:آلية تحقق سلوك التدريب الخفيف
TOPLOC هو آلية أساسية للتحقق من القابلية للتدريب التي اقترحها Prime Intellect، تُستخدم لتحديد ما إذا كان العقدة قد أكملت فعليًا تعلم استراتيجية فعالة بناءً على بيانات المراقبة. على عكس الحلول الثقيلة مثل ZKML، لا يعتمد TOPLOC على إعادة حساب النموذج بالكامل، بل يُكمل التحقق الهيكلي الخفيف من خلال تحليل "تسلسل المراقبة ↔ تحديث الاستراتيجية" بين مسارات الاتساق المحلي. إنه يحول للمرة الأولى مسارات السلوك أثناء عملية التدريب إلى كائنات قابلة للتحقق، وهو الابتكار الرئيسي لتحقيق توزيع مكافآت التدريب بدون ثقة، مما يوفر طريقًا قابلاً للتطبيق لبناء شبكة تدريب تعاونية لامركزية قابلة للتدقيق والتحفيز.
#SHARDCAST: بروتوكول تجميع ونشر الوزن غير المتزامن
SHARDCAST هو بروتوكول لنشر الوزن وتجميعه مصمم من قبل Prime Intellect، ومُحسن خصيصًا للبيئات الشبكية الحقيقية التي تتميز بالتأخير، وقيود النطاق الترددي، وتغير حالة العقد. يجمع بين آلية نشر gossip واستراتيجيات التزامن المحلي، مما يسمح لعدة عقد بتقديم تحديثات جزئية باستمرار في حالات غير متزامنة، مما يحقق التقارب التدريجي للأوزان وتطورات متعددة النسخ. مقارنةً بأساليب AllReduce المركزية أو المتزامنة، يُحسن SHARDCAST بشكل كبير قابلية التوسع والقدرة على تحمل الأخطاء في التدريب اللامركزي، وهو الأساس الرئيسي لبناء توافق مستقر للأوزان والتدريب المستمر.
#OpenDiLoCo: إطار الاتصال غير المتزامن النادر
OpenDiLoCo هو إطار تحسين الاتصالات تم تطويره بشكل مستقل ومفتوح المصدر من قبل فريق Prime Intellect استنادًا إلى مفهوم DiLoCo الذي طرحته DeepMind، وهو مصمم خصيصًا للتحديات الشائعة مثل قيود النطاق الترددي، وتنوع الأجهزة، وعدم استقرار العقد في التدريب اللامركزي. يعتمد هيكله على البيانات المتوازية، من خلال بناء هياكل طوبولوجية متفرقة مثل Ring وExpander وSmall-World، مما يتجنب تكاليف الاتصالات العالية الناتجة عن التزامن العالمي، ويعتمد فقط على العقد المجاورة المحلية لإكمال تدريب النماذج بشكل متعاون. مع الجمع بين التحديثات غير المتزامنة وآلية تحمل النقاط الفاشلة، يسمح OpenDiLoCo لمجموعات GPU الاستهلاكية والأجهزة الطرفية بالمشاركة بشكل مستقر في مهام التدريب، مما يعزز بشكل ملحوظ إمكانية المشاركة في التدريب التعاوني العالمي، ويعتبر أحد البنى التحتية الأساسية للتواصل لبناء شبكة تدريب لامركزية.
#PCCL: مكتبة الاتصالات التعاونية
PCCL هو مكتبة اتصالات خفيفة الوزن مصممة خصيصًا من قبل Prime Intellect لبيئة تدريب AI اللامركزية، تهدف إلى حل عنق الزجاجة في التكيف الذي تعاني منه المكتبات التقليدية في الأجهزة المتنوعة والشبكات منخفضة النطاق الترددي. يدعم PCCL التوبولوجيا المتناثرة، وضغط التدرجات، والتزامن بدقة منخفضة، واستعادة النقاط المقطوعة، ويمكن تشغيله على وحدات معالجة الرسوميات الاستهلاكية والعقد غير المستقرة، وهو المكون الأساسي الذي يدعم قدرة الاتصال غير المتزامن لبروتوكول OpenDiLoCo. لقد زاد بشكل كبير من قدرة تحمل النطاق الترددي لشبكة التدريب وتوافق الأجهزة، مما يمهد الطريق لبناء شبكة تدريب تعاونية حقيقية مفتوحة وغير موثوقة من خلال توفير "آخر كيلومتر" من البنية التحتية للاتصالات.
03، Prime Intellect شبكة التحفيز وتقسيم الأدوار
بني Prime Intellect شبكة تدريب يمكن التحقق منها بدون إذن، مزودة بآلية تحفيزية اقتصادية، مما يسمح لأي شخص بالمشاركة في المهام والحصول على مكافآت بناءً على المساهمات الحقيقية. تعمل البروتوكولات بناءً على ثلاث فئات من الأدوار الأساسية:
تشمل العملية الأساسية للبروتوكول نشر المهام، تدريب العقد، التحقق من المسارات، تجميع الأوزان، وتوزيع المكافآت، مما يشكل حلقة تحفيز حول "السلوك التدريبي الحقيقي".
04، INTELLECT-2: أول نشر لنموذج تدريب قابل للتحقق اللامركزية
أصدرت Prime Intellect في مايو 2025 INTELLECT-2، وهو أول نموذج كبير للتعلم المعزز تم تدريبه بواسطة تعاون عقد لا مركزي غير موثوق به وذو أسلوب غير متزامن، حيث يصل حجم المعلمات إلى 32B. تم تدريب نموذج INTELLECT-2 بالتعاون بين أكثر من 100 عقدة GPU متباينة منتشرة عبر ثلاث قارات، باستخدام بنية غير متزامنة بالكامل، حيث استغرق التدريب أكثر من 400 ساعة، مما يظهر جدوى واستقرار الشبكة التعاونية غير المتزامنة. لا يمثل هذا النموذج مجرد اختراق في الأداء، بل هو أيضًا التطبيق النظامي الأول لنموذج "التدريب هو الإجماع" الذي اقترحته Prime Intellect. يدمج INTELLECT-2 بروتوكولات أساسية مثل PRIME-RL وTOPLOC وSHARDCAST، مما يمثل أول تحقيق للشبكة التدريبية اللامركزية.