قالت شركة «ديب سيك» (DeepSeek) الصينية المتخصصة في تطوير الذكاء الاصطناعي إنها أنفقت 294 ألف دولار فقط لتدريب نموذجها المتقدم «R1». وهو مبلغ ضئيل للغاية مقارنة بالتكاليف الضخمة التي أُبلغ عنها لدى منافسين في الولايات المتحدة، وفقًا لمقال علمي نُشر في مجلة «نيتشر».
في حين من المتوقع أن يعيد هذا الكشف إشعال الجدل حول موقع الصين في السباق العالمي لتطوير تقنيات الذكاء الاصطناعي.
كذلك يُعدّ هذا أول تقدير رسمي تصدره الشركة لتكاليف تدريب نموذج «R1».
وكانت “ديب سيك” استقطبت الأنظار عالميًا في يناير الماضي عندما طرحت أنظمة ذكاء اصطناعي منخفضة الكلفة. ما أثار موجة ذعر في الأسواق ودفع المستثمرين إلى بيع أسهم شركات التكنولوجيا.
وذلك وسط مخاوف من أن تهدد هذه النماذج الهيمنة الراسخة لعمالقة المجال مثل «إنفيديا».
تدريب نموذج «R1»
وأوضح المقال المنشور في مجلة «نيتشر» أن تدريب نموذج «R1» استغرق 80 ساعة. باستخدام عنقود حوسبة يضم 512 شريحة من طراز «إنفيديا H800».
كما لم يكن هذا الرقم كُشف في النسخة السابقة من البحث التي تم نشره في يناير.
بينما يذكر أن المدير التنفيذي لشركة «أوبن إيه آي» سام ألتمان كان صرّح عام 2023. بأن تدريب النماذج الأساسية كلّف «أكثر بكثير من 100 مليون دولار» من دون تقديم أرقام مفصلة.
لكن بعض تصريحات ديب سيك حول تكاليف تطويرها والتقنيات المستخدمة أثارت تشكيكًا من شركات ومسؤولين أمريكيين. فشرائح «H800» صُمّمت خصيصًا للسوق الصينية بعد أن فرضت الولايات المتحدة في أكتوبر 2022 قيودًا على تصدير شرائح «H100» و«A100» الأكثر قوة إلى الصين.
كذلك أفادت «إنفيديا» لاحقًا بأن ديب سيك استخدمت شرائح «H800» تم الحصول عليها بشكل قانوني، ونفت استخدامها شرائح «H100».

شرائح «A100»
وفي وثيقة معلومات مكمّلة مرافقة للبحث المنشور في «نيتشر». أقرت ديب سيك للمرة الأولى بامتلاكها شرائح «A100». واستخدامها في المراحل التحضيرية لتطوير النماذج.
كما قالت الشركة الصينية إن باحثيها «استعانوا بوحدات A100. لإعداد التجارب على نموذج أصغر. قبل أن يبدأ تدريب نموذج R1 فعليًا لمدة 80 ساعة على عنقود يضم 512 شريحة H800».
وكانت وكالة «رويترز» ذكرت سابقًا أن ديب سيك تمكنت من اجتذاب بعض ألمع العقول في الصين. بفضل كونها من بين الشركات المحلية القليلة التي تملك عنقود حوسبة فائقًا يضم شرائح «A100».
اتهامات ديب سيك
كما ردّت ديب سيك للمرة الأولى، وإن بشكل غير مباشر، على اتهامات من مستشارين في البيت الأبيض. وشخصيات بارزة في قطاع الذكاء الاصطناعي الأمريكي بأنها تولت «تقطير» نماذج شركة «أوبن إيه آي». ودمجها في نماذجها الخاصة.
بينما دافعت الشركة عن تقنية «التقطير» باعتبارها وسيلة لتحسين أداء النماذج. وخفض تكاليف تدريبها وتشغيلها. الأمر الذي يتيح وصولًا أوسع إلى تقنيات الذكاء الاصطناعي المكلفة من حيث استهلاك الطاقة والموارد.
نموذج «لاما» مفتوح المصدر
كما أوضحت ديب سيك أنها استخدمت نموذج «لاما» مفتوح المصدر من شركة «ميتا» في بعض النسخ المقطّرة من نماذجها.
في نهاية المطاف أشارت الشركة في مقال «نيتشر» إلى أن بيانات تدريب نموذجها «V3» تضمنت صفحات ويب احتوت على «عدد كبير من الإجابات التي أنشأتها نماذج أوبن إيه آي. ما قد يؤدي إلى اكتساب النموذج الأساسي معرفة من نماذج قوية أخرى بشكل غير مباشر». لكنها شددت على أن ذلك لم يكن مقصودًا بل حدث بشكل عرضي.
المصدر (رويترز)


