لقطة من منصة DeepSeek الذكية - DeepSeek
عشتارتيفي كوم- الشرق/
أطلقت شركة DeepSeek الصينية نموذج DeepSeek V3 الذكي، والذي أثبت تفوقاً كبيراً في منافسة العديد من النماذج الأخرى في مجالات مثل كتابة الأكواد البرمجية، وإنشاء النصوص.
أتاحت الشركة المطورة نموذجها الجديد لمختلف الاستخدامات، بما في ذلك الاستخدامات التجارية، من خلال حصول المطورين على تراخيص بالموافقة من جانبها.
مميزات نموذج DeepSeek V3
يتمكن نموذج DeepSeek V3 من إنجاز مهام مختلفة، مثل كتابة النصوص والترجمة الفورية وكتابة الأكواد البرمجية التي أثبت تفرده بها أمام نماذج رائدة مثل نموذج Llama 3.1 405B من ميتا، وGPT-4o من OpenAI، وكذلك نموذج شركة علي بابا الأحدث Qwen 2.5 72B، بحسب اختبارات منصة Cpdefprces للبرمجة الآلية.
وكذلك، نجح النموذج الصيني الجديد في تسجيل أرقام قياسية في اختبار Aider Polyglot، الذي يقيس العديد من قدرات النماذج الذكية، بما في ذلك القدرة على كتابة أكواد برمجية جديدة تتماشى مع الكود البرمجي الحالي.
تفوق نموذج DeepSeek V3 قد يكون متوقعاً، إذ أشارت شركته المطورة إلى أنه قد تم تدريبه على قاعدة بيانات مكونة من 12.8 تريليون توكن، والتوكن هي وحدة تمثيل حجم البيانات في صورتها النصية، ومليون توكن تساوي قرابة 750 ألف كلمة.
ويعتمد DeepSeek V3 على عدد ضخم من المتغيرات، إذ يتكون من 685 مليار متغير، بما يفوق حجم أكبر نموذج مفتوح المصدر لدى ميتا وحجمه 405 مليارات متغير، بقرابة 1.6 مرة.
يُذكر أن فكرة المتغير Parameter مرتبطة في نماذج الذكاء الاصطناعي بتنوع وحجم المهارات والقدرات الخاصة بتلك النماذج، فكلما كان عدد المتغيرات أكبر، كلما زاد تطور إمكانيات النماذج.
وأشارت شركة DeepSeek إلى أن نموذجها الأحدث قد تم تدريبه خلال شهرين فقط، باستخدام مجموعة من رقائق معالجات إنفيديا H800، وهي الرقائق التي تم حظر تصديرها إلى الصين مؤخراً بقرار من وزارة التجارة الأميركية، وبميزانية 5.5 مليون دولار، وهي ميزانية زهيدة لتدريب نماذج الذكاء الاصطناعي.
ولكن رغم تطور قدراته التقنية، إلا أن نموذج DeepSeek V3 يواجه بعض المشاكل الغريبة، إذ عكست بعضها وجود سيطرة حكومية من بكين على طريقة تدريبه، فمن خلال بعض التجارب الأولية مع النموذج، رفض الإجابة عن بعض الأسئلة بشأن مسائل شائكة، مثل مظاهرات ميدان تيانانمين الشهيرة، والتي خرجت في 1989 للاحتجاج على الحزب الشيوعي الحاكم، إذ يرفض الرد ويقول: "أعتذر عن إجابة هذا السؤال.. أنا مجرد مساعد ذكاء اصطناعي، متخصص في تقديم ردود مساعدة وغير ضارة".
يُذكر أن جميع الشركات الصينية مطورة النماذج الذكية تحتاج إلى اختبار من جانب مؤسسة صينية حكومية متخصصة في تنظيم الإنترنت، للتأكد من أن أداء وردود النماذج تتماشى مع توجهات الحكومة.
كذلك، فوجئ بعض المستخدمين، الذين شاركوا تجربتهم عبر "إكس"، بأن النموذج الصيني عند سؤاله بعض الأسئلة، يدعي بأنه ChatGPT، بل عند التساؤل بشأن طريقة استخدام واجهته البرمجية للمطورين API، يقدم طريقة استخدام واجهة منصة ChatGPT كذلك.
نماذج الذكاء الاصطناعي
وقد أرجع البعض هذه المشكلة إلى أن النموذج الصيني قد تدرب بشكل أو بآخر على الردود والمحتوى المنتج بواسطة المنصة الذكية المملوكة لشركة OpenAI.
يُذكر أن OpenAI تحظر، بمقتضى شروط وقواعد استخدام منصتها الذكية وواجهتها البرمجية، استخدام أي محتوى منتج بواسطة نماذجها الذكية في تدريب أي نماذج ذكاء اصطناعي منافسة لها.
النموذج الصيني الجديد ليس الأول الذي يقع في معضلة الخطأ في تعريف نفسه، فنموذج Gemini من جوجل عند إطلاقه مطلع 2024 أخطأ في تعريف نفسه بأنه نموذج Wenxinyiyan الخاص بالصينية بايدو، وذلك عند سؤاله بلغة الماندارين الصينية.
يرجع ذلك إلى أن النماذج الذكية يتم تدريبها على المحتوى المتاح عبر شبكة الإنترنت، والذي أصبح جزءاً كبيراً منه مٌنشأ بواسطة نماذج الذكاء الاصطناعي، والتي أحياناً تنتج محتوى في داخله تعريف بنفسها، مثل "أنا ChatGPT نموذج ذكاء اصطناعي مدرب من جانب شركة OpenAI"، وقد أشارت دراسة إلى أنه بحلول 2026 سيكون 90% من المحتوى المتاح على الإنترنت منتج بواسطة الذكاء الاصطناعي.