أطلقت Alibaba نموذج الذكاء الاصطناعي Qwen3-Next الأكثر كفاءة
أفادت Jinse Finance أن Tongyi Qianwen، التابعة لشركة Alibaba، أطلقت الجيل التالي من بنية النماذج الأساسية Qwen3-Next، وقامت بإتاحة سلسلة النماذج Qwen3-Next-80B-A3B المبنية على هذه البنية كمصدر مفتوح. بالمقارنة مع بنية نموذج MoE في Qwen3، تم إجراء التحسينات الأساسية التالية: آلية انتباه هجينة، بنية MoE عالية التفرع، سلسلة من التحسينات التي تعزز استقرار التدريب، وآلية التنبؤ بعدة رموز لتحسين كفاءة الاستدلال. استنادًا إلى بنية نموذج Qwen3-Next، قامت Alibaba بتدريب نموذج Qwen3-Next-80B-A3B-Base، الذي يحتوي على 80 مليار معلمة مع تفعيل 3 مليارات فقط منها. يحقق هذا النموذج الأساسي أداءً مماثلاً أو حتى أفضل قليلاً من نموذج Qwen3-32B dense، بينما تبلغ تكلفة تدريبه (ساعات GPU) أقل من عُشر تكلفة Qwen3-32B، ويحقق معدل استدلال أعلى بأكثر من عشرة أضعاف في سياقات تتجاوز 32k، مما يوفر فعالية قصوى من حيث التكلفة في التدريب والاستدلال.
إخلاء المسؤولية: يعكس محتوى هذه المقالة رأي المؤلف فقط ولا يمثل المنصة بأي صفة. لا يُقصد من هذه المقالة أن تكون بمثابة مرجع لاتخاذ قرارات الاستثمار.
You may also like
Antalpha تلخص مؤتمر Bitcoin MENA: رأس المال المؤسسي يدفع بيتكوين نحو التطور كأصل أساسي للبنية التحتية المالية
محللون: قد يتجه الاحتياطي الفيدرالي نحو سياسة أكثر تيسيراً
محلل Bloomberg: من المحتمل أن يكون سعر BTC أقل من 84,000 دولار بنهاية العام، و"رالي سانتا كلوز" قد لا يحدث
تُظهر معدلات التمويل في CEX و DEX الرئيسية حالياً أن السوق لا يزال في حالة تشاؤم شاملة

