تم إصدار نموذج DeepSeek-V3.2-Exp رسميًا وأصبح مفتوح المصدر
أفاد ChainCatcher أنه تم اليوم إطلاق نموذج DeepSeek-V3.2-Exp رسميًا وإتاحته كمصدر مفتوح. أدخل النموذج بنية Attention متفرقة، وهي بنية قادرة على تقليل استهلاك موارد الحوسبة بشكل فعال وتعزيز كفاءة استدلال النموذج. حاليًا، تم إدراج هذا النموذج رسميًا على منصة خدمات النماذج الكبيرة من Huawei Cloud (MaaS). بالنسبة لنموذج DeepSeek-V3.2-Exp، اعتمدت Huawei Cloud مرة أخرى خطة النشر المتوازي الكبيرة (EP)، حيث تم دمج بنية Attention المتفرقة لتحقيق استراتيجية التوازي السياقي المتوافقة مع التسلسلات الطويلة، مع مراعاة كل من زمن استجابة النموذج وأداء الإنتاجية.
إخلاء المسؤولية: يعكس محتوى هذه المقالة رأي المؤلف فقط ولا يمثل المنصة بأي صفة. لا يُقصد من هذه المقالة أن تكون بمثابة مرجع لاتخاذ قرارات الاستثمار.
You may also like
محلل: الفوضى المالية في المملكة المتحدة تدعم ارتفاع الدولار الأمريكي
قامت Strategy بنقل 58,915 وحدة BTC إلى محفظة جديدة
بلغ حجم التداول اليومي في منصة التداول اللامركزية للعقود Sun Wukong أكثر من 400 millions USDT
أطلقت Bitget المرحلة الثالثة من حملة ترقية VIP، تداول واربح FF بقيمة 50,000 دولار أمريكي كإيردروب
