Bitget App
Торгуйте разумнее
Купить криптоРынкиТорговляФьючерсыEarnWeb3ПлощадкаПодробнее
Торговля
Спот
Купить и продать криптовалюту
Маржа
Увеличивайте капитал и эффективность средств
Onchain
Безграничные возможности торговли.
Конвертация и блочная торговля
Конвертируйте криптовалюту в один клик без комиссий
Обзор
Launchhub
Получите преимущество заранее и начните побеждать
Скопировать
Копируйте элитного трейдера в один клик
Боты
Простой, быстрый и надежный торговый бот на базе ИИ
Торговля
Фьючерсы USDT-M
Фьючерсы с расчетами в USDT
Фьючерсы USDC-M
Фьючерсы с расчетами в USDC
Фьючерсы Coin-M
Фьючерсы с расчетами в криптовалютах
Обзор
Руководство по фьючерсам
Путь от новичка до профессионала в торговле фьючерсами
Акции по фьючерсам
Получайте щедрые вознаграждения
Bitget Earn
Продукты для легкого заработка
Simple Earn
Вносите и выводите средства в любое время, чтобы получать гибкий доход без риска
Ончейн-Earn
Получайте прибыль ежедневно, не рискуя основной суммой
Структурированный Earn
Надежные финансовые инновации, чтобы преодолеть рыночные колебания
VIP и Управление капиталом
Премиум-услуги для разумного управления капиталом
Займы
Гибкие условия заимствования с высокой защитой средств
Alibaba представила более эффективную модель искусственного интеллекта Qwen3-Next

Alibaba представила более эффективную модель искусственного интеллекта Qwen3-Next

金色财经金色财经2025/09/11 22:32
Показать оригинал

Jinse Finance сообщает, что Tongyi Qianwen, дочерняя компания Alibaba, выпустила архитектуру следующего поколения базовой модели Qwen3-Next и открыла исходный код серии моделей Qwen3-Next-80B-A3B, основанных на этой архитектуре. По сравнению с архитектурой MoE модели Qwen3, были внесены следующие ключевые улучшения: гибридный механизм внимания, высокоразреженная структура MoE, ряд оптимизаций, способствующих стабильности обучения, а также механизм многотокенового предсказания для повышения эффективности вывода. На основе архитектуры модели Qwen3-Next Alibaba обучила модель Qwen3-Next-80B-A3B-Base, которая содержит 80 миллиардов параметров, из которых активируются только 3 миллиарда. Эта базовая модель достигает производительности, сопоставимой или даже немного лучшей, чем у плотной модели Qwen3-32B, при этом стоимость обучения (GPU hours) составляет менее одной десятой от Qwen3-32B, а пропускная способность вывода при контексте более 32k превышает Qwen3-32B более чем в десять раз, что обеспечивает исключительное соотношение эффективности обучения и вывода.

0

Дисклеймер: содержание этой статьи отражает исключительно мнение автора и не представляет платформу в каком-либо качестве. Данная статья не должна являться ориентиром при принятии инвестиционных решений.

PoolX: вносите активы и получайте новые токены.
APR до 12%. Аирдропы новых токенов.
Внести!