El modelo DeepSeek-V3.2-Exp ha sido lanzado oficialmente y es de código abierto.
ChainCatcher informa que el modelo DeepSeek-V3.2-Exp fue lanzado oficialmente y su código ha sido abierto hoy. El modelo introduce una arquitectura de Attention dispersa, la cual puede reducir eficazmente el consumo de recursos computacionales y mejorar la eficiencia de inferencia del modelo. Actualmente, este modelo ya está disponible en la plataforma MaaS (Model as a Service) de Huawei Cloud. Para el modelo DeepSeek-V3.2-Exp, Huawei Cloud sigue utilizando la solución de paralelismo EP a gran escala, implementando una estrategia de paralelismo contextual afinada para secuencias largas basada en la estructura de Attention dispersa, equilibrando tanto la latencia del modelo como el rendimiento de procesamiento.
Descargo de responsabilidad: El contenido de este artículo refleja únicamente la opinión del autor y no representa en modo alguno a la plataforma. Este artículo no se pretende servir de referencia para tomar decisiones de inversión.
También te puede gustar
El presidente de Polonia veta la Ley de Mercados de Criptoactivos, alegando que amenaza las libertades ciudadanas.
En tendencia
MásEl precio de las acciones de la minera cripto American Bitcoin, respaldada por la familia Trump, se desplomó a la mitad en 30 minutos.
Datos: En las últimas 24 horas, se liquidaron 382 millones de dólares en todo el mercado, con posiciones largas liquidadas por 66.01 millones de dólares y posiciones cortas liquidadas por 316 millones de dólares.
