Beijing, Mar (Efe) .- Sociedad tecnológica china Parada profunda Este mes presentó una versión actualizada de su modelo de inteligencia artificial fundamental, Deepseek-V3-0324, con importantes mejoras en la generación de código y razonamiento matemático, según los datos compartidos por la misma compañía.
El nuevo modelo, basado en el sistema de razonamiento R1 y con 685,000 millones de parámetros, se desarrolló como un instrumento general, útil tanto para asistentes de conversación como para actividades de desarrollo web.
A diferencia de las versiones anteriores, un tipo de permiso de código abierto está disponible con la licencia MIT que permite el uso, modificación y redistribución del software sin restricciones comerciales y que es la más utilizada en la plataforma de desarrollador de GitHub.
Entre el progreso más conocido, obtuvo una puntuación de 59.4 en el American Mathematics Exam (AIME), una prestigiosa prueba matemática en los Estados Unidos. Uu., Excediendo el 39.6 alcanzado por su predecesor.
En pruebas de programación como LivecodeBench, alcanzó una mejora de 10 puntos, llegando a 49.2.
El modelo pudo generar más de 800 líneas de código sin errores y más de 20 tókens por segundo, una unidad de medición que representa fragmentos de texto, por ejemplo, palabras o caracteres, utilizados en el procesamiento del lenguaje natural.
El sistema se basa en una arquitectura conocida como una mezcla de expertos (mezcla de expertos), que distribuye tareas entre diferentes módulos especializados para aumentar la eficiencia sin aumentar significativamente el costo computacional.
Los usuarios e ingenieros especializados enfatizaron que el modelo se destacó por su precisión en matemáticas, su capacidad para generar un código funcional a gran escala y su potencial para competir con las principales empresas del sector.
El modelo, disponible en Hugging Face, un repositorio global en el que los desarrolladores e investigadores comparten modelos de acceso abierto y en las plataformas oficiales de Deepseek, ya se ha integrado en los servicios de inicio de la nube como Hyperbolic.
«Las características de codificación son mucho más fuertes y la nueva versión podría abrir el camino al lanzamiento de R2»Bangzhu, fundador del sitio especializado AICPB.com, dijo, mencionado por Hongkonés South China Morning Post.
Este progreso ocurre en un contexto de una fuerte competencia tecnológica entre China y los Estados Unidos.
Washington ha impuesto controles de exportación de semiconductores avanzados, esenciales para la formación de modelos de inteligencia artificial y ha recopilado el veto a aplicaciones chinas como Tiktok.
Mientras tanto, Beijing mantiene el bloqueo de servicios estadounidenses como Google, Facebook, X o Instagram y requiere que los sistemas de IA respeten los «valores socialistas fundamentales», que prohíben el contenido que pone en riesgo la seguridad nacional o la unidad territorial.
A pesar de su crecimiento, Depseek ha sufrido críticas fuera de China. En países como Australia, algunas organizaciones han limitado su uso por razones de seguridad.
Además, sus modelos evitan responder temas confidenciales para el gobierno chino, como la masacre de Tiananmen de 1989 o la situación de Taiwán, que ha generado preguntas sobre su neutralidad de información.
¡Mantente informado! Síguenos en Whatsapp, Telegrama, Instagram, Facebook o incógnita
#China #Depseek #lanza #nuevo #modelo #con #mejoras #significativas #programación #las #matemáticas
