DeepSeek retrasa su nuevo modelo de IA por problemas con chips Huawei Ascend
Chips Ascend no logran el rendimiento esperado
El desarrollo tecnológico en inteligencia artificial (IA) enfrenta desafíos significativos en China, evidenciados por el reciente retraso en la salida del modelo R2 de la startup china DeepSeek.
Esta demora fue causada por dificultades persistentes en el entrenamiento del modelo utilizando los chips Ascend de Huawei, lo que refleja las limitaciones actuales para sustituir completamente la tecnología estadounidense en el sector.

Huawei frente a Nvidia, un empate difícil de romper
Después del éxito del modelo R1 de DeepSeek en enero, las autoridades chinas impulsaron el uso del procesador Ascend de Huawei para entrenar el nuevo modelo R2, buscando reducir la dependencia de chips estadounidenses como los de Nvidia.
Sin embargo, el proceso de entrenamiento del R2 tuvo múltiples problemas técnicos con los chips de Huawei, lo que obligó a DeepSeek a usar chips Nvidia para la fase de entrenamiento y dejar el uso de los Ascend solo para la inferencia, o sea, la etapa donde el modelo genera respuestas a partir de lo aprendido.
Los problemas técnicos reportados incluyen inestabilidad, conectividad interchip más lenta y software menos eficiente en los chips chinos, factores que frenan su rendimiento en tareas de alta demanda como el entrenamiento de modelos de IA.
A pesar de que Huawei envió ingenieros directamente a las oficinas de DeepSeek para asistir en la integración, no se logró una ejecución satisfactoria durante el entrenamiento con Ascend.
Esta situación ha obligado a retrasar el lanzamiento del R2 que estaba previsto originalmente para mayo, haciendo que DeepSeek pierda ventaja frente a competidores locales e internacionales.

Las limitaciones del hardware nacional y la respuesta del mercado
Estas dificultades subrayan la brecha actual entre los chips fabricados en China y sus equivalentes estadounidenses, lo que complica la estrategia de independencia tecnológica promovida por Beijing.
Aunque los chips Ascend son promovidos como alternativas nacionales y usados para tareas de inferencia, en la práctica todavía no pueden sustituir enteramente a las GPUs de Nvidia en etapas críticas del desarrollo de IA.
Este caso particular de DeepSeek es un reflejo de un fenómeno más amplio: empresas chinas como ByteDance, Tencent y Alibaba continúan usando mayoritariamente chips Nvidia para entrenar sus modelos, a pesar de las presiones del gobierno para adoptar tecnología local.
Analistas señalan que Huawei enfrenta «dolores de crecimiento» en el uso de sus chips Ascend para entrenamiento, aunque confían en que eventualmente podrán superarlos y competir a la par con Nvidia.

Impacto geopolítico y comercial en el mercado de chips de IA
La lucha por el dominio en tecnologías críticas de IA ha puesto a Nvidia en el centro de un conflicto geopolítico entre Estados Unidos y China.
Nvidia ha tenido que aceptar compartir parte de sus ingresos derivados de las ventas en China con el gobierno estadounidense para mantener el suministro de chips H20 al mercado chino, pese a las restricciones y exigencias de las autoridades chinas.
Esto pone en evidencia la compleja dependencia tecnológica y comercial que aún persiste entre ambos países.
Nvidia ha remarcado públicamente la importancia de los desarrolladores y el acceso a mercados globales para mantener la seguridad económica y nacional de Estados Unidos, dejando claro que renunciar a mercados tan grandes como el chino traería efectos adversos.
Fuente: Reuters



