DeepSeek ha tomado al mundo por asalto. En poco tiempo, esta startup china de IA ha pasado de una relativa oscuridad a encabezar las listas de aplicaciones globales y a sacudir a algunos de los nombres más importantes de la tecnología.
Con modelos de vanguardia que rivalizan con líderes de la industria como OpenAI y Meta, DeepSeek está demostrando que la innovación no se limita a Silicon Valley.
Pero, ¿cómo llegó esta empresa a dominar la conversación sobre inteligencia artificial? ¿Y qué significa su ascenso para el futuro de la IA?
Este artículo profundiza en los orígenes de DeepSeek, sus innovadores modelos de IA, el impacto que está teniendo en la industria tecnológica y las cuestiones geopolíticas que plantea.
Los orígenes de DeepSeek: de las finanzas a la innovación en IA
Antes de que DeepSeek se convirtiera en un nombre familiar en la IA, estaba vinculado a una industria completamente diferente: las finanzas. La empresa tiene sus raíces en High-Flyer Capital Management, un fondo de cobertura cuantitativo chino que depende de la inteligencia artificial para guiar las decisiones comerciales.
High-Flyer fue cofundada por Liang Wenfeng en 2015. Entusiasta de la IA, Wenfeng comenzó a explorar el comercio algorítmico mientras estudiaba en la Universidad de Zhejiang. Su pasión lo llevó a crear High-Flyer Capital Management, que se lanzó oficialmente en 2019 como un fondo de cobertura centrado en el desarrollo de estrategias comerciales impulsadas por IA.
Sin embargo, Wenfeng tenía ambiciones mayores. Vio el potencial de la IA más allá de las finanzas, y en 2023, High-Flyer estableció DeepSeek como un laboratorio de investigación de IA dedicado. Poco después, DeepSeek se separó y se convirtió en su propia empresa independiente.
Desde el principio, DeepSeek construyó sus propios clústeres de centros de datos para entrenar modelos de IA. Este enfoque le permitió desarrollar modelos competitivos a pesar de las restricciones de hardware impuestas por las prohibiciones de exportación de EE. UU.
Mientras que las empresas estadounidenses de IA tienen acceso a los potentes chips Nvidia H100, DeepSeek tuvo que depender del modelo H800, menos potente, debido a las restricciones comerciales de EE. UU.
No obstante, el equipo de DeepSeek encontró formas innovadoras de sortear estas limitaciones, demostrando una notable eficiencia en el entrenamiento de modelos de IA.
Los innovadores modelos de IA de DeepSeek
Aunque DeepSeek había estado avanzando silenciosamente en la IA desde su fundación, no fue hasta el lanzamiento de su modelo DeepSeek-V2 en la primavera de 2024 que la industria comenzó a prestarle atención.
Aquí hay una cronología de los principales desarrollos de IA de DeepSeek:
1. DeepSeek Coder (noviembre de 2023)
El primer lanzamiento de IA de DeepSeek se centró en el desarrollo de software. DeepSeek Coder era un asistente de codificación impulsado por IA diseñado para ayudar a los desarrolladores a escribir y depurar código.
2. DeepSeek LLM (diciembre de 2023)
Basándose en el éxito de su modelo de codificación, DeepSeek lanzó DeepSeek LLM, un modelo de IA de propósito general para el procesamiento del lenguaje natural.
3. DeepSeek-V2 (mayo de 2024)
Este fue el modelo que cambió el juego. DeepSeek-V2 superó a muchos modelos de IA existentes y, al mismo tiempo, era significativamente más barato de operar. Esto obligó a ByteDance, Alibaba y otras empresas chinas de IA a bajar los precios de sus servicios de IA, y algunas incluso ofrecieron sus modelos de forma gratuita.
4. DeepSeek-V3 (diciembre de 2024)
Con 671 mil millones de parámetros y una longitud de contexto de 128.000 tokens, DeepSeek-V3 fue un gran avance. La eficiencia y el rendimiento del modelo lo pusieron en competencia directa con GPT-4o de OpenAI y Llama 3 de Meta.
5. DeepSeek R1 (enero de 2025)
Este es el modelo que catapultó a DeepSeek a los titulares mundiales. DeepSeek R1 era una IA de razonamiento, lo que significa que podía analizar y verificar sus propias respuestas antes de generar respuestas. Esto mejoró significativamente la precisión y la fiabilidad, especialmente en tareas de matemáticas, ciencias y codificación.
Según DeepSeek, R1 funciona a la par con el modelo o1 de OpenAI, que anteriormente se consideraba el estándar de oro en razonamiento de IA. El hecho de que DeepSeek lograra esto a una fracción del costo causó conmoción en la industria tecnológica.
6. Janus-Pro-7B (enero de 2025)
Poco después de lanzar R1, DeepSeek presentó Janus-Pro-7B, un modelo de IA de visión diseñado para el reconocimiento y la generación de imágenes.
La disrupción de costos: ¿Por qué DeepSeek es tan barato?
Una de las principales razones por las que DeepSeek está sacudiendo el panorama de la IA es su eficiencia de costos. Mientras que el modelo o1 de OpenAI supuestamente costó más de 100 millones de dólares para entrenar, DeepSeek afirma que entrenó R1 por solo 6 millones de dólares.
Lea también: Los modelos de IA más avanzados de 2024 y 2025
¿Cómo logró DeepSeek esto?
- Entrenamiento de modelos innovador: DeepSeek utilizó el aprendizaje por refuerzo y la ingeniería de recompensas para entrenar sus modelos de manera más eficiente que las empresas de IA tradicionales.
- Optimización de chips: DeepSeek sorteó las prohibiciones de chips de EE. UU. combinando chips Nvidia A100 más antiguos con alternativas más baratas, logrando un alto rendimiento a un costo menor.
- Menores costos operativos: los modelos de IA de DeepSeek requieren menos memoria y potencia de cálculo, lo que los hace más baratos de ejecutar.
Esta ventaja de costos es una gran amenaza para las empresas de IA de EE. UU. que han construido modelos de negocio en torno a servicios de IA de alto precio.
El impacto en el mercado global: sacudiendo a las grandes tecnológicas
El ascenso de DeepSeek ha tenido consecuencias de gran alcance en los sectores tecnológico y financiero.
1. Caída de las acciones de Nvidia
El 27 de enero de 2025, el rápido éxito de DeepSeek provocó una importante venta masiva de acciones tecnológicas. Los inversores entraron en pánico, cuestionando si los chips de IA de alto rendimiento seguían siendo esenciales para los modelos de IA líderes.
El precio de las acciones de Nvidia cayó un 17% en un solo día, eliminando 600 mil millones de dólares de capitalización de mercado.
2. Aumento del gasto en IA de Microsoft y Meta
Las grandes tecnológicas se apresuraron a responder a DeepSeek. Microsoft integró DeepSeek en su Azure AI Foundry y Meta duplicó la inversión en infraestructura de IA para seguir siendo competitivo.
3. OpenAI y Google bajo presión
La eficiencia de costos de DeepSeek ha puesto a OpenAI y Google bajo presión para bajar los precios de sus servicios de IA.
Implicaciones geopolíticas: ¿Una nueva Guerra Fría de la IA?
El ascenso de DeepSeek también tiene ramificaciones geopolíticas. El gobierno de EE. UU. ha tomado nota, y el presidente Donald Trump lo ha calificado de “llamada de atención” para las empresas estadounidenses de IA.
1. Prohibiciones gubernamentales y preocupaciones de seguridad
Los vínculos de DeepSeek con China han suscitado preocupaciones sobre la seguridad de los datos y la seguridad nacional. Como resultado, varios gobiernos y organizaciones han prohibido su uso:
- Estados Unidos: DeepSeek está prohibido en dispositivos gubernamentales en Nueva York, Texas y agencias federales como la NASA.
- Australia y Corea del Sur: ambos países han bloqueado DeepSeek por motivos de seguridad.
- Italia: el gobierno italiano ordenó a DeepSeek que dejara de procesar los datos personales de los ciudadanos.
2. La independencia tecnológica de China
DeepSeek es un gran triunfo para los esfuerzos de China por reducir la dependencia de la tecnología occidental. Los medios estatales chinos han celebrado su ascenso, calificándolo de prueba de la creciente autosuficiencia tecnológica de China.
3. El futuro de la regulación de la IA
El éxito de DeepSeek ha intensificado los debates sobre la regulación de la IA y la competencia global. Si una startup china puede desafiar a OpenAI, ¿qué significa eso para el futuro del liderazgo de la IA?
Desafíos de ciberseguridad: DeepSeek bajo ataque
El ascenso de DeepSeek no ha estado exento de desafíos. El 27 de enero de 2025, el mismo día en que su aplicación de chatbot alcanzó el número 1 en la App Store de Apple, DeepSeek informó de ciberataques maliciosos a gran escala.
Aunque DeepSeek no especificó la naturaleza de los ataques, se especula que fueron ataques DDoS (Denegación de Servicio Distribuida) destinados a interrumpir sus servicios de API y chatbot.
A pesar de estos ataques, DeepSeek ha seguido expandiéndose y mejorando sus ofertas de IA.
¿Qué sigue para DeepSeek?
DeepSeek ha demostrado que los avances en IA no solo ocurren en los EE. UU. Pero, ¿qué sigue para la empresa?
- Modelos de IA mejorados: es probable que DeepSeek lance DeepSeek-V4 y R2, continuando con su rápida innovación.
- Expansión a la IA empresarial: con la integración de DeepSeek por parte de Microsoft, más empresas podrían adoptar sus modelos.
- Mayor escrutinio gubernamental: a medida que DeepSeek crece, enfrentará más desafíos regulatorios, particularmente en los EE. UU. y Europa.
El ascenso de DeepSeek ha destrozado las suposiciones sobre la industria de la IA. Ha obligado a las grandes tecnológicas a repensar los costos de la IA, ha causado turbulencias en el mercado de valores y ha generado preocupaciones geopolíticas.
Si bien su futuro sigue siendo incierto, una cosa está clara: DeepSeek ya no es solo un advenedizo. Es un contendiente serio en la carrera mundial de la IA.