El verdadero coste de desarrollo de Deepseek al descubierto

DeepSeek revoluciona el mercado de la IA con su modelo R1, compitiendo con los líderes del sector como OpenAI y Meta

En el mundo de la inteligencia artificial, donde las potencias tradicionales como Estados Unidos dominan la escena, un jugador emergente ha irrumpido con fuerza. Se trata de DeepSeek, un laboratorio chino que ha sorprendido a la industria con su modelo de IA R1.

Este modelo ha sido comparado con los más avanzados del mercado, incluyendo el GPT de OpenAI y Llama de Meta, posicionándose como una competencia seria para los líderes establecidos en el sector. Con una inversión aproximada de 750 millones de dólares en su desarrollo, DeepSeek ha demostrado ser un contendiente formidable en la carrera por la supremacía de la inteligencia artificial.

A pesar de estos desafíos, DeepSeek ha demostrado que la competencia en el ámbito de la inteligencia artificial está más abierta que nunca, y su capacidad para innovar y superar barreras podría marcar el futuro de la IA en todo el mundo.

Un avance impresionante en el hardware de IA: 50,000 GPUs NVIDIA H100

Lo que ha puesto a DeepSeek en el centro de atención es su impresionante infraestructura, que incluye un parque de 50,000 GPUs NVIDIA H100. Estas unidades, basadas en la arquitectura Hopper de NVIDIA, son actualmente las más poderosas disponibles en el mercado y juega un papel crucial en el entrenamiento del modelo R1.

Estas GPUs, aunque de última generación, están restringidas para su venta en China debido a las políticas de exportación de Estados Unidos. A pesar de este obstáculo, DeepSeek ha encontrado maneras de sortear estas restricciones, aunque no ha revelado los detalles de cómo lo logró, lo que plantea preguntas sobre los métodos que empleó para conseguir estos chips avanzados.

El modelo R1: superando a los líderes de la inteligencia artificial

El modelo R1 de DeepSeek ha demostrado su capacidad para competir con los mejores del mundo en una prueba denominada Humanity’s Last Exam, que desafió a los modelos de IA con preguntas complejas de matemáticas, física, biología y química. El resultado de esta prueba fue impresionante: el R1 no solo igualó los rendimientos de modelos como el GPT-4 de OpenAI, sino que en algunos aspectos los superó. Esta hazaña subraya la capacidad del laboratorio chino para no solo alcanzar el nivel de los gigantes de la IA, sino también para desafiar su dominio en un campo tan competitivo y tecnológicamente exigente.

En 2022, Estados Unidos prohibió la venta de estos chips a China, lo que dejó a los laboratorios chinos en una situación complicada. Sin embargo, según Alexandr Wang, fundador y CEO de Scale AI, DeepSeek ha logrado sortear estas restricciones de manera exitosa, lo que ha permitido a la empresa obtener más de 50,000 unidades de las poderosas GPUs de NVIDIA, mucho más de lo que se esperaba inicialmente.

Inteligencia Artificial