24.8 C
Colombia
lunes, julio 7, 2025

Más allá de la recuperación: NVIDIA Curso de cuadros para la period de la computación generativa


Nvidia El CEO Jensen Huang anunció una serie de avances innovadores en las capacidades informáticas de IA en la compañía GTC Marzo 2025 Keynote Keynotedescribiendo lo que llamó un “punto de inflexión informático de $ 1 billón”. La nota clave reveló la preparación de la producción del Arquitectura de GPU de Blackwelluna hoja de ruta de varios años para futuras arquitecturas, avances importantes en redes de IA, nuevas soluciones empresariales de IA y desarrollos significativos en robótica e IA física.

La “economía simbólica” y las fábricas de IA

Central de la visión de Huang es el concepto de “fichas” como los bloques de construcción fundamentales de la IA y la aparición de “fábricas de IA” como centros de datos especializados diseñados para la computación generativa.

“Así es como se hace la inteligencia, un nuevo tipo de generador de fábrica de tokens, los componentes básicos de AI. Los fichas han abierto una nueva frontera”, dijo Huang a la audiencia. Hizo hincapié en que los tokens pueden “transformar imágenes en datos científicos de datos alienígenas”, “decodificar las leyes de la física” y “ver la enfermedad antes de que se apodere”.

Esta visión representa un cambio de la “computación de recuperación” tradicional a la “computación generativa”, donde la IA entiende el contexto y genera respuestas en lugar de simplemente obtener datos previos al almacenamiento. Según Huang, esta transición requiere un nuevo tipo de arquitectura de centro de datos donde “la computadora se ha convertido en un generador de tokens, no una recuperación de archivos”.

Blackwell Structure ofrece ganancias de rendimiento masivas

La arquitectura NVIDIA Blackwell GPU, ahora en “Producción completa”, ofrece lo que la compañía afirma es “40 veces el rendimiento de la tolva” para los modelos de razonamiento en condiciones de poder idénticas. La arquitectura incluye soporte para la precisión de FP4, lo que lleva a mejoras significativas de eficiencia energética.

“ISO Energy, Blackwell es 25 veces”, declaró Huang, destacando las dramáticas ganancias de eficiencia de la nueva plataforma.

La arquitectura Blackwell también admite una escala extrema a través de tecnologías como NVLink 72, lo que permite la creación de sistemas de GPU masivos y unificados. Huang predijo que el rendimiento de Blackwell hará que las GPU de generación anterior sean significativamente menos deseables para exigir cargas de trabajo de IA.

(Fuente: Nvidia)

Hoja de ruta predecible para infraestructura de IA

Nvidia describió una cadencia anual common por sus innovaciones de infraestructura de IA, lo que permite a los clientes planificar sus inversiones con mayor certeza:

  • Blackwell Extremely (segunda mitad de 2025): Una actualización a la plataforma Blackwell con mayores fracasos, memoria y ancho de banda.
  • Vera Rubin (segunda mitad de 2026): Una nueva arquitectura con una CPU con rendimiento duplicado, una nueva GPU y tecnologías NVLink y memoria de próxima generación.
  • Rubin Extremely (segunda mitad de 2027): Una arquitectura de escala extrema con el objetivo de 15 exafultos de cómputo por estante.

Democratización de la IA: desde las redes hasta los modelos

Para realizar la visión de la adopción generalizada de IA, NVIDIA anunció soluciones integrales que abarcan redes, {hardware} y software program. A nivel de infraestructura, la compañía está abordando el desafío de conectar cientos de miles o incluso millones de GPU en fábricas de IA a través de importantes inversiones en tecnología de fotónica de silicio. Su primer sistema fotónico de silicio de óptica copenada (CPO), un CPO de 1.6 terabit por segundo basado en la tecnología del modulador del resonador de micro anillo (MRM), promete un ahorro de energía sustancial y una mayor densidad en comparación con los transceptores tradicionales, lo que permite conexiones más eficientes entre los números masivos de GPU en diferentes sitios.

Mientras construye las bases para las fábricas de IA a gran escala, NVIDIA está trayendo simultáneamente el poder informático a las personas y los equipos más pequeños. La compañía introdujo una nueva línea de Supercomputadoras de IA private DGX impulsadas por la plataforma Grace Blackwelldirigido a empoderar a los desarrolladores, investigadores y científicos de datos de IA. La alineación incluye DGX Spark, una plataforma de desarrollo compacta y la estación DGX, una estación de trabajo de escritorio de alto rendimiento con enfriamiento líquido y 20 impresionantes petaflops de cómputo.

Nvidia DGX Spark (Fuente: Nvidia)

Complementando estos avances de {hardware}, Nvidia anunció el Abierto Llama Nemotron Familia de modelos con capacidades de razonamiento, diseñadas para estar preparadas para la empresa para construir avanzado Agentes de IA. Estos modelos se integran en NVIDIA NIM (microservicios de inferencia de NVIDIA), lo que permite a los desarrolladores implementarlos en varias plataformas desde estaciones de trabajo locales hasta la nube. El enfoque representa una solución de pila completa para la adopción de AI empresarial.

Huang enfatizó que estas iniciativas se están mejorando a través de extensas colaboraciones con las principales empresas en múltiples industrias que integran modelos Nvidia, NIM y bibliotecas en sus estrategias de IA. Este enfoque del ecosistema tiene como objetivo acelerar la adopción al tiempo que proporciona flexibilidad para diferentes necesidades empresariales y casos de uso.

AI y robótica física: una oportunidad de $ 50 billones

Nvidia ve la IA física y la robótica como una “oportunidad de $ 50 billones”, según Huang. La compañía anunció la Nvidia Isaac Gr00T N1 de código abierto, descrito como un “modelo de base generalista para robots humanoides”.

Las actualizaciones significativas a los modelos Nvidia Cosmos World Basis proporcionan un management sin precedentes sobre la generación de datos sintéticos para el entrenamiento de robots utilizando Nvidia Omniverse. Como explicó Huang, “el uso de Omniverse para condicionar el cosmos y el cosmos para generar un número infinito de entornos, nos permite crear datos que están basados, controlados por nosotros y, sin embargo, sistemáticamente infinitos al mismo tiempo”.

La compañía también presentó un nuevo motor de física de código abierto llamado “Newton”, desarrollado en colaboración con Google Deepmind y Disney Analysis. El motor está diseñado para una simulación de robótica de alta fidelidad, que incluye cuerpos rígidos y blandos, retroalimentación táctil y aceleración de GPU.

Isaac Gr00T N1 (Fuente: Nvidia)

AI agente y transformación de la industria

Huang definió la “IA agente” como IA con “agencia” que puede “percibir y comprender el contexto”, “razón” y “planificar y tomar medidas”, incluso utilizando herramientas y aprendiendo de información multimodal.

“La IA agente básicamente significa que tiene una IA que tiene agencia. Puede percibir y comprender el contexto de la circunstancia. Puede razonar, muy importante, puede razonar sobre cómo responder o cómo resolver un problema, y ​​puede planificar y medidas. Puede planificar y tomar medidas. Puede usar herramientas”, explicó Huang.

Esta capacidad está impulsando un aumento en las demandas computacionales: “La cantidad de requisitos de cálculo, la ley de escala de la IA es más resistente y, de hecho, hiper acelerada. La cantidad de cálculo que necesitamos en este punto como resultado de la IA agente, como resultado del razonamiento, es fácilmente cien veces más de lo que pensamos que necesitábamos este tiempo el año pasado”, agregó.

El resultado ultimate

La nota clave GTC 2025 de Jensen Huang presentó una visión integral de un futuro impulsado por la IA caracterizado por agentes inteligentes, robots autónomos y fábricas de IA especialmente diseñadas. Los anuncios de NVIDIA en la arquitectura de {hardware}, las redes, el software program y los modelos de código abierto indican la determinación de la compañía para alimentar y acelerar la próxima period de informática.

A medida que la computación continúa su cambio de modelos basados ​​en recuperación a generación, el enfoque de Nvidia en los tokens como la moneda central de la IA y en las capacidades de escala en las plataformas de nubes, empresas y robóticas proporciona una hoja de ruta para el futuro de la tecnología, con implicaciones de gran alcance para las industrias del mundo.

Related Articles

LEAVE A REPLY

Please enter your comment!
Please enter your name here

Latest Articles