A H100 é um sistema de computação poderoso, composto por 35.000 componentes, 8 GPUs Hopper e pesa cerca de 60-65 libras. Com um custo de $200.000, é o sistema de computação mais caro do mundo e pode substituir uma sala de servidores.
A indústria de computação está passando por duas transições fundamentais: o fim do escalonamento de CPU e o surgimento da computação acelerada e da AI gerativa. A capacidade de obter 10 vezes mais desempenho a cada cinco anos ao mesmo custo acabou, e um novo modo de fazer software e computação está emergindo.
Aceleração da Computação e AI Gerativa
A computação acelerada, que levou quase três décadas para ser desenvolvida, é usada para grandes modelos de linguagem e é um aspecto fundamental da AI gerativa. Com a demonstração de que um servidor de $10 milhões pode ser substituído por 48 servidores GPU, consumindo apenas 3,2 gigawatt-hora e alcançando 44 vezes o desempenho, é fácil ver a importância da computação acelerada.
O Futuro da Inteligência Artificial
O futuro da inteligência artificial é promissor, com a previsão de que todas as empresas terão “fábricas de AI” onde irão construir e produzir sua própria inteligência. A AI também será aplicada a vários campos, tornando possíveis coisas impossíveis. Além disso, a computação gráfica e a AI estão se acelerando a uma taxa incrível, com previsões de que computadores serão um milhão de vezes mais rápidos em 10 anos.
Nova Geração de Computação
A nova geração de computação apresenta recursos únicos, como a capacidade de entender informações multimodais, barreiras de programação baixas e a capacidade de melhorar aplicativos antigos. O chip supercomputador “Grace Hopper” é um exemplo disso, com quase 200 bilhões de transistores, 600 GB de memória e consumo de energia baixo.
Soluções de Aceleração de Computação
A NVIDIA está desenvolvendo soluções de aceleração de computação, como o DGX GH200 e o MGX, um design spec de servidor modular aberto para aceleração de computação. Essas soluções são projetadas para ser flexíveis e modulares, permitindo configurações diferentes para abordar domínios específicos.
Além disso, a NVIDIA destaca a importância da eficiência de energia em data centers e apresenta duas novas capacidades de Ethernet: roteamento adaptável e controle de congestionamento. Esses recursos são projetados para melhorar o desempenho e eficiência da Ethernet em aplicações de alto desempenho.
Finalmente, a NVIDIA apresenta sua solução de software enterprise-grade, NVIDIA AI Enterprise, que fornece uma pilha de software gerenciada e segura para aceleração de computação.