Noticias e Eventos

NVIDIA oferece grande salto no desempenho para aplicativos de HPC e de deep learning com a nova NVIDIA Tesla P100

 
 
Cinco avanços tecnológicos arquitetônicos permitem que os servidores ofereçam desempenho 12 vezes melhor em comparação com a arquitetura anterior

SAN JOSE, Califórnia — GPU Technology Conference — 5 de abril de 2016 — A NVIDIA anunciou hoje a NVIDIA® Tesla® P100, a GPU mais avançada já criada.

A última adição à Plataforma de computação acelerada NVIDIA Tesla, a Tesla P100, cria uma nova categoria de servidores que podem oferecer o desempenho de centenas de nós de servidor de CPU. Os data centers de hoje — vastas infraestruturas de rede com vários servidores de CPU interconectados — processam um número elevado de cargas de trabalho transacionais, como serviços da Web. Mas eles não são eficientes para aplicações científicas e de inteligência artificial de última geração, que exigem nós de servidor ultraeficientes e rápidos.

Baseado na nova arquitetura de GPU, a NVIDIA Pascal™ com 5 avanços tecnológicos, a Tesla P100 oferece desempenho e eficiência inigualáveis para potencializar os aplicativos mais exigentes em termos de computação.

“Nossos maiores desafios científicos e técnicos — encontrar a cura para o câncer, entender as mudanças climáticas, construir máquinas inteligentes — exigem um volume de desempenho de computação quase infinito", afirma Jen-Hsun Huang, CEO e cofundador da NVIDIA. "Projetamos a arquitetura das GPUs Pascal desde o início com inovação em todos os níveis. Ela representa um grande salto à frente em desempenho e eficiência de computação, e ajudará algumas das mentes mais espertas a impulsionar os avanços do futuro."

Dr. John Kelly III, vice-presidente sênior de Soluções Cognitivas e Pesquisa da IBM, declara: "Conforme entramos na nova era da computação, abordagens completamente novas para as tecnologias subjacentes serão necessárias para aproveitar completamente os benefícios da IA e da computação cognitiva. A combinação de placas de vídeo da NVIDIA e da tecnologia OpenPOWER já está acelerando o aprendizado de novas habilidades da Watson. Juntas, a arquitetura Power da IBM e a arquitetura Pascal da NVIDIA com NVLink acelerarão ainda mais o desempenho de cargas de trabalho cognitivas e impulsionarão o avanço do setor de inteligência artificial."

Cinco avanços tecnológicos
A Tesla P100 oferece desempenho, escalabilidade e eficiência de programação sem precedentes com base em cinco avanços:

  • Arquitetura NVIDIA Pascal para salto exponencial de desempenho — a nova Tesla P100 baseada na arquitetura Pascal oferece 12 vezes mais desempenho no treinamento de redes neurais comparado a uma GPU baseada na arquitetura NVIDIA Maxwell™, da geração anterior.
  • NVIDIA NVLink para escalabilidade máxima de aplicativos — a interconexão de placa de vídeo NVIDIA NVLink™ de alta velocidade dimensiona aplicativos em várias GPUs, oferecendo 5 x mais aceleração em largura de banda comparada à melhor solução da categoria atualmente.¹ Até 8 GPUs Tesla P100 podem ser interconectadas com NVLink para maximizar o desempenho de aplicativos em um nó único, e a IBM implementou o NVLink em CPUs POWER8 para comunicação rápida de CPU para placa de vídeo.
  • FinFET de 16 nm para eficiência de energia sem precedentes — com 15,3 bilhões de transistores projetados com tecnologia de fabricação FinFET de 16 nanômetros, a placa de video com arquitetura Pascal é o maior chip FinFET já construído.² Ela foi projetada para oferecer o desempenho mais rápido e a maior economia de energia para cargas de trabalho com necessidades de computação quase infinitas.
  • CoWoS com HBM2 para cargas de trabalho de big data — a arquitetura Pascal unifica o processador e os dados em um pacote único para oferecer eficiência de computação sem precedentes. Uma abordagem inovadora para o design de memória, o Chip on Wafer on Substrate (CoWoS) com HBM2 oferece desempenho de largura de banda de memória 3 vezes melhor, ou 720 GB por segundo, comparado à arquitetura Maxwell.
  • Novos algoritmos de IA para desempenho máximo — novas instruções para meia precisão oferecem mais de 21 teraflops de desempenho máximo para aprendizado profundo.

A GPU Tesla P100 oferece um novo nível de desempenho para uma gama de aplicativos HPC (High Performance Computing) e de aprendizado profundo, incluindo o código de dinâmica molecular AMBER, que é executado mais rápido em um nó único de servidor com placas de vídeo Tesla P100 do que em 48 nós de servidor de CPU de soquete duplo.³ Treinar a popular rede neural AlexNet exigiria 250 nós de servidor de CPU de soquete duplo para atingir o desempenho de 8 placas de vídeo Tesla P100.4 E o aplicativo de previsão do tempo amplamente utilizado, COSMO, é executado mais rápido em 8 placas de vídeo Tesla P100 do que em 27 servidores de CPU de soquete duplo.5

O primeiro acelerador a oferecer mais de 5 teraflops de desempenho de dupla precisão e 10 teraflops de precisão única, a Tesla P100 oferece um salto gigante para os recursos de processamento e tempo para detecção de pesquisa em um amplo espectro de domínios.

Atualizações no SDK NVIDIA
A NVIDIA também anunciou uma série de atualizações no SDK NVIDIA, a plataforma de desenvolvimento mais poderosa do mundo para computação de placas de vídeo.

Essas atualizações incluem NVIDIA CUDA® 8. A última versão da plataforma de computação paralela da NVIDIA dá aos desenvolvedores acesso direto a novos recursos poderosos da arquitetura Pascal, incluindo memória unificada e NVLink. Também está incluída nessa nova versão uma nova biblioteca de lógica analítica de gráficos — nvGRAPH — que pode ser usada para planejamento de caminhos de robótica, segurança cibernética e análise logística, expandindo as aplicações da aceleração de placas de vídeo até o campo da lógica analítica de big data.

A NVIDIA anunciou também a versão 5 da cuDNN, uma biblioteca acelerada para placas de vídeo para redes neurais profundas. A cuDNN 5 inclui suporte a placas de video baseadas na arquitetura Pascal; aceleração de redes neurais recorrentes, que são usadas para vídeo e outros dados sequenciais e melhorias adicionais usadas nas áreas médica, de óleo & gás e outros setores. A cuDNN acelera as estruturas líderes de aprendizado profundo, incluindo TensorFlow do Google, Caffe da Universidade da Califórnia em Berkeley, Theano da Universidade de Montreal e Torch da Universidade de Nova York. Essas estruturas, por sua vez, potencializam soluções de aprendizado profundo usadas pela Amazon, pelo Facebook e pelo Google, entre outros.

Especificações do Tesla P100
As especificações do acelerador de GPU Tesla P100 incluem:

  • Desempenho de dupla precisão de 5,3 teraflops, desempenho de precisão única de 10,6 teraflops e desempenho de meia precisão de 21,2 teraflops com a tecnologia BOOST™ para placas de vídeo NVIDIA.
  • Largura de banda com interconexão bidirecional de 160 GB por segundo com NVLink NVIDIA
  • 16 GB de memória em pilha CoWoS HBM2
  • Largura de banda de memória de 720 GB por segundo com memória em pilha CoWoS HBM2
  • Capacidade de programação aprimorada com mecanismo de migração de páginas e memória unificada
  • Proteção ECC para proporcionar maior confiabilidade
  • Otimizado para servidores para oferecer maior taxa de transferência e confiabilidade de data center

Disponibilidade
O acelerador de placa de vídeo NVIDIA Tesla P100 baseado na arquitetura Pascal e no novo sistema de aprendizado profundo NVIDIA DGX-1™ estará disponível em junho. Também se espera que ele estará disponível no começo de 2017 nos principais fabricantes de servidores.

Recursos de suporte

Mantenha-se atualizado sobre a NVIDIA
Veja as imagens no Flickr
Site oficial da NVIDIA no Brasil: www.nvidia.com.br
NVIDIA no Facebook: NVIDIA Brasil
NVIDIA no Twitter: @nvidiabrasil
NVIDIA no Instagram: @nvidiabrasil

Sobre a NVIDIA
NVIDIA (NASDAQ: NVDA) é uma empresa de tecnologia computacional pioneira em computação acelerada por GPUs. Ela tem como alvo os usuários mais exigentes — jogadores, designers e cientistas — com produtos, serviços e software que potencializam experiências incríveis em realidade virtual, inteligência artificial, visualização profissional e carros autônomos. Mais informações no site http://nvidianews.nvidia.com/.

NVIDIA - Informações para a Imprensa
Sing Comunicação de Resultados
André Forte, Janaína Leme, Tatiane Dantas e Vânia Gracio
Fone: (55 11) 5091-7838
nvidia@singcomunica.com.br

(1) O NVLink oferece 160 GB por segundo de largura de banda de interconexão bidirecional em comparação ao PCIe x16 Gen3, que oferece 31, 5 GB por segundo de largura de banda bidirecional.

(2) A placa de vídeo NVIDIA Tesla P100 tem 15,3 bilhões de transistores FinFET de 16 nm.

(3) Sistema de CPU: 48 nós, cada nó com 2 núcleos Intel E5-2680v3 12, DDR4 de 128 GB, interconexão FDR IB. Sistema de placas de vídeo: Nó único, 2 núcleos Intel E5-2698 v3 16, DDR4 de 512 GB, 4 Tesla P100, interconexão de NVLink.

(4) Em comparação com o tempo da Caffe/AlexNet para treinar conjuntos de dados do ILSVRC-2012 em um cluster de sistemas baseados em processadores Intel Xeon E5-2697 v3 de dois soquetes com interconexão InfiniBand. Estimativa do desempenho de 250 nós com a fonte: https://software.intel.com/en-us/articles/caffe-training-on-multi-node-distributed-memory-systems-based-on-intel-xeon-processor-e5.

(5) Sistema de CPU: 2 núcleos Intel E5-2698 v3 16, DDR4 de 256 GB. Sistema de placas de vídeo: Nó único, 2 núcleos Intel E5-2698 v3 16, DDR4 de 512 GB, 8 Tesla P100, interconexão de NVLink.

Algumas declarações neste comunicado à imprensa, incluindo, mas não se limitando a, declarações como: o impacto, o desempenho, os benefícios e a disponibilidade da placa de vídeo NVIDIA Tesla P100, do SDK NVIDIA e do sistema de aprendizado profundo NVIDIA DGX-1 são previdentes e estão sujeitas a riscos e incertezas que podem gerar resultados materialmente diferentes das expectativas. Entre os fatores importantes que podem fazer com que os resultados reais sejam materialmente diferentes estão: condições econômicas globais; nossa dependência de terceiros para fabricar, montar, empacotar e testar nossos produtos; o impacto do desenvolvimento tecnológico e da concorrência; o desenvolvimento de novos produtos e tecnologias ou melhorias nos já existentes; aceitação de nossos produtos, ou de produtos de nossos parceiros, no mercado; defeitos de software, projeto ou fabricação; mudanças nas preferências ou nas demandas do consumidor; mudanças nas interfaces e nos padrões do setor e; perda inesperada de desempenho de nossos produtos ou tecnologias quando integrados a sistemas; bem como outros fatores detalhados regularmente nos relatórios apresentados pela NVIDIA à Comissão de Valores Mobiliários e Câmbio (SEC, Securities and Exchange Commission), inclusive seu Formulário 10-K do ano fiscal encerrado em 31 de janeiro de 2016. As cópias dos relatórios apresentados à SEC são publicadas no site da empresa e estão disponíveis na NVIDIA gratuitamente. Essas declarações prospectivas não são garantias de desempenho futuro e referem-se apenas até esta data, e, salvo por determinação legal, a NVIDIA isenta-se de qualquer obrigação de atualizar tais declarações para refletir circunstâncias ou eventos futuros.

© 2016 NVIDIA Corporation. Todos os direitos reservados. NVIDIA, o logotipo da NVIDIA, Tesla, Pascal, Maxwell, NVIDIA NVLink, CUDA, NVIDIA GPU BOOST e DGX-1 são marcas comerciais e/ou marcas registradas da NVIDIA Corporation nos EUA e em outros países. Outros nomes de empresas e produtos são marcas comerciais das respectivas empresas às quais são associados. Os recursos, os preços, a disponibilidade e as especificações estão sujeitos a alterações sem prévio aviso.



 
 
TwitterFacebookLinkedInGoogle+Reddit