Noticias e Eventos

Novas placas NVIDIA Pascal aceleram a inferência de aprendizado profundo

 
 
Os aceleradores Tesla P4, P40 possibilitam a experiência com inteligência artificial de forma muito mais rápida

A NVIDIA anuncia as mais recentes adições a sua plataforma de deep learning baseada na arquitetura Pascal™. Tratam-se das novas NVIDIA® Tesla® P4 e P40 e os novos softwares TensorRT e DeepStream SDK, que juntos oferecem enormes saltos em eficiência e velocidade para acelerar a produção para serviços de inteligência artificial.

Modernos serviços de IA, como assistência ativada por voz, filtros de spam de email e mecanismos de recomendação de filmes e produtos estão crescendo rapidamente em termos de complexidade, exigindo até 10 vezes mais computação em comparação às redes neurais de um ano atrás. A atual tecnologia baseada em CPU não é capaz de oferecer capacidade de resposta em tempo real exigida pelos modernos serviços de IA, levando a uma insatisfação na experiência do usuário.

As Tesla P4 e P40 foram especificamente criados para inferência usando redes neurais profundas treinadas para reconhecer vozes, imagens ou texto em resposta a consultas de usuários e dispositivos. Baseadas na arquitetura Pascal, essas novas placas apresentam instruções de inferência especializadas baseadas em operações de 8 bits (INT8), oferecendo resposta 45 vezes mais rápida do que CPUs(1) e uma melhoria de 4 vezes sobre as soluções de placas lançadas há menos de um ano.(2)

A Tesla P4 oferece a mais alta eficiência no uso de energia para data centers e cabe em qualquer servidor com seu formato reduzido e seu design de baixo consumo de energia, que inicia em 50 watts, o que ajuda a torná-la 40 vezes mais eficiente no uso de energia do que as CPUs voltadas a produção.(3) Um só servidor com uma Tesla P4 substitui 13 servidores de CPU para cargas de trabalho de edição de vídeo,(4) oferecendo economia de mais de 8 vezes no custo total de propriedade, inclusive custos de servidor e energia.

A Tesla P40 oferece máxima taxa de transferência para cargas de trabalho de aprendizado profundo. Com 47 tera-operações por segundo (TOPS, Tera-Operations Per Second) de desempenho de inferência com instruções INT8, um servidor com oito aceleradores Tesla P40 pode substituir o desempenho de mais de 140 servidores de CPU.(5) Por cerca de US$ 5 mil por servidor de CPU, isso resulta em uma economia de mais de US$ 650 mil em custo de aquisição de servidores.

“Com a Tesla P100 e agora as Teslas P4 e P40, a NVIDIA oferece a única plataforma completa de deep learning para data center, revelando o enorme poder da IA para uma ampla gama de setores”, diz Ian Buck, gerente geral de computação acelerada na NVIDIA. “Elas diminuem o tempo de treinamento de dias para horas. Possibilitam que os conhecimentos sejam extraídos instantaneamente. Além disso, produzem respostas em tempo real para consumidores de serviços viabilizados pela IA.”

Ferramentas de software para inferência mais rápida
Complementando as Teslas P4 e P40 há duas inovações de software para acelerar a inferência de IA: NVIDIA TensorRT e o NVIDIA DeepStream SDK.

TensorRT é uma biblioteca criada para otimizar modelos de aprendizado profundo para implementação da produção que oferece capacidade de resposta instantânea para as redes mais complexas. Ela maximiza a taxa de transferência e a eficiência de aplicativos de aprendizado profundo usando redes neurais treinadas – definidas com operações de 32 bits ou 16 bits – e otimizando-as para proporcionar operações INT8 de precisão reduzida.

O NVIDIA DeepStream SDK explora o poder de um servidor Pascal para decodificar e analisar simultaneamente até 93 transmissões de vídeo HD em tempo real comparado com sete transmissões com duas CPUs.(6) Isso resolve um dos grandes desafios da IA: compreender o conteúdo em vídeo em escala para aplicativos, como carros autônomos, robôs interativos, filtragem e posicionamento de anúncios. Integrar o aprendizado profundo a aplicativos de vídeo permite que as empresas ofereçam serviços de vídeo inteligentes e inovadores que antes eram impossíveis de oferecer.

Um salto à frente para os clientes
Os clientes da NVIDIA estão oferecendo cada vez mais serviços inovadores de IA que exigem o mais alto desempenho de computação.

“Oferecer experiências simples e responsivas a cada um de nossos usuários é muito importante para nós”, diz Greg Diamos, pesquisador sênior na Baidu. “Implementamos placas de vídeo NVIDIA na produção para fornecer serviços viabilizados pela IA, como nosso sistema Deep Speech 2, e o uso de placas de vídeo possibilita um nível de capacidade de resposta que não seria possível em servidores não acelerados. A Pascal com seus recursos INT8 proporcionará um salto ainda maior à frente, e esperamos oferecer experiências ainda melhores a nossos usuários.”

Especificações Entre as especificações das placas de vídeo Tesla P4 e P40 estão:

Especificação Tesla P4 Tesla P40
TFLOPS de precisão simples* 5,5 12
TOPS INT8* 22 47
CUDA Cores 2.560 3.840
Memória GDDR5 da placa 8 GB 24 GB
Largura de banda de memória 192 GB/s 346 GB/s
Potência 50 Watts (ou mais) 250 Watts
* Com Boost Clock ativado

Disponibilidade
As NVIDIA Tesla P4 e P40 estão previstas para chegarem ao mercado em novembro e outubro, respectivamente, em servidores qualificados oferecidos por ODM, OEM e parceiros de canal.

Recursos de suporte

Sobre a NVIDIA
NVIDIA (NASDAQ: NVDA) é uma empresa de tecnologia computacional pioneira em computação acelerada por placas de vídeo. Ela tem como alvo os usuários mais exigentes — jogadores, designers e cientistas — com produtos, serviços e software que potencializam experiências incríveis em realidade virtual, inteligência artificial, visualização profissional e carros autônomos. Mais informações no site http://www.nvidia.com.br/object/newsroom-br.html.

Acesse também:
Site oficial da NVIDIA no Brasil: www.nvidia.com.br
NVIDIA no Facebook: NVIDIA Brasil
NVIDIA no Twitter: @nvidiabrasil
NVIDIA no Instagram: @nvidiabrasil

Informações para a Imprensa
Sing Comunicação de Resultados
André Forte, Janaína Leme, Tatiane Dantas, Vânia Gracio e Melissa Sayon
nvidia@singcomunica.com.br



 
 
TwitterFacebookLinkedInGoogle+Reddit