Exibições Complementares

Módulo de computação de GPU Tesla M2050/M2070

As soluções dos parceiros da NVIDIA, baseadas no módulo de computação de GPU NVIDIA® Tesla™ M2050/M2070, fornecem potência de supercomputação a 1/20º do consumo de energia e 1/10º do custo, e proporcionam a mais alta densidade de computação do mundo para clusters departamentais e implantações de centro de dados.

 
Baseados na arquitetura CUDA de próxima geração conhecida como “Fermi”, os Módulos de computação Tesla M2050 e M2070 permitem integração contínua de computação de GPU com sistemas host para uma computação de alta performance e grandes implantações de escalabilidade horizontal de centros de dados. As GPUs Tesla série 20 são as primeiras a entregar uma potência de precisão dupla mais de 10 vezes superior a uma CPU x86 quad-core e as primeiras a fornecer memória ECC. Os módulos Tesla M2050 e M2070 fornecem todos os benefícios padrão da computação de GPU, ao mesmo tempo em que permitem máxima confiabilidade e integração próxima com ferramentas de gestão e monitoramento de sistema. Isso proporciona à equipe de TI do centro de dados muito mais opções com relação a como as GPUs são implantadas, com uma ampla variedade de sistemas blade e sistemas montados em rack, além dos recursos de monitoramento e gerenciamento remotos de que a equipe precisa.

Em comparação com sistemas apenas de CPU, os servidores com Módulos de computação de GPU Tesla série 20 fornecem potência de supercomputação a 1/10º do custo e 1/20º do consumo de energia, enquanto proporcionam a mais alta densidade de computação.


Recursos

GPUs baseadas em arquitetura CUDA de geração Fermi Fornecem performance de cluster a 1/20º da potência e 1/10º do custo de sistemas apenas de CPU com base nas CPUs quad-core mais recentes.
448 núcleos CUDA Fornecem até 515 Gigaflops de performance de pico de precisão dupla em cada GPU, permitindo que servidores de OEMs líderes entreguem um Teraflop ou mais de performance de precisão dupla por 1 RU de espaço. A performance de pico de precisão simples é mais de um Teraflop por GPU.
Memória ECC Atende a um requisito essencial para a precisão da computação e a confiabilidade para centros de dados e de supercomputação. Oferece proteção de dados em memória para aprimorar a integridade de dados e a confiabilidade para aplicativos. Arquivos de registro, caches L1/L2, memória compartilhada e DRAM, todos protegidos por ECC.
Até 6 GB de memória GDDR5 por GPU Maximizam a performance e reduzem as transferências de dados, mantendo conjuntos de dados maiores na memória local conectada diretamente à GPU.
Recursos de monitoramento do sistema Integram o subsistema da GPU com os recursos de monitoramento e gerenciamento do sistema host. Isso significa que a equipe de TI pode gerenciar todos os componentes essenciais do sistema de computação por uma interface de gerenciamento comum, como ferramentas proprietárias de OEMs ou IPMI.
Projetado para confiabilidade máxima O design com dissipador térmico elimina peças móveis e cabos.
NVIDIA Parallel DataCache™ Acelera algoritmos como solucionadores físicos, traçado de raios e multiplicação de matriz esparsa, onde endereços de dados não são conhecidos antecipadamente. Isso inclui um cache L1 configurável por bloco de multiprocessador de fluxo contínuo e um cache L2 unificado para todos os núcleos do processador.
Mecanismo NVIDIA GigaThread™ Maximiza a taxa de transmissão por alternância de contexto, 10 vezes mais rápida do que a arquitetura anterior, execução de kernel simultânea e agendamento de bloqueio de segmentos aprimorado.
Transferência assíncrona Intensifica a performance do sistema transferindo dados pelo barramento PCIe enquanto os núcleos de computação estão processando outros dados. Até mesmo aplicativos com requisitos de transferência de dados pesados, como o processamento sísmico, podem maximizar a eficiência de computação transferindo dados para a memória local antes que eles sejam necessários.
Ambiente de programação CUDA com amplo suporte de linguagens de programação e APIs Escolha C, C++, OpenCL, DirectCompute ou Fortran para expressar o paralelismo de aplicativos e aproveitar a arquitetura inovadora “Fermi”.
Transferência de dados PCIe Ger. 2.0 de alta velocidade Maximiza a largura de banda entre o sistema host e os processadores Tesla. Permite que os sistemas Tesla trabalhem com praticamente qualquer sistema que seja compatível com o PCIe e tenha um slot PCIe vago (x8 ou x16).

Para inscrever-se e receber alertas de novidades a respeito de produtos Tesla e aplicativos acelerados, clique aqui.

Tesla Bio Workbench
Tesla 10 series
Tesla Personal Supercomputer
Cuda Zone