收藏本页 | 设成首页 | 联系我们
   欢迎光临北京百格威视网站!

百格威视科技BVT-D8000超性能计算系统

产品型号:BVT-D8000 产品简述:2颗新一代32nm Intel? Xeon? Westmere-EP 5600 系列处理器,高价值、高灵活性的塔式用高性能计算产品,先进的性能,出色的可扩展性,可以满足成长型企业和研究单位的广泛需求。 应用行业:适用于生命科学、地球科学、工程和科学、分子生物学、医学诊断、电子设计自动化(EDA)、政府和国防、可视化、金融建模、以及石油和天然气等的应用


BVT-D8000的性能及可靠性均经过优化,支持双Intel(R) Xeon(R) 5600 系列处理器,通过8个PCI-Express x16 插槽配置了8个 NVIDIA Tesla C2050/C2070/C2075 GPU,可提供8.24Teraflops的单精度浮点运算性能和4.12GFLOPS的双精度浮点运算性能,使其成为更多高性能计算应用的理想之选,能够更快地处理更加复杂的数据计算。这些高并行多 GPU 系统具有多重 X16 非阻塞固有 PCI-Express 2.0 连通性能,2400瓦 Gold Level(效率达93%以上)电源,另外还针对医疗成像、油气勘探、量子化学、财务模拟、基因组学和天体物理学等领域中众多图形和计算密集型应用进行了优化。 特性和优势:

  1. 全球最快的4U服务器 ,拥有8万亿次浮点运算能力,3,584 计算内核
  2. 4U系统可提供8.24Teraflops的单精度浮点运算性能和4.12Teraflops的双精度浮点运算性能
  3. 大规模CUDA并行架构,使工作站的功耗和成本分别降至原来的1/20和1/10,性能却能与小型集群媲美
  4. CUDA程序环境,支持多种编程语言和API,包括C、C++、OpenCL、DirectCompute或Fortran
  5. 具备内存数据保护功能,加强了应用数据的完整性和可靠性。注册文件、L1/L2高速缓存、共享内存和DRAM都处于ECC保护状态
  6. NVIDIA? 并行数据缓存(DataCache?)技术,能够对无法预知数据地址的算法进行加速,例如物理解算器、光线追踪、以及稀疏矩阵乘法等等
  7. NVIDIA? GigaThread? 引擎通过更快的上下文切换、同时内核执行以及改善的线程块调度功能,最大限度提升了吞吐量

NVIDIA Tesla GPU计算处理器能够推动整个行业向并行计算的过渡。代号为“Fermi”的下一代CUDA并行计算架构,支持高性能计算所“必备”的诸多特性,其中包括C++支持、可实现极高精度与可扩展性的ECC存储器以及7倍于Tesla 10系列GPU的双精度性能。Tesla GPU计算处理器旨在重新定义高性能计算并实现超级计算的平民化

与最新的六核CPU相比,Tesla GPU计算处理器以十分之一的成本和二十分之一的功耗即可实现同等超级计算性能。

全新一代Tesla 20系列GPU拥有颠覆性的性能特性,它们将大幅度提高并行计算在HPC领域中的实用性。它们具体表现为:

基于新一代FermiCUDA架构的CPU 与基于最新四核CPU的纯CPU系统相比,该CPU以十分之一的成本和二十分之一的功耗即可实现同等的集群性能。
448个CUDA核心 每颗GPU最高可实现515Gigaflop双精度峰值性能,从而让一台工作站即可实现Teraflop级甚至更高的性能。每颗GPU的单精度峰值性能超过1 Teraflop。
ECC存储器 能够满足工作站计算精度与可靠性方面的关键需求。能够为存储器中的数据提供保护功能,从而为应用程序增强数据完整性和可靠性。寄存器文件、L1/L2高速缓存、共享存储器以及DRAM均受ECC的保护。
台式机上的集群性能 与一个小型服务器集群相比,配备多颗GPU的单元工作站能够更快地解决大型难题。
每颗GPU最多配备6GB GDDR5存储器 更大的数据集能够保存在直接附属于GPU的本地存储器上,从而实现了性能的最大化并减少了数据传输的情况
NVIDIA并行DataGache 能够为物理效果解算器、光线追踪以及稀疏矩阵乘法等诸多算法加速,在这些算法中,数据地址事先都是未知的。每个流式多处理器模块均包含一个可配置的L1高速缓存,所有处理器核心使用统一的L2高速缓存。
NVIDIA GigaThread 引擎 通过多项技术实现了吞吐量的最大化,其中包括10倍于上一代架构的高速上下文切换、并发内核执行以及改良的线程块调度。
异步传输 计算核心在PCIe总线上传输数据的同时还能够处理其他数据,因而增强了系统性能。即便是地震处理这类需要大量数据传输的应用程序,也能够通过事先将数据传输至本地存储器的方法来最大限度提升计算效率。
CUDA编程环境受到各种编程语言与API的广泛支持 开发人员无论选择C语言、C++、OpenCL、DirectCompute还是选择Fortran语言,都能够实现应用程序的并行机制,进而利用“Fermi”GPU的创新构架。Microsoft Visual Studio开发人员可以使用NVIDIA Parallel Nsight工具。

为了充分发挥CUDA并行计算架构的威力,BVT-D4000 CUDA-GPU超级计算机为其搭配了Intel Xeon 5600计算平台。Xeon 5600系列处理器采用32nm制程,实现了双路总计6物理核心和24逻辑线程。Xeon 5600平台具有众多智能特性,诸如3通道直连DDR3内存控制器,快速通道互联技术(QuickPath Interconnect Technology),超线程技术(Hyper-Threading Technology),智能加速技术(Turbo Boost Technology)。将Tesla GPU计算处理器与Xeon 5600计算平台相结合,使应用程序的计算密集型部分与顺序逻辑部分分别在GPU与CPU上高效地运行,实现高性能计算的效能飞跃。

BVT-D8000 CUDA-GPU超级计算机以按需配置为理念,实现了八路的大规模GPU集成,具备8TFlops级别的浮点计算能力,专为追求极致性能的超级计算应用所打造。产品标准配置热插拔式硬盘驱动器抽取盒,支持各种主流磁盘阵列。标准配置的英特尔PRO/1000 PT双端口千兆位以太网适配器,原生支持iSCSI与虚拟化技术,为集群集群环境提供高性能的存储与高可用性支持。用户还能根据计算环境选择配备10Gbps万兆位以太网络适配器、8Gbps Fibre Channel适配器或者40Gbps InfiniBand适配器作为其外部互联接口。

所有高性能计算产品均带有三年整机质量保证,并提供即时响应的技术支持,使用户毫无后顾之忧。 BVT-D8000 CUDA-GPU超级计算机规格表

部件 规格
GPU 八路Tesla 20构架GPU,具备3584个Tesla20构架CUDA核心 峰值单精度浮点性能8.24 Teraflops,峰值双精度浮点性能4.16 Teraflops 搭载48GB专用存储器,带宽达到288GB/S
GPU 双路XEON 5690,3.46 GHz主频,总设计12物理核心,24逻辑线程 基于westmere计算构架:3通道直连DDR3内存控制器,快速通道互联技术,超线程技术,智能加速技术
主内存 标配48GB DDR3 ECC Registered DIMM,最高可扩至192GB
磁盘 标配1000GB大容量企业级SATAII硬盘 标配8个3.5英寸外置式SAS/SATA热插拔硬盘驱动器抽取盒 可选配15000RPM SAS 6Gbps 高性能硬盘或固态硬盘(SSD) 可选配支持RAID 0/1/10/5/6阵列控制器
其它规格 标准4U机架式机箱,176mm(Height)X438mm(Width)X710mm(Depth) 2400W高性能2+1冗余电源

版权所有: 北京百格威视科技有限公司所有

联系电话: 010-82569760 传真: 010-82569761

地址: 北京市海淀区苏州街3号大河庄苑6号楼508室

京ICP备0340404号