图形工作站、集群应用方案
  • 网站首页
  • 商城
  • 产品
  • 行业计算
  • 科学工程计算
  • 化学&生物
  • 图形设计
  • 图像处理
  • 视景仿真
  • 人工智能
  • 影视后期
全球领先的高端图形工作站供应商

免费测试 热线 : 400-7056-800 【 为任何应用提供 最快计算设备 如不符,退货】【最新报价】【选购指南】【京东商城】



企业通用模版网站

  • 科研团队全能超算平台25v1
  • 超高分拼接 数字孪生
  • 科学计算MatLAB工作站24
  • 地质建模 油藏模拟工作站
  • 工业CT扫描 机器视觉计算
  • 电力系统关键应用配置24
  • 网站首页
  • 商城
  • 产品
  • 行业计算
  • 科学工程计算
  • 化学&生物
  • 图形设计
  • 图像处理
  • 视景仿真
  • 人工智能
  • 影视后期
  • 送无人机啦 8核6.4GHz  96核4.8GHz 加速改装 

  • 高性能集群 虚拟并行计算 芯片设计 光学仿真 

  • 蛋白质预测 生物信息 冷冻电镜 材料模拟

  • RSS订阅
  • 理科计算推荐
  • 仿真计算最快最完美25v1
  • 电磁仿真单机与集群25v1
  • 航拍实景建模单机集群
  • 遥感图像处理工作站集群
  • 4K/8K剪辑特效调色24v1
  • AI大模型工作站集群25v1
  • Abaqus硬件配置大全24v3
  • CST电磁仿真工作站25v1
  • 多物理场仿真单机与集群
  • 流体/空气动力学仿真25v1
  • 量子化学 分子动力模拟
  • 三维设计24v2  3D打印

 

您的位置:UltraLAB图形工作站方案网站 > 人工智能 > 深度学习 > 7大改进 NVIDIA第2代CUDA架构Fermi分析

7大改进 NVIDIA第2代CUDA架构Fermi分析

时间:2009-10-14 19:51:00   来源:UltraLAB图形工作站方案网站   人气:8841 作者:admin

在2009 NVIDIA GPU技术大会上,NVIDIA发布了新一代的GPU并行计算架构Fermi,这也是继去年NVIDIA发布GT200 GPU时提出“图形渲染+并行计算”的概念,并在这两年时间里不断赋予并推动GPU在并行运算方面的应用后,再次强调“架构”,并正式命名Fermi。

  

 

  在NVIDIA官方说法看来,Fermi是继G80架构(G9x,GT200都属于G80第一代并行计算GPU架构,但当年没有命名)后,对GPU作出重大改进的一次革命性产品。对于GPU并行计算而言,Fermi是第一个完美的适合并行运算的处理器。接下来,我们来看一下Fermi的几个重要的革新内容。

  

 

  第一,Fermi支持包括C++在内的 C, Fortran, Java, Python, OpenCL and DirectCompute.多种语言或API接口的开发。

  

 

  Fermi架构示意图

  第二,为了更好的用于GPU高性能计算,显存控制器支持ECC显存,这对于高性能运算来说是非常重要的。

  

 

  新的缓存与显存架构

  第三,NVIDIA并行数据缓存(Parallel DataCache),在以往尤其是GT200上对于每组流处理器都提供了共享缓存,这也是NVIDIA GPU在并行计算上绝对领先对手的一个硬件上的优势。而此次Fermi架构更加加强了这一环。为流处理器增加了L1和L2的Cache,听上去这有点像CPU做法,的确Cache的增加带来了晶体管数增加,但意义非常重大。

  第四,512个CUDA架构的双精度浮点运算单元,对于GeForce用户可以等效认为是512个流处理器。

  

 

  现场Fermi特点PPT

  第五,NVIDIA GigaThread Engine ,这个内核引擎带来了很多不同。其中支持16核为一组的任务并发运算,而以往GPU并行运算只支持数据并行运算。

  

 

  双精度运算演示

  第六,8倍于现在Tesla1060的双精度浮点运算能力。在GT200发布时,近1T的浮点运算能力让大家兴奋,而我们知道全球HPC排行中一般按照Linpack的双精度运算能力为标准。GT200时GPU的双精度运算能力是单精度的1/10-1/8。此次Fermi架构的演示产品可以都达到8倍于Tesla 1060的水平。双精度的支持也对很多HPC领域是非常必要的。

  

 

  更多的高性能运算需求

  第七,Nexus开发组件的推出。Nexus是整合于Microsoft Visual Studio中的一个开发组件,包括 Nexus调试器, Nexus分析器,Nexus图形检查器。它是业界首个集成GPU/CPU环境的开发组件。

  

 

  Nexus在Visual Studio下的三大组件

  总结

  到底什么是Fermi?这对于从GeForce开始关注NVIDIA的大多数用户来说似乎不好理解。不过通过我们以上几点总结可以看出NVIDIA自G80发布后的一些新思路。首先毫无疑问的是,NVIDIA此次发布Fermi后将率先用于Tesla并行计算产品上,但这并不影响Fermi随后用于GeForce产品中,当然Cache和显存控制器方面有什么差别目前并不知道。

  

 

  光线追踪搭建的3D实时环境

  第二,无论从软件还是硬件角度来看,Fermi的改变非常明显,经过了G80到GT200四年多市场的考验,Fermi成为了第一个真正意义上的完美的并行处理器。与G80刚发布时不同,此时NVIDIA的Fermi有从软件到硬件以及无数开发者、数万件以上开发成品、千万片支持CUDA GPU等各方面条件的支撑(2008年才有CUDA 2.0,这才迎来了CUDA迅速的发展,G80发布时显然条件比Fermi差远了)。

  第三,Fermi在缓存设计上是重大改变之一,而在双精度运算能力方面也达到了很高的水平。对于传统的图形渲染来说,似乎这并没有特别直接的联系。而我们知道,接下来的3D世界应该向两个方向发展:物理引擎和光线追踪。这其实都是并行运算,这也意味着Fermi或者使用Fermi的GeForce已经为未来应用打好基础。GPU的未来,甚至是未来的3D世界已经向并行运算转变。

  

 

  所以,NVIDIA选择以并行运算处理器的身份发布 #p#page_title#e#Fermi并不影响GeForce方面的应用,根据NVIDIA消息Fermi会首先使用在Tesla上,而预计在圣诞节前Fermi架构的GeForce肯定会上市

关闭此页
上一篇:可作CPU的GPU NV GT300显卡架构详细解绍
下一篇:代号“Fermi”–NVIDIA(英伟达)推出下一代CUDA GPU架构

相关文章

  • 05/12AMD 第 6 代 EPYC Venice:发现 CCD 配置和线程性能
  • 05/12UltraLAB定制图形工作站产品介绍2025v2
  • 05/09Xeon6代+4块GPU--图灵超算工作站GT450M介绍
  • 05/09汽车风阻测试模拟分析、算法,及服务器/工作站计算设备硬件配置推荐
  • 04/26高频交易(HFT)应用分析、算法,服务器/工作站硬件配置推荐
  • 04/25衍生品定价与风险对冲应用分析、算法,及服务器工作站硬件配置
  • 04/25量化交易策略应用算法分析、服务器工作站硬件配置
  • 04/24金融风险管理应用算法分析、服务器/工作站硬件配置推荐
  • 04/19油藏模拟软件的算法分析以及图形工作站/服务器硬件配置推荐25v2
  • 04/17大型3D设计软件CATIA-算法分析与图形工作站硬件配置

工程技术(工科)专业工作站/服务器硬件配置选型

    左侧广告图2

新闻排行榜

  • 1如何在本地运行 Llama 3 8B 和 Llama 3 70B及硬件配置推荐
  • 2NVIDIA GeForce GTX 280测试报告
  • 3比GTX280快10倍-Quadro VX200专业卡评测
  • 4深度学习训练与推理计算平台硬件配置完美选型2020v1
  • 5高性能仿真计算集群(结构、流体、多物理场耦合)配置推荐2024v1
  • 62019年最快最全深度学习训练硬件配置推荐
  • 7Llama-2 LLM的所有版本和硬件配置要求
  • 8支持7块RTX3090静音级深度学习工作站硬件配置方案2021v2
  • 9HFSS电磁仿真应用与工作站配置方案
  • 10解锁最大推理能力:深入研究80GB A100 GPU 上的Llama2–70B

最新信息

  • 性能直逼6710亿参数DeepSeek R1--- QwQ-32B推理模型本地硬件部署
  • 史上最神的AI静音工作站---算命、炒股、看病、程序设计、销售策划、仿真计算、3D设计、药物设计、基因测序、大数据分析
  • 用中文训练更快-满血版Deepseek R1本地部署服务器/工作站硬件配置精准分析与推荐
  • DeepSeek R1训练和推理一体式服务器/工作站硬件配置、部署具体步骤
  • DeepSeek V3推理和训练一体式服务器/工作站硬件配置、部署具体步骤
  • DeepSeek R1/V3应用-服务器/工作站/集群配置推荐
  • 生成式AI热门应用、算法及对计算机硬件配置要求
  • llama3.2本地系统+软件安装运行、主要应用、计算硬件要求、最新GPU服务器配置参考

应用导航:

工作站产品中心 京东商城 中关村商城 淘宝商城 超高分可视化商城 便携工作站商城 ANSYS CATIA Microsoft INTEL NVIDIA 网站统计

公司简介-业务咨询-招聘英才-资料下载-UM-

本网站所有原创文字和图片内容归西安坤隆计算机科技有限公司版权所有,未经许可不得转载
陕ICP备16019335号 陕公网安备61010302001314号
Copyright © 2008-2023 , All Rights Reserved

首页
热线
商城
分类
联系
顶部