Arch2030 A Vision of Computer Architecture Research over the Next 15 Years
Arch2030: A Vision of Computer Architecture Research over the Next 15 Years (2016, Mark D. Hill report)
1. 新的挑战:如何为信息技术的持续发展奠定基础性的未来(how to secure a foundational future for information technology’s continued progress)
2. 目标:找出体系结构研究可以弥合应用程序和设备领域(device domain)之间差距的机会。
3. 2011-2016年之间发生的变化
-
明显的专有化(specialization)方面的差距,即现有的硬件趋势与应用程序需求之间存在差距。如果没有专用的硬件,则无法实现某些应用,例如VR和自治(autonomous)系统,并且硬件设计仍旧是昂贵困难的
-
云计算,真正的无处不在,提供了一个清晰的"innovation abstraction"。云计算创造了可扩展经济,使得巧妙的跨层优化具有成本效益,同时甚至透明地向最小的新企业和初创企业提供了这些创新
-
通过裸片堆叠和单片制造的3D集成实现垂直发展,使得硅基板嫩巩固垂直生长,显著的减少了延迟,提高了带宽和能效
-
接近物理学:创新的材料,例如碳纳米管,生物聚合物,量子计算等,以提供那个能有效的开关,更紧密的原件排列或者新的计算模型
-
机器学习已经成为主要工作负载。(各种应用的促进)
4. 专有化的鸿沟:促使硬件设计大众化/民主化
- 目标:硬件开发必须变成向软件开发一样容易,廉价和敏捷,以保持计算机行业的创新
- 随着摩尔定律的放缓和Dennard缩放技术的结束,处理器设计发生的变化:每次操作的能效已取代了面积效率或者峰值开关速度作为限制峰值性能的最重要的设计约束
- 能效很重要,但是不断涌现的新应用需求的计算能力越来越多,尤其是大规模机器学习的应用,从图像和语音识别到自动驾驶,再到人类专家。
- 专用硬件设计:部分计算密集应用中的新策略
- 与通用芯片相比,专用硬件可以将每次操作的能效提高多达10000倍
- 专用化带来的能效提升对物联网十分重要,同时在图形渲染和视频播放中也取得了巨大成功
- 专有化硬件的问题:设计和制造专用硬件的成本对所有企业来说都是高得无法承受的,只有极少数的设计可以在广阔的市场上摊销它
- 解决:大众化硬件设计,使硬件设计变得像软件设计一样敏捷,便宜和开放
- 软件开发团队可以利用现有的可重用组件(通常是免费和开放源代码)的丰富生态系统
- 可以使用高级语言来提高单个开发人员的能力
- 可以依靠有能力且自动化的程序分析,综合,测试和调试辅助工具确保高质量的硬件设计
5. 云 是体系结构创新的抽象(the cloud as an abstraction for architecture innovation)
- 通过利用可扩展性和虚拟化,云计算提供商可以透明、低成本地为最小的客户提供硬件创新
- 云计算对正常业务的破坏性已被广泛认可。云可以让新企业的扩张速度远超过传统的基础设施投资(infrastructure investment)。(云资源租赁中的成本效益)
- 云计算模型的两个关键优势:可扩展性和虚拟化,为跨层体系结构创新提供了强大的抽象能力。
- 通过虚拟化(一类技术),可以将新的硬件和软件创新透明地引入到现有的软件系统中。另一方面,云供应商可以将处理,存储和网络组件更换为更快、更便宜的技术,而无需和客户进行协调
- 虚拟化技术还可以实现资源的超额订购(oversubscription),在对特定资源具有时变(time-vary)和零碎特点的资源需求的客户之间透明的共享资源,从而允许云提供商以远低于那些购买专用资源的个人客户的价格提供资源
- 架构研究需要缩小虚拟化和裸机型性能之间的差距,并且开发新的虚拟化抽线,以实现对TPU,AISC云等专用硬件单元的透明使用和超额订购
6. 走向垂直:3D集成,可扩展性的新维度
- 在最近的硅世代中,驱动芯片全局的布线相对于计算而言变得越发昂贵,互连在总芯片的功耗预算中的占比也越来越大
- 3D集成为芯片设计中的可扩展性提供了新的维度,尽管摩尔定律已经结束,但是仍旧可以继续在单个系统中集成更多的晶体管,并通过在三个维度上的布线来缩短互连,促进异构制造技术的紧密集成
- 3D集成可以实现更高的能效,更高的带宽和更低的2D结构内部系统组件之间的延迟
- 在结构上,3D集成意味着对于平衡的系统,计算必须接近数据。3D-stacking已经促使了近数据计算(near-data computing)和内存中处理(processing-in-memory)的重新兴起
- 3D集成带来新的挑战:
- 提供高可靠性和良率(利用体系结构支持解决)
- 电源和散热管理的新挑战
7. Architectures “Closer to Physics”
- 历史上,新设备技术和电路设计技术推动了新架构的发展
- 未来可能的第一类技术:通过更有效的信息编码,更好地利用当前的材料和设备,使其更接近于模拟电路。(模拟计算和适合精度折衷的应用程序非常匹配,并且模拟信号处理相对于数字信号处理功耗更低,效率更高,但是容易受噪声影响)
- 第二类技术:使用新材料,包括提供更高效的开关,更密集的排布和独特的计算模型
- 新的存储设备
- 碳纳米管代替硅,密度更高,功耗更低
- 量子计算,允许同时表示0和1状态。另一个方面是超导逻辑(superconducting logic)提供”自由“的通信,减少能耗。
- 利用生物学中的知识。DNA计算,存储等
8. 机器学习将是关键的工作负载
- 大量的数据与丰富的计算能力共同推动了机器学习在一些应用领域的重大进展,包括图像语音识别,自动驾驶等
- 大型机器学习应用驱动着从存储系统到专有硬件的设计
- 虽然目前的重点在于如何在云中支持机器学习,但是在未来很有可能在智能手机或者其他低功耗设备中使用ML应用
- 机器学习内核具有相对规则的结构,可以在精度-资源之间进行权衡,因此很适合硬件专有化,重构(reconfiguration)和近似技术。