计算机体系结构量化研究方法——学习(一)
计算机体系结构量化研究方法学习
量化设计与分析基础
20世纪80年代成功地开发了新的体系结构RISC体系结构。
计算机的分类
个人移动设备(PMD)
带有多媒体用户界面的无线设备,比如手机、平板电脑等。
成本主要因素是功耗和电池。多媒体应用程序的关键特性是响应性能和可预测性能。
桌面计算
一级市场是桌面计算市场
服务器
服务器的角色逐渐变为提供更大规模更可靠的文件和计算服务。可用性是至关重要的,第二个关键特征是可扩展性,最后一个是吞吐能力。
集群/仓库级计算机
最大规模的集群称为仓库级计算机(WSC),他们设计的方式使数万个服务器像一个服务器一样运行。
性价比和功耗非常关键。
嵌入式计算机
嵌入式计算机在日用电器中随处可见。
并行度与并行体系结构的分类
多种级别的并行度已经称为计算机设计的推动力量,而能耗和成本则是主要约束条件。
- 数据级并行(DLP),同时操作许多数据项。
- 任务级并行(TLP)
计算机以4种主要方式来发开这两种类型的应用并行。
- 指令集并行,利用流水线之类的思想湿度开发数据级并行
- 向量体系结构和图形处理器并行
- 线程并行
- 请求级并行在程序员或者操作系统指定的大量去耦合任务之间开发并行,可能就是进进程并行
计算机体系结构定义
计算机时期性能和能耗效益达到最近,同时还要满足成本、功耗和可用性的约束条件。这包括很多方面:指令集设计、功能组织、逻辑组织、实现方式。
指令集体系结构(ISA)
ISA分类
几乎所有的ISA都划分到通用寄存器体系结构中
寄存器寻址
几乎所有的计算机都是用字节来访问存储器操作数
寻址模式
除了指定寄存器和常量操作数之外,寻址模式还制定了一个存储器对象的地址。
操作数的类型和大小
常用的有8位(ASCII字符),16位(半个字),32位(字),64位(双字或长整型)
操作指令
数据传输指令、算术逻辑指令、控制指令、和浮点指令。
控制流指令
几乎所有的ISA都支持条件转移,无条件转移,过程调用和 返回
ISA的编码
有两种基本的编码选择,固定长度和可变长度。
真正的计算机体系结构
计算机的实现包括两个组成和硬件。
- 组成一词包括了计算机设计的高级内容,比如存储器系统,存储器互连,cpu等。
- 硬件一词是指一个计算机的具体实现,包括详尽的逻辑设计和封装设计。
在计算机体系结构这本书中,主要涵盖了指令集体系结构、组成和硬件
未来趋势
性能趋势:带宽胜过延迟
带宽和吞吐量是指在给定时间内完成的工作总量。
延迟是衣蛾时间从开始到完成所经历的时间。
特征尺寸的下降
特征尺寸就是一个晶体管或者一条连线在某坐标轴方向的最小尺寸。
功率和能耗
是最大挑战,功率以热的形式耗散。
一共有三个注意的事项。
- 一个处理器的最大的功耗。如果处理器师徒几区的功耗大于电源系统能提供好的功率,其结果通常会导致电压下降。
- 持续功耗。这个度量普遍称为热设计功耗(TDP)。它决定了冷却需求。
- 能耗和能耗效率
处理器内部的能耗和功耗:对CMOS芯片来说,传统的主要能耗源是开关晶体管,也成为动态能耗。
现代微处理器提供了许多技术,试图在保持电压和频率的情况下,提高能耗效率。
- 关闭非活动模块的时钟
- DVFS
- 针对典型情景的设计。比如在内外存储器提供了低功耗模式。
- 超频
静态功耗主要是截止状态时也存在泄露电流。
成本趋势
集成电路的成本。
可信任度
性能的测量、报告和汇总
基准测试
简单程序将导致性能隐患
简单程序包括:
程序内核,玩具程序,合成基准测试程序
另一个问题是运行基准测试的条件。
流行的做法是使用基准测试应用程序集来衡量处理器处理各种应用程序
计算机设计的量化原理
充分利用并行
局域性原理
程序常常重复使用他们最近用过的数据和指令。一条广泛的经验规律是,一个程序90%的时间花费在10%的代码中。这意味着我们可以根据一个程序最近访问的指令和数据,比较准确的预测它最近会使用那些内容。
重点关注常见情形
Amdahl定律
根据定律可以计算出通过改进计算机摸一部分而能获得的性能增益。这个定律阐述了一个汇报递减规律:如果仅改进一部分计算的性能,在增加改进时,所获得的加速比增量会逐渐减小。
处理器性能公式
谬论
最喜欢这一小节