体系结构复习重点

发布 2021-05-02 13:55:28 阅读 6089

注:红色代表不确定,玫粉色是加进去的。

第一章不考大题,第二章不考概念。

一、小题。1 amdahl定律。

系统中某一部件由于采用更快的执行方式后,整个系统性能的提高与这种执行方式的使用频率或占总执行时间的比例有关。

2 指令级并行。

一种平行计算形式,在一个程式运行中,许多指令操作,能在同时间进行。

3 程序的局部性原理:

是指程序在执行时呈现出局部性规律,即在一段时间内,整个程序的执行仅限于程序中的某一部分。相应地,执行所访问的存储空间也局限于某个内存区域。

4 透明性概念。

定义:本来存在的事物或属性,从某种角度看似乎不存在。

5 大概率事件优先原则。

对于大概率事件(最常见的事件),赋予它优先的处理权和资源使用权,以。

获得全局的最优结果。

7 超标量处理机。

采取设置m条指令流水线同时并行,来实现并行度为m的处理机。

8 向量流水处理。

把要解决的问题转化成向量运算,采用横向,纵向,纵横处理方式。

对向量各分量进行独立并行的处理。

9 系列机。

具有相同的系统结构,但组成和实现技术不同的一系列计算机系统。

兼容(软件,硬件); 兼容最基本特征; 向右兼容

11 并行性指令内部指令级线程级任务级作业级。

指计算机系统具有可以同时进行运算或操作的特性,在同一时间完成两种或两种以上工作。它包括同时性与并发性两种含义。同时性指两个或两个以上事件在同一时刻发生。

并发性指两个或两个以上事件在同一时间间隔发生。

14写直达法写回。

写直达法:在执行写操作时,不仅把信息写入cache中相应的块,而且也写入下一级存储器中相应的块。

15 加速比。

加速比(speedup),是同一个任务在单处理器系统和并行处理器系统中运行消耗的时间的比率,用来衡量并行系统或程序并行化的性能和效果。

16 数据相关。

在执行本条指令的过中,如果用到的指令、操作数、变址偏移量等正好是前面指令的执行结果,则必须等待前面的指令执行完成,并把结果写到主存或通用寄存器中之后,本条指令才能开始执行,这种相关称为数据相关。

17 控制相关。

条件分支指令、转子程序指令、中断等引起的相关。

18 存储器系统。

计算机中的存储系统是用来保存数据和程序的。对存储器最基本的要求就是存储容量要大、存取速度快、成本**低。为了满足这一要求,提出了多级存储体系结构。

一般可分为高速缓冲存储器、主存、外存3个层次,有时候还包括cpu内部的寄存器以及控制存储器。

20 虚拟机。

指通过软件模拟的具有完整硬件系统功能的、运行在一个完全隔离环境中的完整计算机系统。

二、简单问答题。

1计算机体系结构:

计算机系统结构就是计算机的机器语言程序员或编译程序编写者所看到的外特性,是硬件子系统的概念结构及其功能特性。

2 cpi每条指令所需的平均时钟周期数。

3 软件兼容。

一个软件可以不经修改或者只需要少量修改就可以由一台计算机移植到另一台计算机上运行,差别只是执行的时间不同。

4**与模拟。

**是指用微程序的方法在一台计算机上实现另一台计算机的指令系统。

模拟是指用软件的方法在一台计算机上,实现另一台计算机的指令系统,5 时间重叠,资源重叠。

时间重叠:在并行性概念中引入时间因素,让多个处理过程在时间上相互错开,轮流重叠的使用同一套硬件设备的各个部分,以加快硬件周转而赢得速度。

以数量取胜,通过重复设置硬件资源,大幅度的提高计算机系统的。

资源重叠(重复):在并行性概念中引入空间因素性能。

6 先行控制器。

先行控制器处理机结构:包括三个独立的控制器和四个缓冲栈。其中三个控制器为:

存储控制器、指令控制器、运算控制器。四个缓冲栈:先行指令缓冲栈、线性读数缓冲栈、现行操作栈,后行写数栈。

7 紧密耦合系统,松散耦合系统(smp,mpp)

紧密耦合系统:机间物理连接的频带较高,它们往往通过总线或者告诉开关实现互联,可以共享主存。

松散耦合系统:通过通道或者通信线路实现计算机间互联,共享某些外围设备,机器间的相互作用是在文件或者数据集一级进行。

8异构型多处理机系统,同构型多处理机类型。

同构型(对称型)多处理机:由多个同类型,至少担负同等功能的处理机组成,同时处理同一作业中能并行执行的多个任务。

异构型(非对称型)多处理机:由多个不同类型,至少担负不同功能的处理机组成,按照作业要求的顺序,利用时间重叠原理,依次对它们的多个任务进行加工,各自完成规定的功能动作。

9 佛林分类。

他按照指令流和数据流的多倍性特征对计算机系统进行分类,把计算机系统分4大类:单指令流单数据流、单指令流多数据流 、多指令流单数据流、多指令流多数据流

10 并行等级划分。

(1) 指令内部并行:指令内部的微操作之间的并行。

2) 指令级并行(instruction level parallel,ilp):并行执行两条或多条指令。

3) 任务级或过程级并行:并行执行两个或多个过程或任务(程序段)。

4) 作业或程序级并行:在多个作业或程序间的并行。

11堆栈型机器通用计算型。

一种计算模型。这种类型的电脑,内存以堆栈(stack)储存。它的指令集中包含了零位址指令("0-operand" instruction set)。

硬件在执行运算时,到堆栈的顶端去取出算子,至运算结束时,再储存到堆栈的顶端。

12 risc指令系统的设计原则。

a大多数指令在单周期内完成

b采用load/store结构

c硬布线控制逻辑。

d减少指令和寻址方式的方案。

f固定的指令格式。

g注重译码的优化。

13 静态流水、动态流水。

动态流水线在同一时间内允许按多种不同运算的联结方式工作。静态流水线在同一时间内只能按一种运算的联结方式工作。

14 分支指令调度。

分支条件由指令确定,提供一组比较指令,用于比较两个寄存器的值。有的分支指令可以直接判断寄存器内容是否为负,或者比较两个寄存器是否相等。分支的目标地址由16位带符号偏移量左移两位后和pc相加的结果来决定一条浮点条件分支指令:

通过测试浮点状态寄存器来决定是否进行分支。

15 链接技术,分段开采。

当利用向量指令间存在的先写后读的数据相关性来加快向量指令序列执行速度的技术称为链接技术;向量的长度大于向量寄存器的长度时,必须把长向量分成长度固定的段,采用循环结构处理这个长向量,这种技术称为向量循环开采技术,也称为向量分段开采技术。

16 半性能向量长度。

达到一半最大性能值所需的向量长度。

17 超流水。

通过细化流水,提高主频,使得机器在一个周期内完成一个甚至多个操作,其实质是用时间换取空间。

18 cisc

复杂指令集cpu内部为将较复杂的指令译码,也就是指令较长,分成几个微指令去执行,正是如此开发程序比较容易(指令多的缘故),但是由于指令复杂,执行工作效率较差,处理数据速度较慢,pc 中 pentium的结构都为cisc cpu。

三、计算题。

1、amdahl定律(见书p10两个例子)

系统中某一部件由于采用更快的执行方式后,整个系统性能的提高与这种执行方式的使用频率或占总执行时间的比例有关。

改进后整个系统的加速比达到:

题]假定我们利用增加向量处理模块来提高计算机的运算速度。计算机处理向量的速度比其通常的运算要快20倍。我们将可用向量处理部分所花费的时间占总时间的百分比称为可向量化百分比。

1)求出加速比s和可向量化百分比f之间的关系式。

2)当要得到加速比为2时的可向量化百分比f为多少?

解]1)2) 由上式,将 s=2 代入得:

f = 10/19 = 0.53

2、cpi和等效cpi(p11)

平均时钟周期数cpi:平均每条指令执行所需的时钟周期。

越少,程序执行越快。这主要取决于cpu的体系结构,包括指。

令系统的设计、指令时序过程的安排等。

cpi的含义: 以cpu为评估的模块,以指令系统中各条指令被执行的概率(频度)为依据,以平均每条指令所花费的时钟周期数标尺,对cpu的速度进行评估。

cpu时间=cpu时钟周期数/频率;

cpu时间=cpu时钟周期数*时钟周期长;

cpu时间=(ic*cpi)/频率f;

平均时钟周期数cpi=cpu时钟周期数/ic(指令的条数);

[^}i_)'altimg': w': 276', h': 68'}]

通常用mips和mflops反映系统(cpu)吞吐率:

mips(million instructions per second)

mips = altimg': w': 126', h': 46'}]altimg': w': 78', h': 46'}]

mflops(million floating point operations per second)

mflops = altimg': w': 204', h': 46'}]

题]有效(平均)cpi计算

假设在一台40mhz处理机上运行200,000条指令的目标**,程序主要由四种指令组成。根据程序跟踪实验结果,已知指令混合比和每种指令所需的指令数如下。计算在单处理机上用跟踪数据运行程序的平均cpi,并根据所得的cpi,计算相应的mips速率。

指令类型cpi指令混合比

算术和逻辑160%

高速缓存命中的加载/存储 218%

转移412%

高速存储缺失的存储器访问 810%

解] cpi = 1*60% +2*18% +4*12% +8*10% =2.24

mips = f/(cpi*106) =40*106)/(2.24*106) =17.86

题]a机执行的程序中有20%转移指令(2tc),转移指令都需要一条比较指令(1tc)配合,其他指令1tc。b机中转移指令包含比较指令,但tc比a机慢15%。a机、b机哪个工作速度快?

a机:tcpua=ina×(0.2 × 2+0.2 × 1+0.6 × 1)×tca=1.2 ina× tca

b机:tcpub=0.8ina×((0.2/0.8) ×2+(1- 0.2/0.8) ×1) ×1.15tca

1.15 ina× tca

结果:b机比a机工作速度快。

体系结构重点

1 计算机设计者的工作 指令集设计 功能组成设计 逻辑电路设计和硬件结构的设计等。2 设计计算机的功能并不就是用户所需要的功能,它主要考虑到成本 技术 兼容性和市场大小等诸多因素,体现在生产和设计中要有赢利,用户承受得了。衡量原则就是成本性能比。根据这一原则,我们首先要设计确定计算机应具有的功能,我...

体系结构重点

题型 填空,名词解释,简答,计算。计算题 1.指令系统,指令编码。等长编码,huffman编码,分组编码。2.性能 加速比 amdahl定理。3.页面置换算法fifo,lru 4.输入输出 中断系统,中断屏蔽码。5.标量机 流水线 画流水线时空图,计算效率,找出瓶颈,顺便看一下加法和乘法混合的时空图...

软件体系结构重点

1.体系结构的概念。软件体系结构包括构成系统的设计元素的描述,设计元素的交互模式,以及在这些模式中的约束。精简为 组件 连接件 约束。2.体系结构风格。体系结构风格是描述特定系统组织方式的惯用范例,强调组织模式和惯用范例。精简为 构件 连接件集 拓扑和约束。3.ustamp 质量属性场景 quali...