1.计算机系统结构的flynn分类法是按什么来分类的?共分为哪几类?
答:flynn分类法是按照指令流和数据流的多倍性进行分类。把计算机系统的结构分为:
(1)单指令流单数据流sisd(2)单指令流多数据流simd(3)多指令流单数据流misd(4)多指令流多数据流mimd
2.区别不同指令集结构的主要因素是什么?根据这个主要因素可将指令集结构分为哪3类?
答:区别不同指令集结构的主要因素是cpu中用来存储操作数的存储单元。据此可将指令系统结构分为堆栈结构、累加器结构和通用寄存器结构。
3.地址映象方法有哪几种?它们各有什么优缺点?
答:(1)全相联映象:实现查找的机制复杂,代价高,速度慢。cache空间的利用率较高,块冲突概率较低,因而cache的失效率也低。
(2)直接映象:实现查找的机制简单,速度快。cache空间的利用率较低,块冲突概率较高,因而cache的失效率也高。
(3)组相联映象:组相联是直接映象和全相联的一种折衷。
4:同步总线和异步总线各有什么优缺点?
答:同步总线上所有设备通过统一的总线时钟进行同步。同步总线成本低,因为它不需要设备之间相互确定时序的逻辑。
但是同步总线也有缺点,总线操作必须以相同的速度运行。由于各种设备都要精确地以公共时钟为定时参考,因此在时钟频率很高时容易产生时钟相对漂移错误。3分。
异步总线上的设备之间没有统一的时钟,设备自己内部定时。设备之间的信息传送用总线发送器和接收器控制。异步总线容易适应更广泛的设备类型,扩充总线时不用担心时钟时序和时钟同步问题。
但在传输时,异步总线需要额外的同步开销。
5.指令集应满足哪几个基本要求?
答:对指令集的基本要求是:完整性、规整性、高效率和兼容性。
完整性是指在一个有限可用的存储空间内,对于任何可解的问题,编制计算程序时,指令集所提供的指令足够使用。
规整性主要包括对称性和均匀性。对称性是指所有与指令集有关的存储单元的使用、操作码的设置等都是对称的。均匀性是指对于各种不同的操作数类型、字长、操作种类和数据存储单元,指令的设置都要同等对待。
高效率是指指令的执行速度快、使用频度高。
6.简述减小cache失效开销的几种方法。
答:让读失效优先于写、写缓冲合并、请求字处理技术、非阻塞cache或非锁定cache技术、采用二级cache。
1. 简述通道完成一次数据传输的主要过程。
答:(1)在用户程序中使用访管指令进入管理程序,由cpu通过管理程序组织一个通道程序,并启动通道。(2)通道处理机执行cpu为它组织的通道程序,完成指定的数据i/o工作。
(3)通道程序结束后向cpu发中断请求。cpu响应这个中断请求后,第二次进入操作系统,调用管理程序对i/o中断请求进行处理。
1.减少流水线分支延迟的静态方法有哪些?
答:(1)**分支失败:沿失败的分支继续处理指令,就好象什么都没发生似的。
当确定分支是失败时,说明**正确,流水线正常流动;当确定分支是成功时,流水线就把在分支指令之后取出的指令转化为空操作,并按分支目标地址重新取指令执行。
(2)**分支成功:当流水线id段检测到分支指令后,一旦计算出了分支目标地址,就开始从该目标地址取指令执行。
(3)延迟分支:主要思想是从逻辑上“延长”分支指令的执行时间。把延迟分支看成是由原来的分支指令和若干个延迟槽构成。不管分支是否成功,都要按顺序执行延迟槽中的指令。
3种方法的共同特点:它们对分支的处理方法在程序的执行过程中始终是不变的。它们要么总是**分支成功,要么总是**分支失败。
2.简述tomasulo算法的基本思想。
答:tomasulo算法的基本思想是只要操作数有效,就将其取到保留站,避免指令流出时才到寄存器中取数据,这就使得即将执行的指令从相应的保留站中取得操作数,而不是从寄存器中。指令的执行结果也是直接送到等待数据的其他保留站中去。
因而,对于连续的寄存器写,只有最后一个才真正更新寄存器中的内容。一条指令流出时,存放操作数的寄存器名被换成为对应于该寄存器保留站的名称(编号)。指令流出逻辑和保留站相结合实现寄存器换名,从而完全消除了数据写后写和先读后写相关这类名相关。
3.通过编译器对程序优化来改进cache性能的方法有哪几种?简述其基本思想。
答:(1)数组合并。通过提高空间局部性来减少失效次数。
有些程序同时用相同的索引来访问若干个数组的同一维,这些访问可能会相互干扰,导致冲突失效,可以将这些相互独立的数组合并成一个复合数组,使得一个cache块中能包含全部所需元素。(2)内外循环交换。循环嵌套时,程序没有按数据在存储器中的顺序访问。
只要简单地交换内外循环,就能使程序按数据在存储器中的存储顺序进行访问。(3)循环融合。有些程序含有几部分独立的程序段,它们用相同的循环访问同样的数组,对相同的数据作不同的运算。
通过将它们融合成一个单一循环,能使读入cache的数据被替换出去之前得到反复的使用。(4)分块。通过改进时间局部性来减少失效。
分块不是对数组的整行或整列进行访问,而是对子矩阵或块进行操作。
4指令的执行可采用顺序执行、重叠执行和流水线三种方式,是分析说明它们的主要区别及优缺点。
答:(1)指令的顺序执行是指指令与指令之间顺序串行。即上一条指令全部执行完后,才能开始执行下一条指令。
优点:控制简单,节省设备。缺点:执行指令的速度慢,功能部件的利用率低。
2)指令的重叠指令是在相邻的指令之间,让第k条指令与取第k+l条指令同时进行。重叠执行不能加快单条指令的执行速度,但在硬件增加不多的情况下,可以加快相邻两条指令以及整段程序的执行速度。与顺序方式相比,功能部件的利用率提高了,控制变复杂了。
3)指令的流水执行是把一个指令的执行过程分解为若干个子过程,每个子过程由专门的功能部件来实现。把多个处理过程在时间上错开,依次通过各功能段,每个子过程与其它的子过程并行进行。依靠提高吞吐率来提高系统性能。
流水线中各段的时间应尽可能相等。
1简述cisc指令集结构功能设计的主要目标。从当前的计算机技术观点来看,cisc指令集结构的计算机有什么缺点?
答:主要目标是增强指令功能,把越来越多的功能交由硬件来实现,并且指令的数量也是越来越多。
缺点:(1)cisc结构的指令集中,各种指令的使用频率相差悬殊。(2)cisc结构指令的复杂性带来了计算机体系结构的复杂性,这不仅增加了研制时间和成本,而且还容易造成设计错误。
(3)cisc结构指令集的复杂性给vlsi设计增加了很大负担,不利于单片集成。(4)cisc结构的指令集中,许多复杂指令需要很复杂的操作,因而运行速度慢。(5)在cisc结构的指令集中,由于各条指令的功能不均衡性,不利于采用先进的计算机体系结构技术(如流水技术)来提高系统的性能。
2分别从执行程序的角度和处理数据的角度来说明计算机系统中并行性等级从低到高可分为哪几级?
答:答:从处理数据的角度来看,并行性等级从低到高可分为:
1)字串位串:每次只对一个字的一位进行处理。这是最基本的串行处理方式,不存在并行性;
2)字串位并:同时对一个字的全部位进行处理,不同字之间是串行的。已开始出现并行性;
3)字并位串:同时对许多字的同一位(称为位片)进行处理。这种方式具有较高的并行性;
4)全并行:同时对许多字的全部位或部分位进行处理。这是最高一级的并行。
从执行程序的角度来看,并行性等级从低到高可分为:
1)指令内部并行:单条指令中各微操作之间的并行;
2)指令级并行:并行执行两条或两条以上的指令;
3)线程级并行:并行执行两个或两个以上的线程,通常是以一个进程内派生的多个线程为调度单位;
4)任务级或过程级并行:并行执行两个或两个以上的过程或任务(程序段),以子程序或进程为调度单元;
5)作业或程序级并行:并行执行两个或两个以上的作业或程序。
3.简述先行控制的基本思想。
答:先行控制技术是把缓冲技术和预处理技术相结合。缓冲技术是在工作速度不固定的两个功能部件之间设置缓冲器,用以平滑它们的工作。
预处理技术是指预取指令、对指令进行加工以及预取操作数等。
采用先行控制方式的处理机内部设置多个缓冲站,用于平滑主存、指令分析部件、运算器三者之间的工作。这样不仅使它们都能独立地工作,充分忙碌而不用相互等待,而且使指令分析部件和运算器分别能快速地取得指令和操作数,大幅度地提高指令的执行速度和部件的效率。这些缓冲站都按先进先出的方式工作,而且都是由一组若干个能快速访问的存储单元和相关的控制逻辑组成。
采用先行控制技术可以实现多条指令的重叠解释执行。
3试说明计算机系统结构、计算机组成与计算机实现之间的相互关系。
答:计算机系统结构、计算机组成、计算机实现互不相同,但又相互影响。
1)计算机的系统结构相同,但可采用不同的组成。如ibm370系列有等高档的多种型号机器。从汇编语言、机器语言程序设计者看到的概念性结构相同,均是由**处理存,通道、设备控制器,外设4级构成。
其中,**处理机都有相同的机器指令和汇编指令系统,只的分析、执行在低档机上采用顺序进行,在高档机上采用重叠、流水或其它并行处理方式。(2)相同的组成可有多种不同的实现。如主存器件可用双极型的,也可用mos型的;可用vlsi单片多片小规模集成电路组搭。
3)计算机的系统结构不同,会使采用的组成技术不同,反之组成也会影响结构。如为实现a:=b+可采用面向寄存器的系统结构,也可采用面向主存的三地址寻址方式的系统结构。
要提高运行速度加与相乘并行,为此这两种结构在组成上都要求设置独立的加法器和乘法器。但对面向寄存器的系要求寄存器能同时被访问,而对面向主存的三地址寻址方式的系统结构并无此要求,倒是要求能同个访存操作数地址和能同时访存。
4计算机系统设计中经常使用的4个定量原理是什么?并说出它们的含义。
答:(1)以经常性事件为重点。在计算机系统的设计中,对经常发生的情况,赋予它优先的处理权和资源使用权,以得到更多的总体上的改进。
(2)amdahl定律。加快某部件执行速度所获得的系统性能加速比,受限于该部件在系统中所占的重要性。(3)cpu性能公式。
执行一个程序所需的cpu时间=ic×cpi×时钟周期时间。(4)程序的局部性原理。程序在执行时所访问地址的分布不是随机的,而是相对地簇聚。
体系结构 大题 1
计算题。1.某台主频为400mhz的计算机执行标准测试程序,程序中指令类型 执行数量和平均时钟周期数如下 求该计算机的有效cpi mips和程序执行时间。解 1 cpi 45000 1 75000 2 8000 4 1500 2 129500 1.776 2 mips速率 f cpi 400 1.7...
ARM2体系结构
第2章 arm体系结构。本章介绍arm7tdmi程序员模型 工作模式与工作状态 arm和thumb状态的寄存器组织 存储器组织结构 异常以及协处理器接口等一些基本概念。本章还讲述了arm的编程基础,如 arm微处理器的基本工作原理 程序设计相关的基本技术细节等。2.1 arm7tdmi程序员模型。a...
软件体系结构2汇总
一 主程序 子程序调用体系结构。组件 主程序 子程序。连接件 调用返回机制。优点 1 有效地将一个较复杂的程序系统设计分解成许多易于控制和处理的子任务,便于开发和维护。2 已被证明是成功的设计方法,可以被用于较大程序。缺点 1 规模 程序超过10万行,表现不好 程序太大,开发太慢,测试越开越困难。2...