热门标签 | HotTags
当前位置:  开发笔记 > 程序员 > 正文

扬州大学计算机作业,扬州大学计算机体系结构试卷.doc

CPU性能计算2、计算机系统设计的定量原理1)只加快经常性事件的速度:使经常性事件的速度尽可能处理快,而对不经常发生处理得慢也不会对系统性能有太大影响。2)Amdahl定律:系统中

CPU性能计算

2、计算机系统设计的定量原理

1)只加快经常性事件的速度:使经常性事件的速度尽可能处理快,而对不经常发生处理得慢也不会对系统性能有太大影响。

2)Amdahl定律:系统中某一部件由于采用某种更快的执行方式后整个系统性能提高与这种执行方式的使用频率或总执行时间的比例有关。

Fe=(改进前可改进部分占用的时间)/(改进前整个任务的执行时间),即改进部分所占比例。

Se=(改进前改进部分的执行时间)/(改进后改进部分的执行时间),即改进部分的加速比

则:

1.:

Tn=To(1-Fe+Fe/Se)

其中,To为改进前的整个任务的执行时间

2.改进后的整个系统加速比为:

SP=To/Tn=1/[(1-Fe)+Fe/Se]

例1 假设将某系统的某一部件的处理度加快到10倍,但该部件的原处理时间仅为整个运行时间的40%,则采取加快措施后整个系统的性能提高多少?

解:由题意知:Fe=0.4,Se=10,根据Amdahl定律,SP=1/(0.6+0.4/10)=1/0.64=1.56.

Amdahl定律告诉我们:一项改进措施可以使整个系统的性能提高多少;为了改进性能价格比,如何合理分配系统资源.

例2 采用哪种实现技术来求浮点数平方根FPSQR 操作对系统的性能影响较大.假设FPSQR操作占整个程序执行时间的20%.一种使采用FPSQR硬件,使FPSQR操作的速度加快到10倍.另一种是使所有浮点数据指令的速度加快,使FP指令的速度加快到2倍,还假设FP指令占整个执行时间的50%.请比较这两种方案.

解:分别计算这两种设计方案所能得到的加速比:

SFPSQR=1/[(1-0.2)+0.2/10]=1/0.82=1.22

SFP=1/[(1-0.5)+0.5/2=1/0.75=1.33 -------更好

3) CPU性能公式

CPU的性能取决于三个要素:

①时钟频率f(或时钟周期t);

②每条指令所花的时钟周期数CPI;

③指令条数IC

一个程序所花的CPU时间(T)可以表示:

CPU时间(T)=CPU时钟周期数(CPI×IC)*时钟周期长(t)

每条指令的平均时钟周期数:

CPU时钟周期数=((CPIi*Ii )

CPU时间(T)=时钟周期长度*((CPIi*Ii )

CPI=((CPIi*Ii )/ IC=((CPIi*Ii /IC)

Ii是第i种指令的执行次数

Ii/IC是第i种指令所占比例

例3如果FP操作的比例为25%,FP操作的平均CPI=4.0,其它指令的平均CPI为1.33,FPSQR操作的比例为2%, FPSQR的CPI为20。假设有两种设计方案,公别把FPSQR操作的CPI和所有FP操作的CPI减为2。试利用CPU性能公式比较这两种设计方案哪一个更好(只改变CPI而时钟频率和指令条数保持不变)。

解:原系统的CPI=25%×4+75%×1.33=2

方案1(使FPSQR操作的CPI为2)系统

CPI=CPI原-2%×(20-2)=2-2%×18=1.64

方案2(提高所有FP指令的处理速度)系统

CPI=CPI原-25%×(4-2)=2-25%×2=1.5

我们也可以根据以下公式计算出方案2系统的CPI

CPI= 75%×1.33+25%×2=1.5

显然,提高所有FP指令处理速度的方案要比提高FPSQR处理速度的方案要好。

方案2的加速比=2/1.5= 1.33

例4假设这两台机器的指令系统中,执行条件转移指令需2个时钟周期,而其它指令只需1个时钟周期。

CPUA:采用一条比较指令来设置相应的条件码,由紧随其后的一条转移指令对此条件码进行测试,以确定是否进行转移。显然实现一次条件转移要执行比较和测试两条指令。条件转移指令占总执行指令条数的20%。由于每条转移指令都需要一条比较指令,所以比较指令也将占20%。

CPUB采用比较功能和判别是否实现转移功能合在一条指令的方法,这样实现一条件转移就只需一条指令就可以完成。由于CPUB在转移指令中包含了比较功能,因此它的时钟周期就比CPUA要慢25%。

现在要问,采用不同转移指令方案的CPUA和CPUB,那个工作速度会更快些?

解:CPIA=0.2×2+0.8×1=1.2

TCPUA=ICA×1.2×tA

CPUB转移指令为20%÷80%=25%

CPIB = 0.25×2+0.75×1=1.25

由于CPUB中没有比较指令,因此ICB = 0.8×ICA。

t B = 1.25tA

TCPUB = ICB×CPIB×tB



推荐阅读
  • 使用Numpy实现无外部库依赖的双线性插值图像缩放
    本文介绍如何仅使用Numpy库,通过双线性插值方法实现图像的高效缩放,避免了对OpenCV等图像处理库的依赖。文中详细解释了算法原理,并提供了完整的代码示例。 ... [详细]
  • 非公版RTX 3080显卡的革新与亮点
    本文深入探讨了图形显卡的进化历程,重点介绍了非公版RTX 3080显卡的技术特点和创新设计。 ... [详细]
  • 近期遇到电脑网络不稳定和游戏时频繁重启的问题,寻求专业建议。网络环境为ADSL调制解调器通过路由器共享给两台电脑使用,怀疑存在ARP攻击或硬件配置问题。希望获得详细的故障排查和解决方案。 ... [详细]
  • 本文详细介绍了如何在Ubuntu系统中下载适用于Intel处理器的64位版本,涵盖了不同Linux发行版对64位架构的不同命名方式,并提供了具体的下载链接和步骤。 ... [详细]
  • Linux设备驱动程序:异步时间操作与调度机制
    本文介绍了Linux内核中的几种异步延迟操作方法,包括内核定时器、tasklet机制和工作队列。这些机制允许在未来的某个时间点执行任务,而无需阻塞当前线程,从而提高系统的响应性和效率。 ... [详细]
  • 台式电脑的电力消耗:待机一天耗电多少?
    探讨台式电脑的电力消耗问题,特别是待机状态下的能耗。本文将详细介绍影响电脑功耗的因素,并提供计算和优化电源配置的方法。 ... [详细]
  • MySQL索引详解与优化
    本文深入探讨了MySQL中的索引机制,包括索引的基本概念、优势与劣势、分类及其实现原理,并详细介绍了索引的使用场景和优化技巧。通过具体示例,帮助读者更好地理解和应用索引以提升数据库性能。 ... [详细]
  • 基于KVM的SRIOV直通配置及性能测试
    SRIOV介绍、VF直通配置,以及包转发率性能测试小慢哥的原创文章,欢迎转载目录?1.SRIOV介绍?2.环境说明?3.开启SRIOV?4.生成VF?5.VF ... [详细]
  • 深入探讨CPU虚拟化与KVM内存管理
    本文详细介绍了现代服务器架构中的CPU虚拟化技术,包括SMP、NUMA和MPP三种多处理器结构,并深入探讨了KVM的内存虚拟化机制。通过对比不同架构的特点和应用场景,帮助读者理解如何选择最适合的架构以优化性能。 ... [详细]
  • 本文将详细介绍如何在Linux操作系统中执行PHP脚本,包括环境配置、命令使用及验证方法。对于需要在Linux环境下开发或部署PHP应用的用户来说,这是一篇非常实用的文章。 ... [详细]
  • 本文探讨了 Spring Boot 应用程序在不同配置下支持的最大并发连接数,重点分析了内置服务器(如 Tomcat、Jetty 和 Undertow)的默认设置及其对性能的影响。 ... [详细]
  • 本文探讨了现代信号处理系统的核心组件,包括数据转换、数据交互和数据处理。详细介绍了AD/DA转换、串/并转换、编解码转换等技术,并讨论了FPGA在信号处理中的应用及其实现方法。 ... [详细]
  • vivo发布iQOO 11系列:搭载骁龙8 Gen2与多项创新技术
    vivo正式推出iQOO 11系列智能手机,该系列搭载最新的高通骁龙8 Gen2处理器,并引入多项创新技术,致力于为用户提供卓越的性能和游戏体验。 ... [详细]
  • 配置Windows操作系统以确保DAW(数字音频工作站)硬件和软件的高效运行可能是一个复杂且令人沮丧的过程。本文提供了一系列专业建议,帮助你优化Windows系统,确保录音和音频处理的流畅性。 ... [详细]
  • 电脑蓝屏故障的成因与解决方案(下)
    本文深入探讨了导致电脑蓝屏的具体原因,并提供了相应的解决方法,帮助用户更好地理解和处理这一常见问题。 ... [详细]
author-avatar
蓝颜似水2002
这个家伙很懒,什么也没留下!
PHP1.CN | 中国最专业的PHP中文社区 | DevBox开发工具箱 | json解析格式化 |PHP资讯 | PHP教程 | 数据库技术 | 服务器技术 | 前端开发技术 | PHP框架 | 开发工具 | 在线工具
Copyright © 1998 - 2020 PHP1.CN. All Rights Reserved | 京公网安备 11010802041100号 | 京ICP备19059560号-4 | PHP1.CN 第一PHP社区 版权所有