









还剩58页未读,继续阅读
本资源只提供10页预览,全部文档请下载后查看!喜欢就下载吧,查找使用更方便
文本内容:
计算机组成原理教程欢迎参加计算机组成原理课程!本课程将深入探讨计算机系统的工作原理,从基础硬件组件到整体系统架构通过系统学习,您将理解计算机内部的运作机制,掌握计算机设计与实现的核心技术无论您是计算机科学专业的学生,还是对计算机工作原理感兴趣的爱好者,本课程都将为您提供扎实的理论基础和实用知识,帮助您在信息化时代更好地理解和应用计算机技术让我们一起揭开计算机的神秘面纱,探索这一改变人类历史的伟大发明!课程概述课程目标学习内容通过本课程学习,学生将掌握包括计算机系统概论、数据表计算机系统的基本组成原理,示与运算、存储系统、指令系理解计算机硬件系统的工作机统、中央处理器、总线、输入制,能够分析计算机系统的性输出系统、并行处理以及计算能指标,并具备初步的计算机机新技术等核心内容系统设计能力考核方式期末考试占总成绩,平时作业占,实验报告占平时出勤60%20%20%和课堂表现将作为总评成绩的参考依据第一章计算机系统概论硬件与软件层次结构计算机系统由硬件和软件两部分计算机系统通常采用层次结构设组成硬件是计算机的物理实体,计,从底层硬件到高层应用,每包括处理器、存储器、输入输出一层都为上一层提供服务,这种设备等;软件是计算机中的程序结构使得复杂系统变得可管理和和数据,用于指挥硬件完成特定可理解任务计算机系统评价评价计算机系统性能的主要指标包括速度、功耗、可靠性、成本等衡量计算机速度的常用指标有、、等CPI MIPS FLOPS计算机的发展历史机械计算机时代年,帕斯卡发明了第一台机械计算器年,巴贝奇设计了16421834分析机,被认为是现代计算机的概念先驱这些机械装置主要用于简单数学计算,处理能力有限电子计算机时代年,第一台电子计算机诞生,标志着电子计算机时代的开1946ENIAC始随后冯诺依曼体系结构的确立,以及晶体管、集成电路的发明,推·动了计算机技术的迅速发展现代计算机从大型机到个人电脑,从单核处理器到多核处理器,计算机不断朝着更小、更快、更智能的方向发展云计算、量子计算等新型计算模式正在改变人们对计算机的认识计算机系统的层次结构应用层面向用户的应用程序软件层操作系统和语言处理程序硬件层计算机物理设备计算机系统采用层次结构设计,每一层都为上层提供服务硬件层是计算机的物理基础,包括处理器、存储器和输入输出设备等软件层是连接硬件与用户的桥梁,包括操作系统和各种程序设计语言应用层则是直接面向用户的各类应用程序,满足用户的具体需求这种层次结构使复杂的计算机系统变得清晰可管理,各层之间通过接口进行通信,下层对上层屏蔽了实现细节,上层则利用下层提供的服务实现更复杂的功能冯诺依曼结构·存储器运算器存储程序和数据执行算术逻辑运算控制器控制程序的执行顺序输出设备输入设备输出处理结果接收外部信息冯诺依曼结构是现代计算机的基础架构,由数学家约翰冯诺依曼于年提出其核心思想是存储程序,即程序和数据同等重要,都···1945存储在存储器中,计算机按照程序的指令顺序依次执行操作这一结构奠定了现代计算机的基本工作原理,虽然现代计算机在实现上有了很大发展,但基本思想仍然遵循冯诺依曼结构·计算机的基本组成运算器负责执行算术运算和逻辑运算,是计算机的核心计算部件现代中CPU的(算术逻辑单元)即为运算器的实现ALU控制器负责控制程序的执行顺序,解释指令并发出各种控制信号,协调计算机各部件的工作现代中的控制单元即为控制器的实现CPU存储器用于存储程序和数据,包括内部存储器(如、)和外部存储RAM ROM器(如硬盘、)存储器是计算机记忆的载体SSD输入输出设备/实现计算机与外界的信息交换输入设备(如键盘、鼠标)将信息输入计算机,输出设备(如显示器、打印机)将处理结果输出计算机性能指标万秒5GHz100/主频吞吐量CPU表示时钟周期的频率,即每秒钟的脉单位时间内系统处理的任务数量对服务器等系CPU CPU冲数主频越高,执行指令的速度越快但统,高吞吐量意味着能同时处理更多用户请求CPU现代计算机性能不能仅靠主频来衡量1ns响应时间从输入到产生相应输出所需的时间响应时间越短,用户体验越好,尤其对实时系统至关重要衡量计算机性能需要综合考虑多种指标除上述指标外,还有(每秒百万指令数)、MIPS FLOPS(每秒浮点运算次数)、(每条指令平均周期数)等专业指标,以及功耗、可靠性、成本等实用CPI指标第二章数据的表示与运算数据的编码数据的存储计算机中所有数据都必须编码为数据以特定格式存储在计算机中,二进制形式不同类型的数据如整数使用原码、反码或补码表(数字、字符、图像等)都有相示,实数使用浮点数表示正确应的编码规则,将其转换为计算理解数据的存储形式是掌握计算机可处理的二进制序列机运算原理的基础数据的运算计算机中的数据运算包括算术运算和逻辑运算这些运算遵循特定的规则和算法,如加法、减法、乘法、除法、与、或、非等操作进制与进制转换进制基数数字符号示例二进制₂₁₀20,11010=10八进制₈₁₀80-712=10十进制₁₀100-910十六进制₁₆₁₀160-9,A-F A=10计算机以二进制形式存储和处理数据,因为二进制电路实现简单可靠但二进制表示复杂数据时,位数较多不便于人类理解,因此常用八进制或十六进制表示二进制数据进制转换是计算机科学的基础技能从十进制转换为其他进制可采用除基取余法,从其他进制转换为十进制则使用按权展开法,而不同进制之间的转换则可通过十进制作为中介进行数据编码码码BCD ASCIIUnicode二进制编码的十进制数,用位二进制表美国信息交换标准代码,用位二进制表统一码,是一种国际标准编码,可以表示47示一个十进制数字常用于需要进行十进示一个字符,共可表示个字符,包括世界上几乎所有的字符常用、128UTF-8制运算的场合,如财务计算和数字显示等英文字母、数字和特殊符号等编码方式实现UTF-16例如,字母的码为,二进制例如,汉字中的编码是A ASCII65Unicode例如,十进制数用码表示为表示为23BCD1000001U+4E2D00100011定点数的表示原码原码是最直观的二进制表示法,其最高位为符号位(表示正,表示负),其余位01表示数值的绝对值原码表示简单直观,但计算复杂例如,的原码为,的原码为(位表示下为和+50101-51101800000101)10000101反码反码是在原码基础上,保持正数不变,负数除符号位外其余位取反(变,变)0110反码是补码的过渡形式例如,的反码为,的反码为(位表示下为和)+50101-5101080000010111111010补码补码是计算机中最常用的表示形式,正数的补码等于原码,负数的补码等于反码加1补码使得加减运算统一,简化了计算机电路设计例如,的补码为,的补码为(位表示下为和)+50101-5101180000010111111011浮点数的表示符号位()Sign位,表示浮点数的正负1指数位()Exponent位(单精度)或位(双精度),表示指数部分811尾数位()Mantissa位(单精度)或位(双精度),表示有效数字2352是目前最广泛使用的浮点数表示标准,它定义了单精度(位)和双精度(位)两种基本格式浮点数表示为×IEEE7543264-1^S×,其中是符号位,是尾数(形式),是指数M2^E SM
1.xxxx E为提高精度,采用规格化表示,即小数点前始终为(隐含不存储)此外,标准还定义了特殊值如正负无穷大、(非数)IEEE7541NaN等,以处理特殊计算情况定点运算加法减法溢出检测基于补码表示的二进制在补码表示下,减法转当两个同号数相加结果加法,利用逐位相加并换为加上被减数的补码变为异号,或两个异号考虑进位补码表示下,如,其数相减结果与被减数符A-B=A+-B不需区分加减运算,减中用补码表示这种号不同时,表示发生了-B法可转换为加上负数统一处理简化了计算机溢出计算机需要检测(补码)硬件设计并处理溢出情况定点运算是计算机中最基本的数值运算形式,它以固定小数点位置进行运算定点整数运算中,小数点固定在最右边;定点小数运算中,小数点固定在最左边理解定点运算原理对深入学习计算机组成原理至关重要浮点运算对阶将两个浮点数的指数部分调整为相同,通常选择较大的指数作为共同指数,并相应调整较小指数对应的尾数(右移)尾数运算根据运算类型(加减乘除)对尾数进行相应的定点运算加减法需要先对阶,乘法将尾数相乘,除法则是尾数相除结果规格化将运算结果调整为规格化形式,即尾数的最高有效位为这可能1涉及尾数的左移或右移,并相应调整指数舍入处理根据标准中定义的舍入模式(如向零舍入、向最近IEEE754舍入等)处理精度超出表示范围的部分第三章存储系统存储器分类存储器层次结构按访问方式分为随机存取存储器现代计算机采用层次化存储体系,和串行访问存储器;按功能分为从上到下依次是寄存器、高速缓主存储器和辅助存储器;按信息存、主存储器和辅助存储器,速保持特性分为易失性存储器和非度依次降低,容量依次增大易失性存储器存储器性能指标主要包括存储容量、存取速度、存取带宽、可靠性和成本等设计存储系统需要在这些指标间寻求平衡存储器的层次结构寄存器速度最快,容量最小高速缓存2速度快,容量小主存速度中等,容量中等辅存速度慢,容量大计算机存储系统采用层次化结构设计,主要目的是平衡速度与容量之间的矛盾上层存储器速度快但容量小且成本高,下层存储器速度慢但容量大且成本低通过合理组织不同层次的存储器,可以在接近高速存储器性能的同时,获得接近低速存储器的容量和成本优势存储系统的工作原理基于局部性原理,即程序在运行时往往集中访问少量数据将频繁访问的数据放在高速存储层,可大大提高系统整体性能主存储器静态随机存取存储器动态随机存取存储器只读存储器SRAMDRAMROM采用触发器存储信息,只要通电就能保持采用电容存储信息,需要定期刷新以防数内容在制造时固化,用户只能读取不能修数据,不需要刷新,速度快但成本高,集据丢失,速度较慢但成本低,集成改非易失性存储器,断电后内容不丢失SRAM成度较低主要用于高速缓存度高是现代计算机主存的主要组成部分主要用于存储固件和启动程序访问速度类型、、•1-10ns•PROM EPROMEEPROM访问速度特点不需要刷新•50-100ns特点非易失性••特点需要刷新应用存储器•应用存储•Cache•BIOS应用主存储器•高速缓存工作原理映射方式替换算法Cache是位于和主主存块与行之间当已满需要调入Cache CPUCache Cache存之间的小容量、高速的对应关系,包括直接新数据时,决定替换哪度存储器,利用程序的映射(一对一)、全相个行的策略常Cache局部性原理,将可能被联映射(任意对应)和用算法有随机法、先进访问的数据提前从主存组相联映射(折中方先出法()和最近FIFO调入,减少案)映射方式影响最少使用法()等Cache CPULRU对主存的访问,提高系的命中率和实现替换算法直接影响Cache统性能复杂度的命中率Cache存储器是解决处理器与主存速度不匹配问题的关键技术现代处理器通常Cache集成多级(、、),形成层次结构,进一步提高系统性能Cache L1L2L3Cache的设计涉及容量、关联度、块大小等多个参数,需要综合考虑性能和成本Cache虚拟存储器访问虚拟地址地址转换程序使用虚拟地址访问内存将虚拟地址转换为物理地址MMU页面调度检查是否在内存若页面不在内存,则从辅存调入判断所需页面是否已在主存中虚拟存储技术是现代操作系统的重要特性,它为程序提供了一个连续的、远大于实际物理内存的地址空间虚拟存储器通过将程序的部分内容存放在辅助存储器上,仅将当前需要的部分保留在主存中,实现了物理内存的扩展虚拟存储器主要有分页式、分段式和段页式三种实现方式分页式将程序和数据按固定大小划分为页;分段式按照程序的逻辑结构划分为段;段页式则结合两者优点,先分段再分页辅助存储器磁盘存储器固态硬盘SSD传统机械硬盘,由磁盘盘片、读写磁头、控制电机等组成数据基于闪存技术的存储设备,无机械部件,通过电子方式读写数据按磁道、扇区组织,通过磁头读写磁性介质上的数据内部由主控制器和闪存颗粒组成优点容量大、成本低优点访问速度快、抗震动、功耗低••缺点访问速度慢、易受机械震动影响缺点成本较高、写入次数有限••关键指标平均寻道时间、旋转延迟、传输速率关键技术垃圾回收、损耗均衡、缓存管理••辅助存储器是计算机系统中容量最大的存储层次,主要用于长期存储程序和数据随着技术发展,传统机械硬盘正逐渐被性能更优的固态硬盘取代,但在大容量、低成本应用场景中,机械硬盘仍有其优势第四章指令系统指令的基本概念指令系统特性指令系统设计指令是计算机能直接识别和执行的最基指令系统是计算机硬件和软件的接口,指令系统设计需要考虑指令格式、操作本命令,是程序的基本单位每条指令反映了计算机的运算能力和编程灵活性码设计、寻址方式、数据类型等多个方都指示计算机完成一个基本操作,如数好的指令系统应具备完备性、规整性、面,并权衡硬件实现复杂度和软件编程据传送、算术运算、逻辑运算、程序控高效性和兼容性等特点便利性制等指令格式操作码指明指令的操作类型,如加、减、乘、除、跳转等地址码指明操作数的地址,可能包含一个、两个或三个地址字段其他控制信息如寻址方式、条件码等辅助信息指令格式是指令字中各字段的组成和排列方式不同计算机的指令格式可能有很大差异,但通常都包含操作码和地址码两部分根据地址码数量,指令可分为零地址指令、一地址指令、二地址指令和三地址指令等指令格式设计需权衡指令长度和表达能力指令越长,能表达的操作越丰富,但占用存储空间更多,取指时间也更长;指令越短,则表达能力有限,需要更多指令才能完成复杂操作寻址方式直接寻址间接寻址指令中的地址字段直接指明操作数指令中的地址字段指向一个存储器的内存地址这种方式简单明了,单元,该单元中存放的才是操作数但寻址范围受地址字段位数限制的真正地址间接寻址突破了地址例如,若指令中地址字段为位,字段位数的限制,但需要多次访问16则最多可寻址个内存单元内存,速度较慢2^16立即寻址操作数直接包含在指令中,无需访问内存这是最快的寻址方式,适用于常数操作,但操作数大小受指令字长限制例如,立即数通常用于循环计数器或小常数运算除上述基本寻址方式外,现代计算机还采用寄存器寻址、寄存器间接寻址、相对寻址、基址寻址和变址寻址等多种方式,以增强系统的灵活性和效率寻址方式的选择直接影响程序的执行效率和系统的整体性能与CISC RISC复杂指令集计算机精简指令集计算机CISC RISC指令系统特点指令系统特点指令数量多,功能复杂指令数量少,功能单一••指令长度可变指令长度固定••寻址方式丰富寻址方式简单••指令执行时间差异大指令执行时间一致••代表处理器系列代表处理器、Intel x86ARM MIPS和代表了指令系统设计的两种不同理念追求强大的单指令功能,适合于复杂的编译器优化;则强调简单高效的硬CISC RISCCISC RISC件实现,有利于采用流水线等并行技术提高性能现代处理器设计常综合两种理念的优点,如处理器内部采用微架构,但对外提供指令集兼容性,这种混合设计兼顾了性能Intel RISCCISC和兼容性需求第五章中央处理器的定义的性能指标CPU CPU中央处理器是计算机的核评价性能的主要指标包括主CPU CPU心部件,负责执行指令、控制计频、每指令周期数、CPI算机运行和处理数据由运每秒百万指令数、每CPU MIPSIPC算器、控制器和寄存器组构成,周期指令数等此外,还需考虑是计算机的大脑功耗、核心数量等因素的发展趋势CPU现代向多核化、高集成度、低功耗方向发展,同时加强专用功能单元CPU如图形处理、加速等能力,以满足多样化的计算需求AI的功能和组成CPU控制器负责指令的解码和执行控制,协调计算机各部件工作控制器根据指令发出时序控制信号,确保指令按正确顺序执行运算器寄存器组执行算术逻辑运算,包含算术逻辑单元和各内部的高速存储单元,用于暂存指令、数据和ALUCPU种工作寄存器运算器能完成整数和浮点数的加减中间结果寄存器包括通用寄存器、程序计数器乘除、逻辑与或非、移位等基本运算、指令寄存器、状态寄存器等PC IRPSW2是计算机系统的核心,它通过控制单元和运算单元的协同工作,实现指令的读取、分析和执行现代通常在单个芯片上集成多个处理核心,并包含高CPU CPU速缓存、内存控制器等功能单元,进一步提高系统性能指令执行过程取指Fetch从内存读取指令,将指令地址值送至地址总线,从数据总线获取指令代码,并存入指令寄存器取指完成后,值通常自动加,CPU PCIR PC1指向下一条指令分析Decode对指令进行分析和解码,确定指令的操作类型和操作数地址这一阶段识别出指令需要执行的具体操作和所需的操作数CPU执行Execute执行指令指定的操作,如算术运算、逻辑运算或数据传送执行结果存入目标寄存器或内存某些指令如跳转可能会修改值,ALUPC改变程序的执行流程访存Memory如果指令需要访问内存如指令,在这一阶段完成数据的读取或写入操作LOAD/STORE写回Write-back将指令执行的结果写回到目标寄存器或内存单元中,完成一条指令的全部执行过程数据通路单总线结构多总线结构所有功能部件通过一条公共总线连接,通过总线控制逻辑实现各采用多条专用总线连接不同功能部件,允许多个数据传送同时进部件之间的数据交换行优点结构简单,控制逻辑清晰,硬件成本低优点提高了数据传送的并行度,系统性能更高缺点总线成为瓶颈,各部件间的数据传送必须分时进行,效率缺点硬件结构复杂,控制逻辑复杂,成本较高较低数据通路是中完成指令执行的硬件结构,它连接的各个功能部件,实现数据的传送和处理数据通路的设计直接影响的性CPU CPU CPU能和复杂度现代多采用混合总线结构,如在关键数据路径如与寄存器之间采用专用总线,而在次要数据路径采用共享总线,以平衡性能和CPUALU复杂度控制器设计硬布线控制器微程序控制器通过组合逻辑电路和时序逻辑电路直接实现控制功能,对每条指将每条机器指令分解为一系列更基本的微操作,通过执行存储在令的每个执行步骤产生相应的控制信号控制存储器中的微程序来产生控制信号优点执行速度快,硬件效率高优点设计灵活,易于修改和扩展••缺点电路复杂,难以设计和修改缺点执行速度较慢,需要额外的控制存储器••适用于指令系统简单、稳定的场合适用于指令系统复杂或需要频繁更新的场合••控制器是的核心部件,负责协调和控制各部件的工作控制器设计的好坏直接影响的性能和功能现代处理器多采用混合CPU CPUCPU控制方式,如对常用指令采用硬布线控制提高速度,对复杂指令采用微程序控制提高灵活性流水线技术取指IF从内存读取指令译码ID分析指令,确定操作和操作数执行3EX执行运算操作ALU访存4MEM访问数据内存写回WB将结果写入寄存器流水线技术是一种指令级并行技术,通过将指令执行过程分解为多个阶段,并让不同指令的不同阶段并行执行,提高的吞吐量理想情况下,级流水线可以使吞吐量提高倍CPU nn流水线执行中可能出现数据相关、控制相关和结构相关等冒险问题,需要通过转发、停顿、预测等技术解决现代处理器普遍采用超标量流水线、乱序执行等高级流水线技术,进一步提高并行度和执行效率第六章总线总线的作用总线的特性总线的类型总线是计算机系统中连接各个部件的公总线的主要特性包括总线宽度决定一按功能可分为数据总线、地址总线和控共通信通道,用于在、内存、次可传送的数据位数、总线带宽单位制总线;按连接部件可分为系统总线、CPU I/O设备等部件之间传输地址、数据和控制时间内可传送的数据量和总线仲裁机内部总线和外部总线;按传输方式可分信息总线简化了系统设计,提高了系制解决多个设备争用总线的冲突为并行总线和串行总线统的灵活性和可扩展性总线概述总线的定义总线是计算机系统内部的公共通信线路,用于连接、内存和各种CPU设备,实现数据传输总线由一组信号线、物理接口和协议规范组I/O成,是计算机系统中不同部件之间进行信息交换的公共通道总线的分类按连接部件分类内部总线如内部总线、系统总线连接、CPUCPU内存和接口和外部总线连接设备I/OI/O按功能分类数据总线传输数据、地址总线传输地址和控制总线传输控制信号总线是现代计算机系统的重要组成部分,它提供了一种标准化的连接方式,使系统构建和扩展变得更加便捷随着计算机技术的发展,总线技术也在不断演进,从早期的、到现代的、等,传输速率和带宽不断提高,接口也越来越标准化ISA PCIPCIe USB和通用化总线仲裁集中仲裁分布仲裁由一个仲裁器负责处理所有设备的总线请求,决定哪个设备可以没有中央仲裁器,由各设备自行协商决定总线使用权获得总线使用权自举式仲裁设备根据自身优先级决定是否使用总线•链式查询方式通过总线授权信号在各设备间依次传递•冲突检测方式设备检测到总线冲突后按一定规则重试•计数器定时查询方式仲裁器按计数器顺序轮询各设备•独立请求方式每个设备有独立的请求和授权线•总线仲裁机制是解决多个设备争用总线冲突的关键技术好的仲裁机制应具备公平性确保每个设备都有机会使用总线和效率性最大化总线利用率在实际系统中,常根据性能需求、设备数量和系统复杂度选择适当的仲裁方式如中,总线采用集中仲裁方式,而总线则采用PC PCI USB主控制器轮询方式总线操作和定时同步总线异步总线所有总线事件都由统一的时钟信号控制,总线上的所有设备必须没有统一的时钟信号,通过握手信号协调数据传输,设备间通过同步于这一时钟信号请求和应答信号完成数据传输优点控制简单,速度快,设计容易优点灵活,可连接不同速度的设备,可扩展性好••缺点不灵活,要求所有设备具有相同的工作速度缺点控制复杂,速度较慢,需额外的握手时间••应用系统内部高速总线,如与内存之间的总线应用外部设备总线,如早期的总线•CPU•PCI总线定时是控制总线数据传输的关键机制,它规定了总线事件的发生顺序和持续时间良好的总线定时设计能确保数据传输的可靠性和高效性现代总线通常采用混合方式,结合同步和异步操作的优点,如总线使用同步传输数据,但允许异步握手建立连接PCIe总线标准总线总线PCI USB外设组件互连标准,是机中常通用串行总线,是连接计算机与外PC用的系统总线标准总线支持部设备的标准接口采用主PCIUSB位或位数据传输,工作频率从式结构,支持热插拔和即插即用,3264或,提供即插即传输速率从的33MHz66MHz USB
1.012Mbps用功能现已逐渐被发展到的,广PCIePCI USB
4.040Gbps取代泛应用于各类外部设备连接Express总线PCIePCI Express是PCI的继任者,采用点对点串行连接方式,通过增加通道数×1到×16提高带宽最新PCIe
5.0标准单通道带宽可达32GT/s,广泛用于图形卡、存储设备和高性能网络接口总线标准的发展趋势是从并行向串行、从共享总线向点对点连接、从板级互连向芯片级互连方向发展新一代总线标准通常具有更高的带宽、更低的延迟和更好的可扩展性,以满足日益增长的数据传输需求第七章输入输出系统系统的地位系统的特点I/O I/O输入输出系统是计算机系统的重设备种类繁多,性能差异大;I/O要组成部分,它连接计算机内部操作涉及大量的数据传输;I/O与外部世界,实现信息交换现操作速度通常远低于处I/O CPU代计算机系统中,系统的性能理速度,是系统潜在的性能瓶颈I/O和功能对整体系统性能有重要影响系统发展趋势I/O系统向智能化、标准化和模块化方向发展,越来越多的功能被集成I/O I/O在专用芯片中,接口标准不断统一,设备间兼容性不断提高系统概述I/O设备分类接口I/O I/O按使用特性分接口是连接设备与系统总线的硬件电路,主要功能包括I/O I/O人机交互设备如键盘、鼠标、显示器等•地址译码识别发出的设备地址存储设备如硬盘、光盘、盘等•CPU•U数据缓冲协调与设备间的速度差异通信设备如网卡、调制解调器等•CPU•控制和状态管理接收控制信号,报告设备状态•按传输速率分数据格式转换在设备格式和系统格式间转换•低速设备如键盘、鼠标字节级秒•/中速设备如打印机级秒•KB/高速设备如网卡、图形卡级秒•MB/系统是计算机与外部世界交互的桥梁,它通过接口和控制器管理各种外部设备,实现数据的输入和输出随着计算机应用的多I/O I/O I/O样化,系统的重要性日益突出,有效的管理对提升系统整体性能至关重要I/O I/O程序查询方式等待设备就绪检查设备状态CPU如果设备未就绪,重复查询直到设备准CPU通过执行程序指令查询设备的状态CPU I/O备好检查传输是否完成执行数据传输检查传输是否成功完成,必要时进行错设备就绪后,执行数据的输入或输出操CPUCPU误处理作程序查询方式是最基本的控制方式,其特点是由直接控制操作的全过程通过不断查询设备的状态寄存器,确定设备是否准备I/O CPU I/O CPU I/O好进行数据传输,然后发出命令启动传输,传输完成后再检查结果这种方式实现简单,不需要额外硬件支持,但存在明显缺点在等待设备准备好的过程中处于忙等状态,浪费宝贵的处理能力;同时CPU I/O CPU无法同时处理多个设备因此,程序查询方式主要适用于简单系统或对实时性要求不高的场合I/O程序中断方式发出命令CPUI/O向设备发送操作命令,然后继续执行其他程序CPUI/O设备完成操作后发出中断信号设备完成操作后,向发送中断请求信号I/O CPU响应中断CPU暂停当前程序,保存现场,转去执行中断服务程序CPU中断服务完成后返回中断服务程序执行完毕后,恢复现场,继续执行被中断的程序程序中断方式是一种更高效的控制方式,它允许在发出命令后立即去做其他工作,而不I/O CPUI/O必等待操作完成当设备完成操作后,通过中断机制通知处理数据I/O I/O CPU中断机制的核心是中断向量表,它存储了各种中断对应的处理程序(中断服务程序)的入口地址现代计算机系统通常采用多级中断优先级策略,允许高优先级中断打断低优先级中断的处理,确保重要事件能得到及时响应方式DMA初始化控制器1CPU DMA设置控制器的源地址、目标地址、传输字节数等参数CPU DMA请求传输权2DMA控制器向总线仲裁器申请总线控制权DMA控制数据传输3DMA获得总线控制权后,控制器直接在内存与设备间传送数据,无需干预DMA I/O CPU完成传输4DMA传输完成后,发出中断信号通知,并释放总线控制权DMA CPU直接内存访问是一种在不需要干预的情况下,实现设备与内存之间高速数据传输的技术DMA CPUI/O控制器可以独立于控制总线,直接管理数据传输,从而大大提高了系统吞吐量DMA CPUI/O传输有几种工作模式单字传送模式每传送一个字就释放总线、块传送模式连续传送一个数据块和DMA周期窃取模式在不使用总线时窃取总线周期现代系统多使用总线主控方式,控制器作为总线主CPUDMA设备,在需要时申请并获得总线控制权设备I/O键盘和鼠标显示器打印机最常见的输入设备,用于用户与计算机交互主要输出设备,显示计算机处理的图像和文将计算机中的数字信息转换为纸质文档的设键盘通过按键矩阵和编码电路将按键转换为字信息现代显示器从发展到液晶备常见类型包括激光打印机、喷墨打印机CRT扫描码,传送给计算机现代键盘多采用、和等技术,分辨率从早和热敏打印机等现代打印机多具备网络连LCD LEDOLED接口,并增加了多媒体功能键和背光期的×发展到现在的甚至,接功能,支持无线打印和云打印等高级特性USB6404804K8K等特性提供更清晰的图像质量和更好的用户体验第八章并行处理并行处理的意义并行处理的层次并行处理的挑战并行处理是提高计算机系统性能的重要并行处理可在多个层次实现,包括指令并行系统面临负载均衡、通信开销、并途径随着单处理器性能提升接近物理级并行如流水线、线程级并行如多线行算法设计、编程复杂性等挑战成功极限,通过多处理器并行工作成为获得程、数据级并行如向量处理和任务级的并行处理需要硬件和软件的协同设计,更高性能的主要手段并行处理也有助并行如多处理器系统,不同层次的并以及合适的应用场景于提高系统可靠性和资源利用率行技术可组合使用并行处理概述并行计算的概念并行计算机分类并行计算是指同时使用多个计算资源解决计算问题的过程它将按处理器组织方式分类一个大问题分解为多个可以并行求解的子问题,然后将结果合并单指令流单数据流传统的串行计算机•SISD得到最终答案单指令流多数据流向量处理器•SIMD并行计算的主要目标是多指令流单数据流少见,如容错系统•MISD缩短解决问题的时间加速比多指令流多数据流多处理器系统••MIMD解决单个处理器无法解决的大规模问题•按存储器组织方式分类提高系统资源利用率•共享存储多处理器所有处理器共享同一物理存储器•提供容错能力•分布存储多处理器每个处理器有自己的本地存储器•分类法Flynn类型指令流数据流特点典型例子单一单一传统顺序执行单核SISD CPU单一多个单指令同时处理多数据向量处理器SIMD GPU,多个单一多个指令处理同一数据容错系统MISD多个多个多处理器独立执行多核集群MIMD CPU,分类法是由于年提出的计算机系统分类方法,它根据指令流和数据流的数量将计算机系统分为四类这一分类法简洁明了,至今仍被广泛使用Flynn MichaelFlynn1966在现代计算机系统中,代表传统的串行计算机;广泛应用于需要大量同类数据处理的场合,如图形处理、科学计算;较为少见;而则是当今并行系SISD SIMDMISD MIMD统的主流架构,包括多核处理器、多处理器系统和计算机集群等多处理器系统共享存储多处理器分布存储多处理器所有处理器共享一个全局物理地址空间,通过存储器访问同一数每个处理器有自己的本地存储器,处理器间通过消息传递进行通据信优点编程简单,进程间通信方便优点可扩展性好,适合大规模并行处理••缺点存储器访问成为瓶颈,可扩展性有限缺点编程复杂,通信开销大••典型系统对称多处理器、多核处理器典型系统集群系统、大规模并行处理系统•SMP•MPP共享存储系统又分为一致存储访问和非一致存储分布式系统通常采用消息传递接口如进行进程间通信,程序UMANUMAMPI访问两种模型中所有处理器访问任何存储单元的时间相同,员需要显式管理数据分布和进程通信,编程难度较大UMA而中处理器访问本地存储器比访问非本地存储器更快NUMA互连网络静态互连网络动态互连网络固定的网络拓扑结构,节点间的连接是固定的,不随时间变化可动态建立节点间连接的网络,节点间的通信路径可根据需要动态配置常见拓扑结构常见类型线性阵列一维结构,每个节点连接两个相邻节点总线型所有节点共享一条或多条总线••环形结构在线性阵列基础上首尾相连交叉开关型可实现任意节点间的直接连接••星形结构所有节点连接到一个中心节点多级互连网络如网络、网络••Omega Butterfly网格结构二维或多维阵列,如网格、网格多端口存储器型通过多端口存储器连接处理器•2D3D•超立方体高维互连结构,节点数为•2^n互连网络是并行计算机系统中连接处理器与处理器、处理器与存储器的网络结构,它直接影响系统的通信性能和可扩展性理想的互连网络应具有高带宽、低延迟、良好的可扩展性和容错能力第九章计算机可靠性可靠性的重要性可靠性指标随着计算机在关键领域的广泛计算机系统可靠性通常通过平应用,系统可靠性变得越来越均无故障时间、平均MTBF重要在航空航天、医疗、金修复时间、可用性MTTR融等领域,计算机系统的故障和可靠度Availability可能导致严重后果,因此必须等指标衡量这Reliability确保系统的高可靠性些指标帮助设计者评估系统性能并进行改进提高可靠性的方法提高计算机系统可靠性的主要方法包括硬件冗余、软件容错、故障检测与恢复机制等通过这些技术,可以构建具有高可靠性的容错计算机系统可靠性概念故障分类按性质分物理故障硬件组件的物理损坏或退化•设计故障硬件或软件设计中的缺陷•操作故障人为操作错误或环境因素•按持续时间分永久性故障需要更换或修复才能恢复•间歇性故障不定时出现,难以检测•瞬态故障短暂出现后自行消失•可靠性指标平均无故障时间系统正常工作的平均时间•MTBF平均修复时间系统故障后平均修复时间•MTTR可用性系统可正常使用的时间百分比,计算公式为•Availability MTBF/MTBF+MTTR可靠度系统在指定时间内无故障运行的概率•Reliability计算机系统可靠性是指系统在规定条件下和规定时间内完成规定功能的能力理解故障、错误和失效的区别对分析系统可靠性至关重要故障是系统组件的异常状态;错误是系统内部状态的偏差;失效是系统外部行为的偏差提高可靠性的措施硬件冗余软件容错通过增加额外的硬件组件,当一个组件失效时,通过特殊的软件设计技术应对软件缺陷和运行可由备份组件接替工作主要形式包括静态冗时错误常用技术包括版本编程、恢复块、N余如三模冗余、动态冗余如备用系统TMR异常处理和防御性编程等和混合冗余故障恢复故障检测检测到故障后进行恢复,恢复策略包括前向恢采用各种方法检测系统中的故障,如奇偶校验、复继续执行和后向恢复回滚到检查点循环冗余校验、看门狗定时器和自检测CRC电路等提高计算机系统可靠性需要综合考虑硬件、软件和系统架构各方面对于关键系统,通常采用多层次的可靠性保障措施,如组件级冗余、系统级冗余和功能多样性等,以应对各种可能的故障场景第十章计算机性能评价性能评价的目的性能评价的难点计算机性能评价旨在客观衡量系计算机系统复杂多变,不同应用统性能,为系统选择、设计改进对系统有不同需求,很难用单一和性能优化提供依据通过标准指标全面评价性能同时,评测化的性能评测,可以比较不同系环境、工作负载选择和测量方法统的相对性能,指导用户选择和都可能影响评测结果的客观性和设计者改进代表性性能评价的方法主要评价方法包括理论分析如算法复杂度分析、模拟仿真如系统模拟器和实际测量如基准程序测试这些方法各有优缺点,常结合使用以获得全面评价性能评价指标时间相关指标速率指标响应时间从提交任务到得到结果的时间每秒百万指令数反映执行指令的速率••MIPSCPU执行时间完成特定任务所需的时间每秒浮点操作次数反映系统进行浮点计算的能力•CPU•FLOPS等待时间任务在系统中等待处理的时间每指令周期数完成一条指令平均需要的时钟周期数••CPI吞吐率单位时间内完成的任务数量每周期指令数每个时钟周期可完成的指令数,是的••IPCCPI倒数时间相关指标直观反映用户体验,是评价系统性能的基本指标对于交互式系统,响应时间尤为重要;而对于批处理系统,吞吐速率指标更专业,但需谨慎使用,因为不同类型指令的执行复杂率更为关键度差异很大,和可能无法准确反映实际应用性能MIPSFLOPS此外,综合考虑性能和成本的指标也很重要,如性价比、性能功耗比等,这些指标在实际performance/price performance/watt系统选择中往往具有更大参考价值基准程序其他常用基准Dhrystone SPEC主要用于测试非浮点整数性能的合成基准程标准性能评测组织开发的一系列基主要测试浮点计算性能,用于超SPEC Linpack序测试包含数组访问、字符准测试套件,包括密集型级计算机排名;专注于数Dhrystone CPUSPEC TOP500TPC串操作、过程调用等典型操作,结果通常以、图形处理、据库和事务处理系统评测;评CPU SPECviewperfWeb3DMark表示由于其服务器等多个领域基测图形处理和游戏性能;跨DMIPSDhrystone MIPSSPECweb SPECGeekBench简单小巧,广泛用于嵌入式系统性能评估准广泛用于工业界和学术界,是当今最具权平台的处理器和内存评测工具威性的计算机性能评测标准之一基准程序是一组标准化的程序或工作负载,用于以可重复的方式测量计算机系统性能好的基准程序应具备代表性反映真实应用、可移植性能在不同平台上运行和可扩展性适应不同规模系统等特点定律Amdahl第十一章计算机新技术技术革新的驱动力新型计算范式计算机技术的革新主要由摩尔定量子计算、神经形态计算、生物律的物理极限、能源效率需求、计算等新型计算范式提供了超越应用需求多样化等因素驱动随传统冯诺依曼结构的可能性,有·着传统技术发展接近瓶颈,新型望解决传统计算机难以高效处理计算范式和技术路线成为研究热的特定问题,如组合优化、模式点识别等未来发展方向未来计算机技术将向更智能、更节能、更安全的方向发展,人工智能和边缘计算等技术将深度融合到计算机系统中,形成新的计算生态量子计算机量子位量子计算的基本单位是量子位,不同于经典比特的或状态,量子位可以处于和的叠加状态这种叠加态使量子计算机在处理某些问题时具有指数级的加速潜力qubit0101量子纠缠与量子门量子纠缠使多个量子位形成关联,一个量子位的状态变化会立即影响其他量子位量子门是量子计算中的基本操作单元,用于操作量子位状态常见的量子门包括门、Hadamard门等CNOT实现技术与挑战当前量子计算机的实现技术包括超导量子计算、光量子计算、离子阱等主要挑战是量子相干性保持时间短、量子态易受环境干扰,以及量子纠错等工程难题量子计算机利用量子力学原理进行计算,有望在特定领域取得突破性进展,如大数分解、量子模拟和优化问题等目前、、中科院等机构已建立了包含几十到上百个量子位的IBM Google原型系统,但距离实用化仍有距离神经网络计算机仿生设计并行处理模拟人脑神经元结构和功能大量处理单元同时工作硬件实现自适应学习4专用神经网络处理芯片根据输入自动调整连接权重神经网络计算机,也称神经形态计算机,是一种模仿人脑神经系统结构和工作原理的新型计算架构与传统冯诺依曼架构不同,神经网络计算机采·用分布式并行处理,存储与计算融为一体,在模式识别、自然语言处理、智能控制等领域具有天然优势目前神经网络计算机研究主要集中在专用硬件加速器如、和神经形态芯片如的、英特尔的两个方向这些系统在TPU NPUIBM TrueNorthLoihi能效比上往往比传统计算机高出几个数量级,特别适合边缘计算场景下的应用AI光子计算机速度优势光子计算机利用光速传输信息,理论上可以达到电子计算机难以企及的处理速度光信号不受电阻和电容的限制,能大幅降低延迟能耗降低光子器件的能耗可以远低于电子器件,尤其在信号传输方面,光纤通信比电子传输更节能这使光子计算成为解决计算能耗危机的潜在方案并行处理光的波长复用技术允许多个信号在同一光路上传输,为大规模并行处理提供了可能光学傅里叶变换等操作可以在几乎零延迟内完成光子计算机是利用光子而非电子作为信息载体的计算机光子计算的核心部件包括光源、调制器、光学波导、光学逻辑门和光探测器等目前全光计算机尚处于理论和实验阶段,但光电混合系统已在特定领域取得进展光子计算面临的主要挑战包括光学元件微型化、集成度提高、光学非线性效应控制等尽管如此,光子计算在光学神经网络、量子信息处理、模拟计算等特定应用中展现出巨大潜力课程总结重点内容回顾学习方法建议本课程系统讲解了计算机组成原理理论与实践相结合通过实验加深的核心内容,包括计算机系统概论、对理论知识的理解;抓住核心概念数据表示与运算、存储系统、指令如数据表示、指令执行、存储层次系统、中央处理器、总线、输入输等;建立知识体系将各章节知识出系统、并行处理和计算机新技术点串联成完整体系;关注技术发展等内容通过学习,你应掌握计算计算机技术发展迅速,保持学习新机硬件系统的基本工作原理和设计知识的习惯方法应用与拓展计算机组成原理是计算机科学的基础课程,对于理解操作系统、编译原理、计算机网络等后续课程至关重要同时,这些知识在硬件设计、系统优化、性能评估等领域有广泛应用,是计算机专业学生的必备素养谢谢观看问题解答欢迎提出与课程内容相关的问题,我们将在环节详细解答也可QA以通过电子邮件或课程论坛提交问题,教师团队会及时回复参考资料《计算机组成与设计硬件软件接口》,/David A.Patterson著;《计算机体系结构量化研究方法》;以及课John L.Hennessy程网站上的补充阅读材料和实验指导后续安排期末复习课将于下周开始,重点梳理考试重点内容和解答典型题目期末实验报告截止日期为下月日,请按时提交祝所有同学学习顺利,15在考试中取得好成绩!。


