还剩37页未读,继续阅读
本资源只提供10页预览,全部文档请下载后查看!喜欢就下载吧,查找使用更方便
文本内容:
计算机组成原理深入讲解之存储器与输入输出系统本课程将深入探讨计算机硬件系统中两个至关重要的组成部分存储器系统和输入输出系统通过理论与实践相结合的方式,我们将全面了解现代计算机的存储层次结构、各类存储技术的原理与应用,以及系统的设计与实现I/O机制存储器系统负责保存程序和数据,是计算机正常运行的基础输入输出系统则是计算机与外部世界交互的桥梁,决定了系统的可用性和扩展性掌握这两个系统的工作原理,对理解现代计算机体系结构具有重要意义课程大纲1第一部分存储器系统涵盖张详细幻灯片,深入探讨存储器的层次结构、工作原理、性能特点和25设计实现包括从寄存器到大容量外存的完整存储体系CPU2第二部分输入输出系统通过张幻灯片全面讲解系统的组成结构、控制方式、接口标准和软件25I/O层次涵盖从基本控制到高级技术的完整知识体系I/O I/O3深入理解硬件结构重点关注计算机硬件的底层实现机制,通过大量实例和案例分析,帮助学生建立完整的计算机体系结构认知框架4实践应用导向结合现代计算机技术发展趋势,探讨存储器与系统在实际应用中的设计I/O考量和优化策略,培养工程实践能力计算机的基本组成冯诺依曼体系结构存储器与设备·I/O现代计算机普遍采用冯诺依曼提出的存储程序概念,将计算机存储器用于存放程序指令和处理数据,是程序执行的基础输入·系统划分为五个基本组成部分这种体系结构奠定了现代计算机设备将外部信息转换为计算机可处理的形式,输出设备则将处理设计的基础框架结果以人类可理解的方式呈现运算器负责执行算术和逻辑运算,控制器协调各部件工作并控制各部分通过总线系统实现数据交换和控制信号传递,形成有机的程序执行流程两者合称为中央处理器(),是计算机的整体数据在各组件间的流动遵循特定的时序和协议,确保系统CPU核心控制单元稳定可靠运行冯诺依曼体系结构特点·存储程序方式线性编址结构程序指令和数据都以二进制形式存储器采用按地址访问的线性编存储在同一存储器中,这是冯诺址方式,每个存储单元都有唯一·依曼体系结构的核心特征这种的地址标识这种统一的地址空设计使得程序具有可修改性,为间简化了程序设计,提高了存储软件的灵活性奠定了基础器利用效率顺序执行机制指令按照在存储器中的存放顺序依次执行,控制器通过程序计数器()跟踪当前执行位置这种机制保证了程序执行的可预测性和可控PC性第一部分存储器系统概述存储器地位层次结构设计性能关键指标存储器是计算机系统的现代计算机采用多层次存储器系统的设计需要重要组成部分,承担着存储器结构,通过不同综合考虑容量、速度、保存程序指令和数据的类型存储器的合理配成本等多个关键指标,重要职责其性能直接置,在成本、容量和性以满足不同应用场景的影响整个计算机系统的能之间取得最佳平衡需求运行效率和响应速度存储器的层次结构寄存器内部最快存储CPU高速缓存、、多级缓存L1L2L3主存储器主要工作存储器RAM辅助存储器硬盘、等大容量存储SSD存储器层次结构遵循越靠近速度越快、容量越小、成本越高的基本规律这种分层设计充分利用了程序的局部性原理,通过将经常访问CPU的数据放在快速存储器中,显著提高了系统的整体性能每一层都作为下一层的缓存,形成了完整的存储体系存储器的关键性能指标TB存储容量现代系统可达太字节级别ns访问时间纳秒级响应速度要求GB/s传输带宽每秒千兆字节传输能力$
0.01单位成本每GB存储成本不断下降存储器性能评估需要综合考虑多个关键指标容量决定了系统能够存储的数据总量,直接影响可运行程序的规模访问速度包括读取时间和写入时间,是影响系统响应性能的核心因素传输带宽反映了存储器的数据吞吐能力,对于大数据处理应用尤为重要成本效益比则决定了存储解决方案的实用性和可推广性稳定性和可靠性确保数据的长期安全保存主存储器的分类随机存取存储器只读存储器可随机读写存储固化程序RAM ROM静态()掩膜•RAM SRAM•ROM动态()可编程•RAM DRAM•ROM非易失性存储器易失性存储器断电数据保持断电数据丢失永久保存数据需要持续供电••系统启动必需主要用作主存••随机存取存储器()RAM静态()动态()RAM SRAMRAM DRAM采用双稳态触发器作为存储单元,具有访问速度快、功耗利用电容存储电荷来表示数据,每个存储单元仅需一个晶SRAM DRAM低的特点每个存储单元由个晶体管构成,结构相对复杂,因体管和一个电容,具有高集成密度和低成本的优势但电容会漏6此成本较高、集成密度较低电,需要定期刷新以保持数据不需要刷新操作,数据保持时间长,主要用于缓存的访问时间通常在纳秒之间,主要用作计算机的主SRAM CPUDRAM50-70和寄存器文件其访问时间通常在纳秒之间,是高性能计算存储器现代技术包括、、、1-10DRAM DDRDDR2DDR3DDR4系统的首选等,不断提高传输速度和数据带宽只读存储器()ROM掩膜ROM制造时编程,内容固定不可更改,成本低但灵活性差可编程ROM用户可一次性编程,编程后内容无法修改EPROM可用紫外线擦除重新编程,开发调试中广泛使用EEPROM电擦除编程,现代系统和固件存储的主要选择BIOS闪存()Flash Memory结构NAND Flash采用串联排列的存储单元,具有高密度、低成本特点,广泛用于大容量存储每个存储单元可存储位数据,通过电荷捕获实现信息存储1-4特性NOR Flash采用并联结构,支持随机访问和就地执行,访问速度快但密度较低主要用于存储系统启动代码和程序指令实现机制SSD通过多个闪存芯片并行工作,配合专用控制器实现高性能存储采用磨损均衡和垃圾回收算法延长使用寿命擦写寿命管理闪存具有有限的擦写次数,需要通过均衡算法和备用块管理确保可靠性现代闪存可支持数万次擦写循环高速缓存()Cache工作原理基础基于程序的时间局部性和空间局部性原理工作当访问数据Cache CPU时,控制器检查数据是否已缓存,命中则直接返回,否则从主存Cache取数据并缓存副本映射方式设计直接映射简单但冲突率高,全相联映射灵活但硬件复杂,组相联映射在两者间取得平衡现代处理器多采用组相联映射方式替换策略优化当满时需要替换策略决定淘汰哪个数据块算法效果Cache LRU好但实现复杂,简单但效果一般,随机替换实现最简单FIFO的性能分析Cache虚拟存储器页式虚拟存储段式虚拟存储将虚拟地址空间和物理地址空间都划分按照程序的逻辑结构划分段,每段大小为固定大小的页面,通过页表实现地址可变符合程序员思维习惯,便于共享映射管理简单,内存利用率高和保护,但会产生外部碎片地址转换机制段页式虚拟存储通过实现虚拟地址到物理地址的结合段式和页式的优点,先分段再分MMU动态转换,支持程序重定位和内存保护页既保持了逻辑结构的清晰性,又避功能免了外部碎片问题存储管理单元()MMU地址转换页表管理加速页面置换TLB虚拟地址转换为物理地址的核维护虚拟页到物理页的映射关快表缓存页表项提高转换效率内存不足时选择合适页面换出心部件系是现代计算机系统中实现虚拟存储的关键硬件组件它负责将程序使用的虚拟地址实时转换为实际的物理内存地址多级页表结构有效减MMU少了页表占用的内存空间,而的存在大大加速了地址转换过程TLB磁盘存储器物理结构由多个磁盘盘片组成,每个盘片有多个同心圆磁道,磁道又分为若干扇区磁头在盘片表面读写数据,通过磁化方向表示二进制信息访问时间包括寻道时间、旋转延迟和传输时间三部分寻道时间是磁头移动到目标磁道的时间,旋转延迟是等待目标扇区转到磁头下方的时间调度算法磁盘调度算法优化磁头移动顺序,减少寻道时间算法如电梯调度,选择最短寻道时间,各有优缺点SCAN SSTF固态驱动器()SSD内部架构性能优势对比SSD由闪存控制器、闪存颗粒、缓存芯片和接口电路组成控制与传统硬盘相比,具有显著的性能优势随机读写速度提升SSD SSD器是的大脑,负责数据管理、错误校正、磨损均衡等关键功数十倍,功耗降低以上,抗震性能优异,工作噪音几乎为SSD50%能零闪存颗粒按照通道和晶粒层次组织,支持多通道并行访问现代的顺序读写速度可达数千,而传统硬盘通常只有SSD MB/s100-采用技术,通过垂直堆叠大幅提高存储密度延迟方面,的访问延迟不到毫秒,硬盘则需要SSD3D NAND200MB/s SSD1毫秒5-10光存储技术技术CD-ROM使用780nm红外激光,容量约650MB,主要用于音频和数据存储采用螺旋轨道和可变线速度读取技术发展DVD使用650nm红光激光,容量
4.7GB-17GB,支持多层存储广泛应用于视频存储和软件分发技术Blu-ray采用405nm蓝紫光激光,单层容量25GB,双层50GB支持高清视频存储,代表光存储技术的最新发展技术演进趋势全息存储、多维光存储等新技术正在研发中,有望实现更高的存储密度和更快的访问速度新型存储技术相变存储器()磁阻存储器()PCM MRAM利用相变材料在晶态和非晶态之基于磁隧道结效应,通过改变磁间的电阻差异存储数据具有非化方向存储信息具有非易失易失性、高速度、高耐久性等优性、无限次读写、超低功耗等特点和美光联合开发的点特别适合于嵌入式系统和移Intel3D技术就是的商业化动设备应用XPoint PCM应用阻变存储器()ReRAM利用金属氧化物薄膜的电阻变化存储数据结构简单、工艺兼容性好、功耗极低被认为是下一代非易失性存储器的重要候选技术之一存储器的可靠性设计奇偶校验最简单的错误检测方法,通过附加校验位检测单位错误纠错码技术如汉明码、码等,不仅能检测错误还能自动纠正错误BCH技术RAID通过多硬盘冗余阵列提供故障容错和性能提升能力存储器可靠性设计采用多层防护策略硬件层面通过内存检测和纠正数据错误,技术提供硬盘级别的冗余保护软件层面实ECC RAID施定期备份和灾难恢复计划,确保数据的长期安全现代企业级存储系统通常将这些技术结合使用,构建完整的数据保护体系存储系统的性能优化预取技术通过预测程序的访问模式,提前将可能需要的数据加载到高速存储器中硬件预取器可以检测顺序访问和步长访问模式,软件预取则由编译器或程序员显式控制缓冲区技术在不同速度的存储层次之间设置缓冲区,平滑数据传输过程多级缓冲和双缓冲技术可以有效隐藏延迟,提高系统整体吞吐量I/O并行存取技术通过多个存储设备并行工作提高访问带宽包括存储器交叉存取、多通道内存控制器、并行磁盘阵列等技术现代系统广泛采用这些技术提升性能数据压缩技术通过压缩算法减少存储空间占用和传输数据量实时压缩技术在不显著影响性能的前提下,可以有效提高存储利用率和传输效率内存管理技术非连续分配管理连续分配管理如分页、分段和段页式管理允许程序包括单一连续分配、固定分区分配和动的逻辑地址空间不连续,有效解决内存态分区分配简单易实现但存在内存碎碎片问题,是现代操作系统的主流方片问题,现代系统较少单独使用案动态分配算法伙伴系统算法包括首次适应、最佳适应、最坏适应等将内存按的幂次方大小进行分块管2策略根据不同的应用需求选择合适的理,分配时寻找合适大小的块,释放时分配算法,优化内存利用率和分配性尝试与相邻块合并平衡了分配效率和能碎片控制存储器系统设计趋势层次结构深化存储器层次不断增加,从传统的三级扩展到四级甚至五级每一级Cache都针对特定的性能和容量需求进行优化,形成更加精细的存储体系性能全面提升通过先进制程工艺、新材料应用和创新架构设计,同时实现大容量、高带宽和低延迟、等技术代表了这一发展方向DDR5HBM非易失性技术发展新型非易失性存储器如、等逐渐成熟,有望打破传统存储层次PCM MRAM的界限,实现存储器和存储设备的融合堆叠技术3D通过垂直堆叠技术大幅提高存储密度,减少芯片面积、3D NAND3D等技术已商业化,未来将扩展到更多存储器类型XPoint存储器与的交互CPU总线系统演进与一致性DMA从早期的单一系统总线发展到现代的多层次总线架构前端总线直接内存访问()允许设备绕过直接与内存交换数DMA CPU连接和内存控制器,内存总线专门负责与内存通信,总据,提高了效率但在多核和多缓存系统中,需要复杂的一CPU I/O I/O线处理外设连接致性协议确保数据正确性现代处理器将内存控制器集成到内部,通过高速点对点连、等缓存一致性协议通过监听总线活动,维护多个CPU MESIMOESI接直接访问内存,大幅减少了访问延迟多通道内存控制器支持缓存间的数据一致性现代系统还采用目录协议等可扩展方案并行数据传输存储系统的未来发展存储技术正朝着存算一体化方向发展,在存储器内直接进行计算操作,减少数据搬移开销技术实现了存储和内存的融3D XPoint合,量子存储技术有望带来革命性突破存储技术利用生物分子的高密度特性,理论上可实现极高的存储密度这些前沿技术虽然还在研发阶段,但代表了存储技术的重DNA要发展方向,将深刻影响未来计算机系统的架构设计第二部分输入输出系统概述系统地位接口标准控制器作用输入输出系统是计算机与标准化的接口协议确保不设备控制器作为和外CPU外部世界交互的桥梁,负同厂商设备的兼容性从设之间的中介,处理具体责数据的输入采集和结果早期的并行接口到现代的的设备操作细节,简化了输出展示其性能直接影高速串行接口,接口技术系统软件的复杂性响用户体验和系统整体效不断演进能发展历程从简单的程序控制到智能化的处理器,系统I/O I/O经历了从集中控制到分布式处理的发展过程外部设备的分类输入设备输出设备人机交互的前端信息展示与输出键盘鼠标触控设备显示器投影仪••扫描仪摄像头麦克风打印机绘图仪••传感器测量仪器音响扬声器••通信设备存储设备网络连接与通信数据持久化保存网卡路由器硬盘固态硬盘••调制解调器光盘磁带••蓝牙模块盘存储卡•WiFi•U设备控制器的组成数据寄存器组控制状态寄存器用于暂存与设备之间传输的控制寄存器接收的命令信CPU CPU数据通常包括数据输入寄存器息,指导设备执行特定操作状和数据输出寄存器,支持不同的态寄存器反映设备当前的工作状数据宽度缓冲区的大小影响数态,包括就绪、忙碌、错误等状据传输的效率和连续性态信息设备接口电路负责与具体外部设备的物理连接和信号转换不同类型设备需要专门的接口电路,处理电平转换、信号时序、协议转换等问题设备控制器与的接口CPU数据总线传输实际的数据信息,位宽决定并行传输能力地址总线指定访问的寄存器或存储位置控制总线传递读写使能等控制信号接口方式端口映射或内存映射选择I/O与设备控制器通过标准化的总线接口进行通信数据总线的宽度通常为位、CPU816位、位或位,决定了单次传输的数据量地址总线用于选择控制器内的特定寄存3264器,控制总线则提供读写时序和使能信号输入输出编址方式独立编址(映射)统一编址(内存映射)I/O I/O设备使用独立的地址空间,与内存地址空间分离提供将设备寄存器映射到内存地址空间中,使用普通的内存访问I/O CPU I/O专门的指令(如、)访问设备寄存器这种方式结构指令操作设备这种方式简化了编程,可以使用所有内存操作指I/O INOUT清晰,地址不占用内存空间令访问设备I/O I/O优点是地址空间独立,不会与内存冲突;缺点是需要专门的优点是编程简单,可以使用丰富的内存操作指令;缺点是占用内I/O指令,增加了指令集复杂度架构就采用这种方式,存地址空间、等现代处理器架构广泛采用这种方Intel x86ARM RISC-V提供的地址空间式64KB I/O输入输出控制方式
(一)状态查询CPU定期检查设备控制器的状态寄存器,判断设备是否已经准备好进行数据传输或完成了上一次操作数据传输当设备准备就绪时,CPU执行数据读写操作对于输入操作,从设备数据寄存器读取数据;对于输出操作,向设备数据寄存器写入数据循环等待如果设备未准备好,CPU继续循环查询直到设备状态改变这种忙等待方式简单但效率较低,特别是对于慢速设备操作完成数据传输完成后,CPU可以继续执行其他任务或准备下一次I/O操作程序查询方式的优点是实现简单,适合快速响应的设备输入输出控制方式
(二)中断请求产生当设备完成数据准备或操作完成时,设备控制器向发送中断请求I/O CPU信号这种异步通知机制避免了的忙等待,显著提高了系统效率CPU中断响应处理在执行完当前指令后检查中断请求,保存当前程序状态(程序计CPU数器、寄存器等),然后转向执行相应的中断服务程序中断服务执行中断服务程序处理具体的操作,包括数据传输、状态检查、错I/O误处理等服务程序应当尽可能简短高效,以减少对正常程序执行的影响中断系统的实现中断优先级高优先级中断可打断低优先级服务中断控制器2等专用芯片管理多个中断源8259A中断向量表存储各中断源对应的服务程序地址中断请求线物理连接设备与的信号线路CPU现代中断系统采用分层管理架构中断控制器负责收集来自多个设备的中断请求,按优先级排序后向报告中断向量机制通过查表快速定CPU位服务程序,减少了中断响应时间可编程中断控制器支持中断屏蔽、优先级设置等灵活配置输入输出控制方式
(三)总线控制请求DMA控制器获得总线控制权后,直接控DMA设备需要进行大量数据传输时,向DMA制数据在内存和设备之间的传输,无I/O控制器发送请求信号,同时释放对DMA需参与每个数据字的传输过程CPU总线的控制权给控制器DMA传输完成数据传输当整个数据块传输完成后,控制器控制器按照预设的传输参数(起始DMA DMA向发送中断信号,通知传输结束,地址、数据长度、传输方向)自动完成CPU并将总线控制权归还给数据块传输,大大提高了传输效率CPU控制器设计DMA地址寄存器字计数器控制寄存器存储当前传输的内存地址,记录剩余需要传输的数据字设置传输参数,包括传输方每传输一个数据字后自动递数,每传输一个字后递减向(读写)、传输模式/增支持递增、递减或保持当计数器减为零时表示传输(单字块按需)、通道优//不变等多种地址模式,适应完成,控制器产生中先级等提供灵活的配置选DMA不同的传输需求断信号项满足不同应用需求总线仲裁当多个通道同时请求DMA总线时,仲裁器根据优先级分配总线使用权支持固定优先级、轮转优先级等仲裁算法输入输出控制方式
(四)通道概念I/OI/O通道是一种专用的I/O处理器,具有独立的指令集和执行能力它可以独立执行I/O程序,完成复杂的I/O操作序列,进一步减轻CPU的负担通道程序执行通道程序由一系列通道命令字(CCW)组成,每个CCW指定一个I/O操作通道可以连续执行多个CCW,实现复杂的I/O操作流程多路复用管理选择通道专门服务一个高速设备,多路复用通道可以同时为多个低速设备服务通道根据设备速度和优先级合理分配服务时间并行工作机制通道与CPU可以并行工作,当CPU执行计算任务时,通道同时处理I/O操作这种并行性大大提高了系统的整体处理能力和吞吐量处理器()I/O IOP基本结构与协作关系IOP CPU处理器具有独立的处理能力,包含自己的指令集、寄存器组通过向发送指令启动操作,然后可以继续执行其I/O CPUIOP I/O I/O和控制逻辑它可以执行复杂的程序,处理多种类型的外部他任务独立执行程序,完成后向报告结果I/O IOP I/O CPU设备这种分工使得可以专注于计算密集型任务,而处理器专CPUI/O通常包含多个通道,每个通道可以连接一个或多个设备控制门负责密集型操作在大型机和服务器系统中,这种架构可IOPI/O器通过这种层次化结构,一个可以管理几十甚至上百个外以显著提高系统性能IOP部设备外围处理机()PPU结构特点与的区别PPU IOP外围处理机是比更加独立的比更加智能和独立,可IOP PPUIOP处理单元,具有完整的处理器功以执行更复杂的算法和处理逻能它可以运行复杂的软件程辑它不仅能处理简单的数据传序,处理高级的任务和数据输,还能进行数据格式转换、错I/O预处理工作误检测纠正、数据压缩等高级功能现代应用发展现代可以看作是特殊的,专门处理图形和并行计算任务网络GPU PPU处理器、信号处理器等专用处理器也体现了的设计思想,实现了专PPU业化的分工处理总线系统与I/O系统总线1连接、内存和主要系统组件的高速总线CPU内存总线专门用于与内存控制器之间的数据传输CPU总线I/O连接各种外围设备和扩展卡的标准总线现代计算机采用分层总线架构,通过总线桥接器连接不同层次的总线这种设计允许不同速度的设备使用适合的总线,避免了快速设备被慢速设备拖累的问题总线仲裁机制确保多个设备公平访问总线资源,防止总线冲突、等标准总线提供了良好的设备PCI PCIe兼容性和扩展能力。
个人认证
优秀文档
获得点赞 0