还剩48页未读,继续阅读
本资源只提供10页预览,全部文档请下载后查看!喜欢就下载吧,查找使用更方便
文本内容:
计算机科学原理欢迎来到《计算机科学原理》课程本课程将系统地介绍计算机科学的核心概念和基础理论,为您打开计算机科学的大门我们将从计算机的定义与发展历程开始,逐步深入到硬件组成、网络通信、操作系统、编程基础、算法与数据结构等方面,同时也会探讨人工智能、大数据、云计算等前沿技术领域通过本课程的学习,您将建立起完整的计算机科学知识体系,培养计算思维能力,为未来深入学习和应用奠定坚实基础计算机的定义与发展历程第一代计算机()1946-1959以电子管为核心元件,体积庞大,功耗高,可靠性低,代表机型有、等ENIAC EDVAC第二代计算机()1959-1964以晶体管为核心元件,体积缩小,功耗降低,可靠性提高,代表产品有系列IBM7090/7094第三代计算机()1964-1971以集成电路为核心元件,性能大幅提升,代表产品有IBM系列System/360第四代计算机(至今)1971以大规模集成电路为核心,个人计算机兴起,互联网发展,代表产品有、等Apple IIIBM PC计算机科学的研究领域人工智能软件工程研究如何让计算机模拟人类智计算机网络研究软件开发方法学,包括需能,包括机器学习、自然语言求分析、系统设计、编码实现、研究数据通信原理与网络架构,处理、计算机视觉等领域测试验证及维护等完整流程包括通信协议、网络安全、分布式系统等内容理论计算机科学数据库系统研究计算理论、算法复杂性、可计算性理论等基础理论问题,研究数据的组织、存储、管理为计算机科学提供理论基础和检索技术,包括关系数据库、分布式数据库等信息与数据的本质信息的定义数据与信息的区别信息是对客观世界的描述,具有消除不确定性的作用信息是一种数据是对客观事物的记录,是信息的载体,而信息是经过处理的数资源,可以被创造、传递、存储和利用,但不会因使用而减少据,具有特定的含义和价值信息具有四个基本特性客观性、依附性、共享性和价值性在计数据可以通过计算机进行采集、存储、处理和传输,而信息则需要算机科学中,信息的处理和传递是核心内容经过人类或系统的理解和解释数据是信息的外在表现形式,信息是数据的内在含义数制和编码基础二进制()八进制()Binary Octal计算机内部的基本数制,只使用以为基数的计数系统,使用080-7和两个数字八个数字1适合电子电路中的开关状态表每位二进制数对应位八进制••31示数计算机内部所有数据最终都以主要用于一些特定的计算机应••二进制形式存储用场景十六进制()Hexadecimal以为基数的计数系统,使用和共个符号160-9A-F16每位二进制数对应位十六进制数•41广泛用于程序设计和计算机系统中•计算机系统结构总览应用软件为用户提供特定功能的程序系统软件管理硬件资源、支持应用软件运行硬件系统提供物理计算能力的电子设备计算机系统是由硬件和软件共同组成的复杂系统硬件是计算机的物理部分,包括中央处理器、内存、存储器等,提供基础的计算能力软件则是运行在硬件之上的程序,分为系统软件和应用软件两大类系统软件(如操作系统)管理硬件资源,提供运行环境;而应用软件则利用这些环境完成特定的任务这种分层结构使得计算机系统既能发挥硬件的性能,又能满足用户的多样化需求计算机硬件的基本组成中央处理器()内存()存储器()输入输出设备CPU MemoryStorage/计算机的大脑,负责执行指令暂时存储程序和数据的场所,具永久存储数据的设备,如硬盘、连接计算机与外部世界的桥梁,和数据处理,包含运算器和控制有读写速度快但断电丢失数据的固态硬盘等虽然读写速度较内如键盘、鼠标、显示器、打印机器两大核心部件现代集成特点常见的内存,数据存慢,但能持久保存数据,容量等这些设备使得用户能够与计CPU DDR4了数十亿个晶体管,主频可达数传输率可达以上也更大算机进行交互3200MT/sGHz运算器和控制器运算器()工作原理控制器功能与类型ALU算术逻辑单元是的核心部件,负责执行各种算术运算(如加控制器是的指挥中心,负责从内存中取出指令,解释指令,CPU CPU减乘除)和逻辑运算(如与、或、非)运算器内部包含多个专用并发出控制信号指挥计算机各部件协调工作控制器通过时序电路电路模块,能够并行处理不同类型的运算产生各种定时信号,保证指令按正确的顺序执行现代中的运算器已经高度复杂化,不仅包含整数运算单元,根据实现方式,控制器可分为硬连线控制器和微程序控制器两种CPU还有浮点运算单元、矢量运算单元等专用模块,以提高特定类型计硬连线控制器直接用硬件电路实现控制功能,速度快但灵活性差;算的效率运算器的性能直接影响了的计算能力微程序控制器则通过存储在控制存储器中的微程序实现控制功能,CPU灵活性高但速度较慢存储系统概述缓存寄存器与内存之间的高速小容量存储,分为CPU内部的临时存储单元,速度最快,容CPU缓存,容量通常为至L1/L2/L3KB MB量最小,每个仅存储数十至数百比特级别外存主存包括硬盘、等,容量大(级别),即通常所说的内存,容量为级别,访SSD TBGB但访问速度较慢,掉电数据不丢失问速度介于缓存与外存之间计算机存储系统采用了层次化架构,从上到下速度递减、容量递增、成本递减这种设计充分利用了程序的局部性原理,即程序在执行过程中倾向于访问最近使用过的数据和指令,从而在性能和成本之间取得平衡输入与输出设备输入设备是用户向计算机传递信息的工具,如键盘(文本输入)、鼠标(位置控制)、触摸屏(直接操作)、摄像头(图像捕捉)和麦克风(声音输入)等这些设备将各种形式的信息转换为计算机可处理的电子信号输出设备则将计算机处理结果以人类可理解的形式呈现出来,如显示器(视觉输出)、打印机(持久文档)、扬声器(音频输出)和投影仪(大屏显示)等随着技术发展,虚拟现实头盔、打印机等新型设备也不断涌现,丰富了人机交互的方式3D I/O计算机网络基础概念单机时代各计算机独立工作,无互联能力局域网时代部门内计算机互联,资源共享互联网时代全球范围内网络互联,信息高速流通物联网时代人、机、物全面互联,智能化发展计算机网络是将地理位置不同的多台计算机及其外部设备,通过通信设备与线路连接起来,由功能完善的软件实现资源共享和信息传递的系统网络使人们能够突破时间和空间的限制,高效地交换信息、共享资源从早期的发展到今天的全球互联网,计算机网络已经历了多次重大变革,不仅连接了数十亿台设备,也深刻改变了人类的生活和工作方式随着、物ARPANET5G联网等技术的发展,网络连接的范围和深度还在不断扩展网络拓扑结构与通信方式星型拓扑环型拓扑总线型拓扑所有节点都连接到中心节点,各节点依次相连形成闭环,所有节点连接到同一传输介形成星形结构优点是结构数据沿环单向或双向传输质上优点是结构简单,容简单,易于管理;缺点是中优点是结构均匀,无中心节易扩展;缺点是总线负载大,心节点故障会导致整个网络点故障问题;缺点是任一节节点越多性能越低,且总线瘫痪常见于局域网环境点故障可能影响整个网络故障会导致整网瘫痪网状拓扑部分或全部节点之间都有直接连接优点是可靠性高,容错能力强;缺点是连接线路多,成本高,管理复杂常用于骨干网和关键业务网络七层模型与协议OSI TCP/IP应用层为应用程序提供网络服务,如、、等协议HTTP FTPSMTP表示层数据格式转换、加密解密、压缩解压缩会话层建立、管理和终止会话连接传输层端到端的数据传输服务,如、协议TCP UDP网络层提供路由和寻址功能,如协议IP数据链路层在相邻节点间提供数据传输,如以太网协议物理层传输比特流,规定物理特性,如电缆、光纤等数据传输与网络安全数据包与路由原理常见网络安全隐患在网络中,数据被分割成小的数据包进行传输每个数据包包含源网络安全面临多种威胁,主要包括病毒和恶意软件攻击(如特洛地址、目标地址等控制信息,使其能够独立地在网络中传输路由伊木马、蠕虫、勒索软件等);网络入侵(如暴力破解、中间人攻器根据路由表中的信息,决定每个数据包的最佳转发路径击、后门入侵等);拒绝服务攻击();数据窃取和身份盗DDoS用等路由协议(如、、等)负责更新和维护路由表,确RIP OSPFBGP保数据包能够高效地从源节点传输到目标节点这种分包传输和动为应对这些威胁,需采取综合防护措施部署防火墙和入侵检测系态路由机制,使网络具有很高的灵活性和容错性统;使用加密技术保护数据传输;实施身份认证和访问控制;定期更新系统补丁;进行安全意识培训等只有多层次、全方位的防护,才能构建相对安全的网络环境操作系统基础进程管理负责创建、调度和终止进程,实现多任务并发执行,管理进程间的同步与通信,防止死锁等问题内存管理负责分配和回收内存空间,实现虚拟内存技术,管理内存与外存之间的数据交换,提高内存利用率文件管理负责文件的存储、检索、修改和保护,实现文件系统,管理磁盘空间,支持文件的共享与安全控制设备管理负责控制和协调各种输入输出设备,管理设备驱动程序,实现设备独立性,优化设备使用效/率操作系统是管理计算机硬件与软件资源的系统软件,是计算机系统中最基本的系统软件,为用户提供了一个方便使用计算机的环境常见的操作系统包括、、、、Windows macOSLinux AndroidiOS等,它们应用于从个人电脑到智能手机、服务器等不同场景进程与线程管理比较维度进程()线程()Process Thread定义程序的一次执行过程,是系进程中的一个执行流,是统资源分配的基本单位调度的基本单位CPU资源占用独立的内存空间,资源消耗共享所属进程的内存空间,较大资源消耗较小通信方式信号、管道、消息队列、共直接读写共享变量,简单高享内存等效切换开销上下文切换开销大上下文切换开销小安全性相互隔离,一个进程崩溃不一个线程崩溃会导致整个进影响其他进程程崩溃并发是指多个任务在同一时间段内交替执行,而并行是指多个任务在同一时刻同时执行在单核上,只能实现并发;在多核上,才能实现真正的并行CPU CPU死锁是指两个或多个进程线程互相等待对方释放资源,导致都无法继续执行的状态死锁的四个/必要条件是互斥使用、不可抢占、请求与保持、循环等待避免死锁的方法包括资源一次性分配、按序分配资源、使用银行家算法等文件管理与存储系统64KB簇大小FAT32常用文件系统的最大簇大小限制Windows16TB卷限制NTFS文件系统支持的最大卷大小NTFS255文件名长度现代文件系统支持的最大文件名字符数4KB页面大小大多数操作系统的内存页面大小文件系统是操作系统中负责管理和存储文件的系统软件,它定义了文件的命名、存储、组织、访问、使用和保护等操作机制常见的文件系统有Windows的和、的、的等FAT32NTFS LinuxExt4macOS APFS文件系统的核心功能包括管理文件元数据(如文件名、创建时间、访问权限等)、组织文件在存储介质上的物理布局、提供文件访问接口、保证数据的安全性和一致性等现代文件系统还提供了日志功能,在系统崩溃后能够快速恢复文件系统的一致性程序设计基础概念与流程问题分析明确问题的输入、输出和处理要求,确定解决问题的方法和步骤这是编程的第一步,也是最关键的一步,直接影响后续设计的质量算法设计设计解决问题的具体步骤和方法,包括数据结构的选择和处理流程的设计好的算法应具备正确性、可读性、健壮性和高效性编码实现使用特定的编程语言,将算法转换为计算机可执行的程序代码这一阶段需要遵循语言的语法规则和编程规范测试调试检查程序的正确性,发现并修复错误包括单元测试、集成测试和系统测试等多个层次,确保程序在各种情况下都能正确运行维护优化根据运行情况和新需求,不断完善和改进程序这是一个持续的过程,贯穿于软件的整个生命周期常用编程语言简介Python JavaC/C++JavaScript解释型高级语言,语法简洁易学,一次编写,到处运行的跨平台系统级编程语言,执行效率高,网页交互的标准语言,现已发展应用广泛特别适合数据分析、语言,广泛应用于企业级应用、直接操作内存在的基础为全栈开发语言通过C++C Node.js人工智能、开发和科学计算开发和大型分布式系统上增加了面向对象特性主要用可以在服务器端运行,结合Web Android等领域其丰富的库和框架(如其强大的面向对象特性、严格的于操作系统、游戏引擎、嵌入式、等框架可以构建复React Vue、、类型检查和完善的生态系统使其系统等对性能要求较高的场景杂的单页应用,是开发不可NumPy PandasWeb等)大大提高了开成为企业级开发的首选或缺的技术TensorFlow发效率算法与数据结构基础算法复杂度记法常用数据结构O记法用于描述算法的执行时间与输入规模之间的关系,反映了算线性数据结构包括数组、链表、栈和队列数组在内存中连续存储,O法的效率常见的时间复杂度从低到高依次为常数时间、支持随机访问;链表由节点构成,支持高效的插入和删除;栈遵循O1对数时间、线性时间、线性对数时间、后进先出原则;队列遵循先进先出原则Olog nOn Onlog n平方时间、指数时间等On²O2ⁿ非线性数据结构包括树和图树是一种层次结构,如二叉树、二叉空间复杂度则描述了算法在执行过程中所需的额外存储空间与输入搜索树、树、红黑树等;图则由顶点和边组成,可表示更复杂AVL规模的关系在实际应用中,我们通常需要在时间复杂度和空间复的关系,常用邻接矩阵或邻接表表示哈希表利用哈希函数实现高杂度之间做出权衡,选择最适合特定场景的算法效的查找,是一种重要的数据结构排序与查找算法举例递归与分治法递归的定义递归应用场景递归是一种解决问题的方法,它把一个问递归在计算机科学中有广泛的应用,特别题分解为越来越小的子问题,直到子问题适合那些可以自然地分解为相似子问题的可以简单地直接求解递归算法包含两个场景部分基本情况(边界条件)和递归情况阶乘计算•n!=n*n-1!斐波那契数列•Fn=Fn-1+Fn-2基本情况不再递归调用的终止条件•汉诺塔问题•递归情况将问题分解为更小的子问题•树结构的遍历•分治法思想分治法是将一个复杂问题分解为若干个规模较小但类似的子问题,递归地解决这些子问题,然后将子问题的解组合起来,得到原问题的解分解将原问题分解为子问题•解决递归地解决子问题•合并将子问题的解组合为原问题的解•图与树结构基础二叉树二叉树是一种特殊的树形数据结构,其中每个节点最多有两个子节点,分别称为左子节点和右子节点二叉树的基本操作包括插入、删除、查找和遍历(前序、中序、后序和层序遍历)二叉搜索树二叉搜索树()是一种特殊的二叉树,它满足特定的顺序属性对于树中的每个节点,其左子树中所有节点的值都小于该节点的值,而右子树中所有节点的值都大于该节BST点的值这种结构使得查找、插入和删除操作的时间复杂度平均为Olog n图结构图是由顶点和边组成的非线性数据结构,用于表示对象之间的关系图可以是有向的或无向的,加权的或非加权的图的常见表示方法有邻接矩阵和邻接表图的遍历算法主要有深度优先搜索()和广度优先搜索()DFS BFS计算理论简介图灵机模型可计算性和复杂性图灵机是由英国数学家艾伦图灵提出的一种抽象计算模型,是现可计算性理论研究哪些问题是可以用算法解决的,哪些是不可解的·代计算机的理论基础它包含一条无限长的纸带,一个读写头,一图灵的停机问题证明了存在一些问题是算法无法解决的,这标志组内部状态以及一个动作表图灵机通过读取纸带上的符号,根据着可计算性理论的诞生可计算问题和不可计算问题的界限,是计当前状态和读到的符号,执行相应的动作(写入新符号、移动读写算机科学的基本研究课题头、改变状态)复杂性理论则研究解决问题所需的计算资源(如时间和空间)复图灵机的重要性在于它能够模拟任何算法的逻辑,是可计算性的杂性类、、完全和难问题,以及是否等于这一世P NP NP NPPNP数学模型图灵提出的通用图灵机概念,即一台能够模拟任何其纪难题,是复杂性理论的核心内容这些理论对于理解算法的效率他图灵机的图灵机,为存储程序计算机的设计奠定了理论基础极限和选择适当的问题求解策略至关重要编译原理与表达式词法分析将源程序分解为词法单元()Token语法分析构建语法树,检查程序结构是否符合语法规则语义分析检查程序的语义正确性,如类型检查、作用域分析中间代码生成与优化生成中间表示,进行代码优化目标代码生成生成最终的目标代码(如机器代码或字节码)编译器和解释器是两种不同的程序执行方式编译器将高级语言程序一次性翻译成目标代码(通常是机器代码),然后执行;而解释器则是逐行解释执行高级语言程序,无需生成独立的目标代码编译型语言(如、)执行效率高但开发周期长,解释型语言(如、)则相反C C++Python JavaScript表达式是由操作数和运算符组成的计算式从语法角度看,表达式可分为算术表达式、关系表达式、逻辑表达式等;从求值顺序看,运算符的优先级和结合性决定了表达式的计算顺序编译器在处理表达式时,通常会构建语法树或表达式树,并通过树的遍历生成相应的代码数据库基础与模型关系型数据库关系型数据库基于关系模型,数据以表格形式存储,表之间通过关联字段建立联系其特点是结构清晰、支持复杂查询、保证数据一致性典型代表有、、MySQL Oracle等SQL Server数据库NoSQL数据库采用非关系型数据模型,如文档、键值、列族或图形模型其特点是扩展性好、性能高、灵活性强,适合处理大规模、高并发的数据典型代表有、NoSQL MongoDB、等Redis Cassandra数据库关键概念主键()是唯一标识表中每一行的字段或字段组合;外键()是建立表之间关联的字段,指向另一个表的主键通过这些机制,关系型数据库能Primary KeyForeign Key够维护数据的引用完整性,确保数据的一致性和准确性数据库查询语言SQL--基本查询SELECT列名1,列名2FROM表名WHERE条件ORDER BY列名ASC/DESC;--插入数据INSERT INTO表名列名1,列名2VALUES值1,值2;--更新数据UPDATE表名SET列名1=值1,列名2=值2WHERE条件;--删除数据DELETE FROM表名WHERE条件;--多表连接查询SELECT a.列名,b.列名FROM表1aJOIN表2b ONa.关联列=b.关联列WHERE条件;()是一种用于管理关系型数据库的标准化语言,主要包含四类操作数据查询语言()如;数据操作语言()如、、;数据定义语言()如、、;数据控制语言()如SQL StructuredQuery LanguageDQL SELECTDML INSERTUPDATE DELETEDDL CREATEALTER DROPDCL、GRANT REVOKE语言的强大之处在于它的声明式特性,用户只需描述想要的结果,而不必指定如何获取结果此外,支持复杂的查询操作,如聚合函数(、、等)、分组()、条件过滤()、子查询、连接查询等,使其成为数据分析和管理的强大工具SQL SQLSUM AVGCOUNT GROUPBY HAVING数据库设计与范式第一范式()1NF要求表中的每个属性都是原子的,不可再分第二范式()2NF在基础上,消除非主属性对码的部分函数依赖1NF第三范式()3NF在基础上,消除非主属性对码的传递函数依赖2NF范式()BC BCNF4在基础上,消除主属性对码的部分和传递函数依赖3NF数据库规范化是通过一系列范式(,简称)来逐步消除数据冗余和异常的过程范式是关系数据库设计的规则集合,从第一范式到第六范式,要求Normal FormNF逐步提高在实际应用中,通常考虑到第三范式或范式已经足够满足大多数需求BC设计良好的数据库应满足数据完整性(实体完整性、参照完整性、用户定义完整性)、最小冗余、良好性能在实际设计中,有时会根据业务需求适当违反范式规则,进行反规范化设计,以提高查询性能或满足特定需求这种设计权衡是数据库设计中的常见实践信息安全与加密技术对称加密技术非对称加密技术对称加密使用同一个密钥进行加密和解密,算法简单,运算速度快,非对称加密使用一对密钥公钥和私钥公钥可以公开,用于加密;但密钥分发和管理是其主要挑战常见的对称加密算法有私钥需保密,用于解密这解决了对称加密的密钥分发问题常见DES()、、(的非对称加密算法有、(椭圆曲线加密)等Data Encryption Standard3DES AESAdvanced RSAECC)等EncryptionStandard非对称加密算法计算复杂,加解密速度较慢,但安全性高,主要用是目前最广泛使用的对称加密算法,支持位、位和于密钥交换、数字签名等场景在实际应用中,通常结合使用对称AES128192位密钥长度,安全性高且效率好对称加密适用于大量数据和非对称加密技术,如使用非对称加密传输对称加密的密钥,然后256的加密,如文件加密、数据库加密等场景用对称加密算法加密实际数据网络安全与防护防火墙技术防病毒与恶意软件防护防火墙是一种网络安全设备,用于监控和控制进出网络的流量,基于防病毒软件通过特征码匹配、行为分析和启发式扫描等技术识别和清预设规则允许或阻止数据包防火墙可分为包过滤防火墙、应用层防除病毒、木马、蠕虫等恶意软件现代防病毒解决方案通常结合了云火墙、状态检测防火墙等类型,是网络安全防护的第一道屏障端情报和机器学习技术,提供更全面的保护常见网络攻击类型安全防护措施攻击通过大量请求消耗目标系统资源,导致服务不可用;全面的网络安全防护需结合多种技术入侵检测防御系统DDoS SQL/注入通过在输入字段插入恶意代码,操控数据库;钓鱼攻击()、内容过滤、加密通信()、身份认证与访问SQL IDS/IPS SSL/TLS伪装成可信实体诱导用户提供敏感信息;中间人攻击拦截并可能修控制、安全审计与日志分析等同时,安全意识培训和定期安全评估改通信双方的数据交换也是不可或缺的编程实践项目管理概述瀑布模型敏捷开发模型瀑布模型是一种线性顺序的开发方法,各个阶段按固定顺序依次进敏捷开发强调迭代、增量开发,将项目分解为小的、可交付的增量,行,包括需求分析、设计、实现、测试、交付和维护每个阶段必每个迭代周期通常为周它重视人员互动、工作软件、客户协2-4须完成后才能进入下一阶段,文档驱动,强调事先规划作和响应变化,而非流程工具、详尽文档、合同谈判和计划跟踪瀑布模型的优点是结构清晰,管理简单;缺点是灵活性差,难以应对需求变化,用户反馈滞后,风险集中在后期适用于需求明确、敏捷开发的优点是适应性强,能快速响应需求变化,用户参与度高,技术成熟、变化较少的项目,如航天、军工等领域风险分散;缺点是需要高度自律的团队,可能导致架构不稳定,不适合特别大型或高风险的项目常见的敏捷方法有、Scrum XP(极限编程)、看板等软件工程基础需求分析系统设计收集、分析、记录和验证用户需求,明确创建系统架构,确定组件、接口、数据结1系统功能和性能要求构和算法维护演进编码实现修复问题,适应新需求,提升性能和功将设计转化为实际可执行的程序代码能测试验证部署交付发现并修复缺陷,确保软件符合需求和质将软件部署到生产环境,交付给最终用户量标准团队协同是软件工程成功的关键现代软件开发通常采用方法,打破开发和运维之间的隔阂,实现持续集成、持续交付和持续部署DevOps版本控制系统(如)、项目管理工具(如)和协作平台(如)等工具为团队协作提供了有力支持Git JIRASlack面向对象程序设计思想类与对象封装与信息隐藏继承与多态类是对现实世界实体的抽象,定义了一组对封装是将数据和操作数据的方法绑定在一起,继承允许子类从父类获取属性和方法,实现象的属性和行为;对象是类的实例,具有类对外部隐藏实现细节,只暴露必要的接口代码重用;多态允许不同类的对象对同一消定义的属性和行为类似于模具与产品的关通过访问控制机制(如、、息做出不同响应,支持一个接口,多种实现private protected系,一个类可以创建多个对象)实现不同级别的信息隐藏public类的组成属性(数据成员)和方法继承类型单继承、多继承、接口继承••(成员函数)降低耦合外部代码与类内部实现解耦•多态形式重载、覆盖、动态绑定•对象的特点标识性、状态和行为提高安全性防止数据被意外修改••人工智能概述诞生期1950s-1960s:AI图灵测试、达特茅斯会议、感知器模型第一次冬季1970s-1980s:AI研究资金削减、技术瓶颈、计算能力有限专家系统兴起1980s-1990s:基于规则的系统、知识工程、符号主义AI机器学习崛起2000s-2010s:统计学习方法、支持向量机、决策树算法至今深度学习时代2010s:神经网络复兴、大数据驱动、计算能力突破人工智能()是研究如何使计算机模拟或实现人类智能的一门科学技术根据实现路径和目标,可分为弱人工智能(解决特定问题,如语音Artificial Intelligence,AI AI识别、图像识别等)和强人工智能(具有与人类相当的认知能力)目前,所有实际应用的系统都属于弱人工智能范畴AI机器学习基础数据采集与预处理收集、清洗、标注数据,特征提取与选择模型选择与训练选择适合的算法,设置超参数,使用训练数据学习模型参数模型评估与验证使用验证数据评估模型性能,调整超参数模型部署与应用将训练好的模型应用于实际数据,生成预测或决策监控与持续改进监控模型性能,收集反馈,定期重新训练模型机器学习可分为三大类监督学习(有标注数据,学习输入和输出之间的映射关系,如分类和回归);无监督学习(无标注数据,发现数据的内在结构,如聚类和降维);强化学习(通过与环境交互,学习最大化奖励的策略,如)AlphaGo常用的机器学习算法包括决策树和随机森林(易于理解,适合分类问题);近邻算法(简单直观,基于相似性度量);支持向量机(对于特征空间中的非线性分类问题表现良好);K朴素贝叶斯(基于概率理论,适合文本分类);神经网络(多层感知器,具有强大的表示学习能力)等深度学习与神经网络输出层生成最终预测结果隐藏层多层非线性变换,提取复杂特征输入层接收原始数据深度学习是机器学习的一个分支,使用多层人工神经网络进行表示学习与传统机器学习相比,深度学习能够自动从原始数据中学习层次化特征,减少了人工特征工程的需求深度学习在图像识别、语音识别、自然语言处理等领域取得了突破性进展卷积神经网络()专门用于处理网格结构数据(如图像),通过卷积、池化等操作有效捕捉空间特征;循环神经网络()及其变体CNN RNN、用于处理序列数据(如文本、时间序列),能够捕捉时序依赖关系;变换器()通过自注意力机制处理序列数据,LSTM GRUTransformer是现代自然语言处理模型(如、)的基础BERT GPT人工智能实际应用场景计算机视觉语音识别自动驾驶计算机视觉技术使机器能够看见和理解视语音识别技术将人类语音转换为文本或命令自动驾驶技术综合利用计算机视觉、传感器觉信息在安防领域,面部识别系统可以自智能语音助手(如苹果、百度)融合、环境感知和决策控制等技术从Siri DuerOSAI动识别和验证人员身份;在医疗领域,可让用户通过自然语言与设备交互;实时翻译级的驾驶辅助(如车道保持、自适应巡航)AI L1以分析医学影像,辅助疾病诊断;在工业领系统可以打破语言障碍;自动会议记录系统到级的完全自动驾驶,逐步减少人类干预L5域,机器视觉可以进行缺陷检测和质量控制能够将会议内容转化为文字记录,提高工作目前,特斯拉、百度、谷歌等公司都在积极效率推进自动驾驶技术的研发和应用大数据基础理论(容量)(速度)(多样性)Volume VelocityVariety大数据的规模庞大,从级到大数据生成和流动的速度非常快,大数据形式多样,包括结构化数据TB PB级甚至级,传统数据处理技术要求数据处理系统能够快速响应(如数据库中的表格数据)、半结EB难以有效管理和分析这种海量数许多应用场景需要实时或近实时处构化数据(如、)和非XML JSON据来自各种来源,包括社交媒体、理数据,如金融交易、社交媒体分结构化数据(如文本、图像、视物联网设备、传感器和业务交易等析和网络安全监控等频)多样化的数据类型增加了处理和分析的复杂性(真实性)Veracity大数据的质量和准确性参差不齐,包含噪声、偏差和异常确保数据的可靠性和真实性是大数据分析的重要挑战,需要数据清洗和验证技术生态系统是处理大数据的主要框架之一,包括(分布式文件系统)、(并行计算Hadoop HDFSMapReduce模型)、(资源管理)等核心组件,以及(数据仓库)、(数据库)、(数据流YARN HiveHBase NoSQLPig处理)等扩展组件云计算与分布式系统(基础设施即服务)(平台即服务)IaaS PaaS提供虚拟化的计算资源,如服务器、存储提供开发、测试、部署和管理应用程序的和网络用户可以自主控制操作系统、应平台环境用户专注于应用程序开发,无用程序和部分网络组件,但不管理底层物需关心底层基础设施和运行环境理基础设施代表产品阿里云应用引擎、•Google代表产品阿里云、、、、•ECS AWSEC2App EngineHeroku AWSMicrosoftAzure VirtualElastic BeanstalkM适a用c场hin景e s需要灵活控制计算资源的适用场景开发团队构建和部署应用••企业基础设施程序,无需管理基础设施IT(软件即服务)SaaS通过网络提供完整的应用程序服务,用户无需安装、维护和升级软件,直接通过浏览器访问和使用代表产品钉钉、、、•Salesforce Microsoft365Google Workspace适用场景企业协作、客户关系管理、办公自动化等•物联网技术基础感知层网络层通过各种传感器和等技术采集物理世界通过有线、无线、蜂窝等网络技术实现数据传RFID的数据信息输应用层平台层4基于物联网数据提供各类智能服务和解决方案管理设备、处理数据并提供应用开发支持物联网()是指通过各类传感设备和网络技术,将物理世界的物连接到互联网,实现信息感知、传输、处理和应用的智能网Internet ofThings,IoT络与传统互联网连接人不同,物联网主要连接物理设备,使其能够收集和交换数据,从而实现智能感知、识别和控制物联网应用已渗透到多个领域智慧家居(如智能照明、安防、家电控制);智慧城市(如智能交通、环境监测、公共安全);工业物联网(如设备监控、预测性维护、流程优化);智慧医疗(如远程监护、医疗资产追踪);智慧农业(如自动灌溉、作物监测、牲畜追踪)等边缘计算与应用5G边缘计算核心思想赋能智能社会5G边缘计算是一种将计算和数据存储从云端迁移到网络边缘的分布式技术具有三大特点高速率(峰值速率可达)、低延5G10Gbps计算范式在靠近数据源的地方进行数据处理,而不是将所有数据迟(空口时延可低至)和大连接(每平方公里可连接万1ms100传送到远程的中央服务器或云端这种架构能有效减少延迟、节省设备)这些特性为、自动驾驶、远程医疗、工业自动化AR/VR带宽、提高响应速度和数据隐私保护水平等应用提供了强大支撑边缘计算的核心组件包括边缘设备(如智能手机、设备)、边与边缘计算结合,催生了新型计算模式移动边缘计算IoT5G——缘网关(提供数据处理和协议转换)和边缘服务器(提供强大的计()在基站附近部署边缘服务器,既利用了的高速MEC5G5G算能力)边缘计算与云计算并非对立关系,而是相互补充,形成低延迟特性,又发挥了边缘计算的本地处理优势这种组合为智慧边缘云协同计算架构城市、智能工厂、车联网等场景提供了理想的技术基础,推动智能-社会的快速发展虚拟现实与增强现实比较维度虚拟现实()增强现实()VR AR定义创造一个完全虚拟的数字环境,在真实世界基础上叠加虚拟信完全沉浸式体验息,增强现实体验设备类型头盔式显示器(),如智能眼镜、透视式头显、智能HMD、手机,如、Oculus QuestHTC ViveMicrosoft HoloLens苹果ARKit用户感知用户完全沉浸在虚拟环境中,用户能同时看到真实世界和虚与现实世界隔离拟元素的融合主要应用游戏娱乐、虚拟培训、心理治工业辅助、教育培训、零售导疗、建筑设计购、导航、医疗手术辅助虚拟现实和增强现实在多个行业中都有重要应用在教育领域,可以创建虚拟实验室或历史场景,而可VR AR以将课本内容变为交互式模型;在医疗领域,用于手术模拟训练,则可以在实际手术中提供实时导3D VR AR航和信息显示;在制造业,用于产品设计和虚拟装配,则用于现场装配指导和维修支持VR AR随着技术进步,和正在融合发展,产生了混合现实()概念,即在同一设备中能够无缝切换虚拟和VRARMR增强体验未来,随着图形处理技术、传感器技术和显示技术的发展,设备将变得更轻巧、更自然、VR/AR更智能,应用场景也将不断扩展开源软件运动与影响Linux ApacheGitHub由林纳斯托瓦兹于年创建的开源操作世界上最流行的服务器软件之一,由全球最大的代码托管平台,为开源项目提供了·1991Web系统内核,已发展成为服务器、嵌入式系统和软件基金会开发和维护软协作开发的基础设施截至年,Apache Apache2021超级计算机的主流操作系统操作件基金会还孵化了众多重要的开源项目,如上已有超过亿个代码仓库和超过Android GitHub1系统也是基于内核的成功展示、、等,对大数据生态万开发者它极大地促进了全球开发者Linux LinuxHadoop SparkKafka5600了开源开发模式的强大生命力系统的发展做出了巨大贡献的协作和开源软件的传播开源软件运动起源于世纪年代末的自由软件运动,强调软件应该自由地使用、修改和分发年,开源促进会()创立,提出了20801998OSI开源概念,定义了开源软件的特征和许可证要求相比自由软件更强调实用性和商业价值,使开源理念获得了更广泛的接受伦理、法律与社会责任隐私保护随着大数据和人工智能技术的发展,个人隐私面临前所未有的挑战各国纷纷出台相关法规,如欧盟的《通用数据保护条例》和中国的《个人信息保护法》,明确了个人数据的收集、使GDPR用和保护规则技术开发者和企业需要采用隐私设计原则,从产品设计阶段就考虑隐私保护知识产权保护软件著作权、专利和商业秘密是保护技术创新的重要法律工具开源许可证(如、、GPL MIT)定义了开源软件的使用、修改和分发规则在人工智能时代,生成内容的版权归属、Apache AI模型训练数据的合法使用等问题成为新的法律挑战算法公平与透明算法决策系统可能存在偏见和歧视问题开发者需要确保算法的公平性,避免对特定群体的不公正对待算法透明和可解释性也至关重要,使用户能够理解为什么会产生特定的结果或建议,特别是在医疗、金融、司法等关键领域技术与社会影响计算机科学家和工程师应当考虑其工作的社会影响,包括对就业、社会公平和环境的影响数字鸿沟、自动化对就业的冲击、技术滥用等问题需要多方协作解决行业协会和专业组织如、ACM等已制定相关伦理准则,指导技术专业人员的行为IEEE未来计算机科学发展趋势量子计算利用量子力学原理(如叠加和纠缠)进行计算,有望解决传统计算机难以解决的复杂问题量子比特可以同时表示多个状态,理论上可以实现指数级的计算加速在密码破解、药物设计、材料科学和优化问题等领域具有巨大潜力,但目前仍面临量子相干性、错误校正等技术挑战下一代智能系统将更加自主、适应性强且具有持续学习能力神经形态计算模拟人脑神经元结构,可实现更高效的模式识别和智能处理;边缘使智能决策能够在本地设备上完成,减少对云端的依赖;自适应学习系统能够从经验中不断优化自身性能;多模态融合技术将整合视觉、语AI言、声音等多种信息源,实现更全面的场景理解经典案例分析一超级计算机
2.73千万亿次秒/天河一号峰值计算性能14920处理器核心数由与共同构成Intel CPU GPU1世界排名年发布时全球第一
20104.04兆瓦功耗系统运行功耗水平天河一号是中国第一台千万亿次级超级计算机,由国防科学技术大学研制,于年正式面世它采用了与混合异构架构设计,这种创新的架构2010CPUGPU设计既保证了通用性,又大幅提升了特定场景下的计算效率,标志着中国超算技术进入世界先进行列天河一号不仅在峰值性能上领先,其系统可靠性、软件生态和应用适配性也达到了很高水平它在气象、石油勘探、生物医药、航空航天等领域发挥了重要作用,为科学研究和工程应用提供了强大的计算支持作为中国超算发展的里程碑,天河一号的成功开启了中国超算技术的快速发展期经典案例分析二智能手机1时代()Symbian1997-2010诺基亚主导,封闭生态,以通信为主,应用开发复杂革命(至今)iOS2007-苹果引领触屏革命,创建应用生态App Store崛起(至今)Android2008-谷歌开源策略,多厂商合作,市场份额全球第一4国产系统探索(至今)2019-华为鸿蒙等自主可控系统发展OS智能手机操作系统的演变反映了移动计算范式的根本转变从早期以通信为中心的功能机时代,到现代以应用和服务为中心的智能机时代,操作系统在用户体验、开发生态和商业模式上都发生了巨大变革应用生态已成为智能手机竞争的核心苹果的和谷歌的构建了庞大的应用市场,App StorePlay Store催生了移动支付、共享经济、短视频等新业态中国厂商在应用创新和本土化方面表现出色,形成了独特的移动互联网文化未来,随着、等技术融入,智能手机操作系统将进一步演进,可能形成全AR/VR AI新的交互范式经典案例分析三自动驾驶级完全自动驾驶L5无需人类干预,全场景自主运行1级高度自动驾驶L4特定场景下完全自主,可无人驾驶级有条件自动驾驶L3系统可全权控制,但需人类随时接管级部分自动驾驶L2系统控制转向和速度,人类持续监督级驾驶辅助L1单一功能辅助,如自适应巡航自动驾驶技术体系包括感知、决策和控制三大模块感知模块通过相机、雷达、激光雷达等传感器获取环境信息;决策模块基于深度学习和规则引擎进行路径规划和行为决策;控制模块将决策转化为具体的加速、制动和转向操作这些模块之间需要高精度地协同工作,才能确保行车安全自动驾驶落地面临多重挑战技术方面的极端场景处理能力、法规方面的责任认定、伦理方面的决策选择,以及公众对安全性的担忧等当前,多家企业已在特定场景(如高速公路、封闭园区、固定路线)实现了级甚至级自动驾驶的商业化应用,但完全自动驾驶的普及还需时日L3L4综合复习与能力提升建议夯实基础知识掌握计算机科学核心概念和原理,建立知识体系注重实践应用通过编程实践、项目开发强化技能,解决实际问题培养计算思维锻炼抽象思考、分解问题、算法设计的思维方式关注前沿动态持续学习新技术、新方法,保持知识更新跨学科融合将计算机科学与其他学科知识相结合,拓展应用视野计算机科学学习重点包括数据结构与算法(提供解决问题的基本工具);计算机系统结构(理解软硬件交互原理);编程语言与开发工具(掌握表达和实现思想的手段);网络与安全(把握信息传输和保护机制);数据库技术(学习数据管理方法);以及人工智能基础(了解智能系统设计原理)计算思维是解决问题的方法论,包括分解(将复杂问题分解为可管理的小问题)、模式识别(发现问题中的规律和相似性)、抽象(提取核心特征,忽略不相关细节)和算法设计(设计解决问题的步骤)培养计算思维能力不仅有助于编程,也能提升在其他领域的问题解决能力课程总结与展望计算机科学的魅力终身学习的重要性计算机科学融合了数学的严谨、工程的实用和艺术的创造,通过编计算机科学是一个快速发展的领域,知识更新迭代速度极快昨天程这一数字魔法,我们可以将抽象的思想转化为可运行的系统,的前沿技术可能很快成为今天的标准工具,而今天尚未出现的技术解决现实世界的问题,创造前所未有的体验可能在明天改变整个行业因此,保持持续学习的态度和能力至关重要计算机科学的魅力还在于其无限的可能性和持续的创新从人工智能到量子计算,从区块链到元宇宙,计算机科学不断突破边界,开有效的学习策略包括关注基础理论而非仅学习工具;参与开源社辟新的研究领域和应用场景,为人类社会的发展提供源源不断的动区和技术交流;阅读经典文献和前沿论文;解决实际问题并从中学力习;建立个人知识管理系统;培养批判性思维能力只有不断学习和实践,才能在这个充满活力的领域保持竞争力。
个人认证
优秀文档
获得点赞 0