还剩34页未读,继续阅读
本资源只提供10页预览,全部文档请下载后查看!喜欢就下载吧,查找使用更方便
文本内容:
6.AI35谁将取代对的冷思DeepSeek——DeepSeek考
一、的一般情况DeepSeek
(一)是谁DeepSeekDeepSeek成立于2023年,公司位于中国杭州,由前对冲基金幻方(High-FlyerQuant)的领导者梁文峰创立DeepSeek的主要特点是基于开源模型和提供低推理成本的技术DeepSeek聚集了一支年轻、技术技能出色的团队,其核心目标是推动通用人工智能(AGI),并以透明和开源的方式进行研究,同时强调通过低成本的技术使先进的人工智能(AI)更容易获取
(二)的成就DeepSeekDeepSeek在模型开发上采用了混合专家架构(MoE)等先进算法,这有助于节省显存资源,并提高底层算力的使用效率这种技术思路在DeepSeek-V2中已经得到验证公司通过开源其模型和相关技术,允许更多的AI团队基于这些最先进且成本最低的技术开发新的应用DeepSeek-Rl是公司推出的一款模型,在短时间内登顶苹果美国区应用商店免费App下载排行榜,并在中国区也取得了领先的位置该模型在多个领域(如文本创作、代码生成等)达到了与OpenAI相当的水平,但成本仅为OpenAI模型费用的一小部分DeepSeek的突出功能之一是其令人难以置信的非常低的API调用价格,使高级AI更容易访问例如,DeepSeek-R1的起价每百万输入Token为
0.55美元、每百万输出Token为
2.19美元,这一价格远低于OpenAI或其他美国AI实验室的产品
(三)DeepSeek引起的市场轰动DeepSeek的成功可能会促使OpenAI和其他美国供应商降价以保持现有的领先地位如果更高效的模型能够以少得多的支出参与竞争,那么人们就会质疑Meta和微软等公司的巨额支出,他们分别承诺在2025年将至少650亿美元主要投入在AI基础设施上这一资本支出DeepSeek在全球市场掀起风浪,阿斯麦、英伟达等之前受益于AI服务需求欣欣向荣的股票大跌,而科大讯飞等与DeepSeek相关的中国股票则出现上涨1月27日,纳斯达克100指数期货跌幅扩大至5%,标普500指数期货下跌3%欧洲方面,科技股领跌,芯片设备制造商阿斯麦控股下跌11%,Cboe波动率指数(VIx)走高如果此番跌势维持,纳斯达克100和欧洲斯托克600科技股指数所蒸发的市值总额将达大约
1.2万亿美元“DeepSeek的成功显示出开发成本较低的强大AI模型是可能的,”瑞士联合私立银行UnionBancairePrivee董事总经理Vey-SemLing表示,“这可能会冲击目前由少数科技巨头高额支出来驱动整个AI供应链的投资逻辑”四DeepSeek的创新DeepSeek-V3和DeepSeek-Rl都利用了混合专家架构MoE,该架构仅激活其6710亿个参数中的一个子集可以把它想象成部署数百名专业的微观专家,在需要他们的技能时介入这种设计确保了计算效率,同时保持了高模型质量DeepSeek采用纯强化学习RL方法,进一步使其与众不同这些模型通过连续的反馈回路自主学习和改进,实现自我校正和适应性,这种机制显著提高了其解决问题的能力,特别是对于需要深入推理和逻辑分析的任务除了MoE,多头潜在注意力机制MLA提高了模型同时处理多个数据流的能力通过将焦点分布在几个“注意力头上,可以更好地识别上下文关系并处理细微的输入,即使在处理单个请求中的数万个Token时也是如此五用户评价用户对DeepSeek-Rl的高度评价主要集中在其思考过程的细腻性、自洽性和全面性上,它能够提供深度和细节丰富的输出一些用户也指出了DeepSeek在某些方面的“用力过猛”,如生成过于复杂的语言或不适当的用词,特别是针对特定受众(如儿童)的内容DeepSeek面临的技术挑战包括如何进一步优化模型的性能、降低成本的同时保持高效率,以及克服可能存在的幻觉和偏差问题DeepSeek公司正在专注于增强其“DeepThink+Web”搜索的功能,以实现实时在线查找能力此外,还考虑开发针对特定行业的定制化模型,以及建立全球合作伙伴关系
二、关于影响的分析DeepSeek与DeepSeek基本信息相对的,是其所产生的巨大影响这些影响中有哪些是短期性的,哪些可能是长期性的?
(一)对中美战略竞争的影响“星际之门”计划DeepSeek对中美战略竞争的影响,首先表现在对美国“星际之门”计戈I(theStargateproject)的影响2025年1月22日,美国总统特朗普在白宫新闻发布会上宣布启动“星际之门”计划这一计划被称为“21世纪AI时代的,星球大战,计划”“星际之门”计划由软银、OpenAI、甲骨文等科技巨头联合推动,注资高达5000亿美元该计划旨在建设先进的数据中心和配套基础设施,以支持人工智能技术的快速发展,预计在未来四年内完成DeepSeek出现后,一个显而易见的疑问是美国耗费5000亿美元的计划所完成的工作中国人难道不能用500亿美元甚至更低的成本完成,乃至做得更好吗?这样一来,“星际之门”计划还有意义吗?因此特朗普评价道,DeepSeek的问世是一记“警钟”DeepSeek对“星际之门”计划的影响主要体现在技术竞争、市场情绪、政策与战略调整等方面首先,技术竞争方面,DeepSeek凭借其低成本、高性能的技术优势,给AI行业带来了新的竞争格局“星际之门”计划的参与者可能会重新评估投资策略和技术方向,思考是否有更高效低成本的方式实现目标例如,原本计划大量投入算力资源的企业可能会因DeepSeek的出现而调整策略,这增加了美国在人工智能领域的技术竞争压力其次,市场情绪方面,DeepSeek的发展吸引了市场的关注,使得投资者对高成本AI相关项目产生了怀疑DeepSeek的市场预期和成本估值,会吸引更多投资者关注最后,政策与战略调整方面,DeepSeek的成功表明中国科研团队在有限条件下通过创新实现了弯道超车,这可能会促使美国政府重新评估“星际之门”计划的可行性和成本效益,进行政策与战略上的调整此外,抛开成本不说,马斯克质疑“星际之门”计划的融资情况这一计划似乎没有与马斯克很好沟通马斯克在社交平台发文说,“他们实际上没有钱”“软银能确保的资金远低于100亿美元”这是暗指软银去年负债
3.8万亿日元马斯克还曾表示他“不信任”OpenAI的奥特曼美国《外交政策》ForeignPolicy上的文章《DeepSeek揭示了美中竞争的未来》Chinacompetition指出,DeepSeek的非凡成功引发了美国国家安全界的担忧,他们担心美国最先进的AI产品可能再也无法与中国更廉价的替代品竞争文章分析,美国一直在利用其对半导体供应链的控制,限制中国获取高端芯片然而,DeepSeek取得的成功让一些人开始质疑,美国的芯片出口管制是否毫无作用,甚至适得其反文章最后指出,如果美国和中国的AI模型都存在双方不确定如何控制的危险能力的风险,那么美国与中国领导层就此进行沟通则是国家安全的当务之急[1]二对中美科技竞争的影响DeepSeek的问世,在科技界眼中,缩短了中美在AI上的差距Meta创始人兼CEO扎克伯格表示,DeepSeek非常先进,并认为中美之间的AI差距非常小不仅是中美之争本身,还是开源、闭源之争L・图灵奖得主、MetaAI首席科学家YannLeCun在社交媒体上表示“DeepSeek的成功凸显了保持AI模型开源的价值,这样任何人都可以从中受益这表明开源模式正在超越专有模式”他认为“当人们看到DeepSeek的表现,惊呼中国AI正在赶超美国,但这种解读有误更准确的结论是,开源模型正在超越闭源系统[2/《福布斯》杂志则指出,DeepSeek的开源策略可能重塑全球AI标准,推动中国成为开源模型的主导者之一《自然》杂志评价称,R1的开放性远超闭源模型的“黑匣子特性由于美国公司出于商业利益,更倾向闭源系统,这给利用开源系统的中国公司更多机会,特别是在打造科技生态系统方面的机会,而这是以往中国相对于美国的薄弱环节支持这一看法的事实是,DeepSeek因开放吸引了开发界的热烈响应,很短时间内就衍生出600多个应用当然,国内科技界也有人对此持怀疑态度,主要是基于以往的开源往往在应用中被当作自主技术保守(伪开源)的历史DeepSeek目前还没有完全商业化,一旦商业化,将面临如何处理技术开放与商业模式开放的关系的问题如果处理得好,如将基础业务与增值业务充分分开,形成互补,那么中国在这方面将形成对美国的优势当然,中国如果在打造包容技术与商业开放的制度环境(如反垄断政策环境)方面落后于美国,也会使技术与商业上的优势化为乌有对巨头的挑战
2.DeepSeekDeepSeek现在俨然具有了当年U盘替代软驱那种“同等功能、巨大价差”的以小博大的势头DeepSeek的崛起对现有的AI巨头如OpenAI、Meta等构成了挑战,促使他们重新评估成本、战略和研究方法一是通过开源策略和低成本技术,DeepSeek为小型企业、研究人员和开发者提供了新的机遇一旦形成良好开发生态,有可能重现当年谷歌取代雅虎的历史DeepSeek目前已进入搜索技术领域,这要求百度打起十二分的精神来应对,懈怠就意味着出局二是随着用户采用率的增加和市场对AI能力需求的增长,DeepSeek有望继续在AI领域发挥颠覆性作用公司可能会进一步优化模型性能、加强与硬件供应商的合作,并开发针对特定行业领域的定制化解决方案DeepSeek是通过开源技术、低成本策略和创新算法推动人工智能发展的中国初创企业,其成功不仅体现在市场表现上,还在于对AI社区的影响力,以及为小型企业和开发者提供的新机遇随着未来的发展,DeepSeek有望在AI领域持续产生重大影响,并可能引领下一波变革性突破同时,也要看到,DeepSeek的出现在中国不是偶然的中国还有一批潜在的同类技术和公司即将浮出水面,包括阿里团队、李飞飞(华人)团队都已提出了初步的成果,共同推动AI的改朝换代对投资的影响
3.DeepSeekDeepSeek的初步成功,引发了人们对OpenAI,微软和其他公司所追求的投资计划的重大质疑首先对OpenAI来说,DeepSeek以极低的成本实现极高性能,让人们对OpenAI投资回报能力产生怀疑将DeepSeek节俭、分散的创新,与OpenAI等其他开发商对集中、资源密集型基础设施的依赖,进行了对比结果发现,打造一个世界水平AI模型,只需要投入巨头一个高管的年薪就可以做到,巨头动辄养着十几个、几十个这种价位的高管的合理性,就会遭到投资人普遍质疑,甚至会产生受骗的感觉可以想见,巨头内部现在慌作一团,即使为了保住工资,也有动机赶紧向投资人证明DeepSeek的种种不是但问题是,如果与DeepSeek类似的小公司成批涌现时,想通过栽赃和甩锅来摆脱困境,将不会有效当然,有一点现在还看不清楚,这就是DeepSeek本身的资本模式这家公司出身对冲基金在DeepSeek这个案例中,对冲基金对AI的投入(包括包装与炒作)是可以看清的;但AI的产出和商业化现在还没有发生,将会怎样,还有待观察一旦演化成一个金融的故事,就会存在各种变数从投资上,人们期待DeepSeek做实,而不要变成一个壳
三、谁将取代从一滴水看大海DeepSeek AI作为专门研究人工智能的业内人士,还要跳出媒体与资本的喧嚣,用平常心冷静观察DeepSeek,这样看出的门道自然有所不同
(一)冷思考之一DeepSeek是弯道超车还是换道超车?人工智能的权威专家钟义信教授认为,DeepSeek还在传统轨道的同一个赛道上,可以评价为“在同一个赛道上,DeepSeek以更优秀的技术超越了GPTol”要看到在同一赛道弯道超车的局限钟义信指出,DeepSeek的技术(主要是算法效率)比GPT更优秀,但是,两者的范式(科学观和方法论)是一样的具体来说,两者的科学观都是把人工智能看作“人工脑”,两者的方法论都遵循“唯形式化和“分而治之”然而,研究人工智能所需要的真正科学观,是应该把人工智能看作“主体主导下的主体客体相互作用的信息生态过程”(即整体论)这是DeepSeek热中的一种冷思考钟义信的观点无异于认为,DeepSeek与其追赶的OpenAI是同类,都是美国计算主义同一赛道上的赛手,区别只是一个跑了50步,一个跑了100步这与一般业内人士的见解(包括马斯克的见解)非常不一样,业内都是看到了开放与封闭路线的区别,看到微软收购OpenAI,使得OpenAI变成了一个忘记“初衷”的商业化工具马斯克的不满很大程度也来自这里,而不是如特朗普认为的与“星际之门”计划中的某人“有仇”不过在这里,钟义信进了一步,直指“初衷”本身存在的局限这涉及对人工智能本质的理解,属于一个更深的问题现有AI主流坚持物质学科范式(强调客体计算,缺主体价值判断),这是其时代局限这种局限在DeepSeek骨子里也有未来取代它的,将是信息学科的范式,即强调客体与主体统一从这个意义上说,下一步替代DeepSeek们的,将是克服主客二元论的AI新范式,由此开启换道超车在前沿从看科技创新企业的培育DeepSeek近期,源自中国的现象级科创企业DeepSeek在全球引起巨大轰动和深远影响,为中国科技创业从赶超迈进引领舞台提供了示范榜样,提振了广大中国科技创业者的信心社会各界在热切思考,中国缘何可以孕育出DeepSeek这样的优秀企业?一些拥有科技、人才等丰沃要素禀赋的城市甚至在反思为何出不来DeepSeek中国和世界需要努力培育出更多的DeepSeek型科创企业,以激发创新活力、助推经济发展和增进社会福祉加快培育具有科学家精神特质的企业家在科技创业活动中,企业家精神是推动成功的基本动力,其核心在于创新驱动、风险承担与前瞻布局而科学家精神强调尊重科学知识和规律,重视基础研究及原理性学习在追赶阶段,创业者大多采取模仿创新和跟随战略,在既有的技术范式和市场路线下开展创新创业活动,有机会取得一定的商业成功和社会贡献但当步入引领阶段,面对标杆稀缺、自主创新需求激增、风险和不确定性加大的情境,这两种精神的结合就变得尤为关键与此同时,在未知的前沿领域盲目探寻会徒增失败概率,更需要创业者尊重科学知识和规律,科学驱动的创新创业的重要性日益提升企业家不仅需要丰富商业知识,还需要养成厚实的科学精神,注重学习基础性和原理性知识,上,这一趋势的苗头在生成式AI中(如新生成主义,neo-enactivism)隐约可见本周作出DeepSeek同类成果的李飞飞,其实就在这条路上,她的野心肯定不止于DeepSeek
(二)冷思考之二知还是行?著名人工智能专家蔡恒进对DeepSeek的成就有一个独特的看法,认为DeepSeek对巨头的冲击的意义不只在于成本,而在于模式蔡恒进说:“OpenAI现在走的路,就是把算力集中起来,把参数推上去来实现AGI,这实际上是世界的前景就变成很中心化的AI系统,然后这个系统会需要大量的资源、能量,还有芯片算力的集中而DeepSeek的发展是分布式计算的方向,这比业界一般的“开放-封闭”视野多了一个“集中一分布”角度蔡恒进同样主张主客一体的AI新范式,不满意计算主义的AI路线,认为“我们有人类或者生命的参与、有主观能动性”,要把这种主体性加入计算的客体性中他具体提出了“认知坎陷说”,即一种加入布伦塔诺意向性的认知论对于AI来说,“认知坎陷说”相当于一个“知难行易”模型目前计算主义把重点放在前者(知难),体现为“AI的进步都是通过规模来实现的只有堆算力才是成功的“(李德毅院士称为“暴力计算”)他从理查德•萨顿(RichardS.Sutton)的Thebitterlesson(可译为“苦涩的教训”)一文中,引出对通用算力的质疑夸奖DeepSeek实际上打破了这个结论”“已经偏离了那条路线了”,这是指DeepSeek不靠堆GPU而提高性能蔡恒进主张的新方向,把重点放在后者(行易),相当于认为实践是简、认识是繁计算主义重认知、轻实践,形成对通用算力和暴力计算的迷信如果把AI的重点从认识转向实践,知行合一,就可以化繁为简用他的话说,“并不是说规模越大越好,只是说在它那个场景里才能生成”在走偏到客体方向的AI中加入主体因素的方法是,将算法从认识角度调整为实践角度,变为场景的认知、具身的认知,“只是根据场景或需要进行一定程度的数字化这与李飞飞的具身AI思路有相通之处为此,“追求用更小的数据库、更少的语料、更小的系统来实现更高的智能,在我看来才是正确的方向工人们在能行的时候,从不长篇大论,是因为有主体目标、意向在指引,将世界化繁为简到自己的目的上蔡恒进看好DeepSeek深度学习的方向,尤其是“不用人干预地强化学习”,但是认为DeepSeek还可以进一步在可持续的自学习这个方向上改进
(三)冷思考之三向上与向下两条曲线胡延平作为业内资深专家,这轮也没有跟着媒体跑,而是得出了独立的判断他比较冷静地分析了当前形势,看出大模型的“两条路线”是向上曲线与向下曲线不同取向的分别,认为DeepSeek走在向下曲线的道路上他说“大模型现在是两条曲线交织的双螺旋进化向上走的曲线,追求整体感知理解行为能力的通用智能,拼的是整体理解意义上的脑能力、思考和监督思考、视觉在内的整体理解,空间智能等现实模型、物理等科学模型、多模态更不在话下思维链、皮层计算、不同模型原理是当下前沿探索的核心向下走的曲线提升数据质量、训练意义上的量效比、算力能效比,大幅降低推理成本DeepSeek在这个双螺旋里向下有余向上不足胡延平说“向下曲线对成本效率有改变,但对捧得AGI圣杯的贡献可以忽略[4]”他认为,DeepSeek没有展现分毫对未来的思考和探索,实质上依然处在追赶阶段DeepSeek不仅属于古典LLM(大语言模型,LargeLanguageModel)范畴,呈现的其实还是“性价比在胡延平看来,DeepSeek主要是对于合成数据、知识蒸储、FP8(低精度FT8为一种8位浮点数格式)、稀疏模型、MoE,甚至包括多头注意力机制等“已有已知技术”进行组合,“在资源和性能之间调优,取得最佳平衡,这是DeepSeek-V3的成功之处:当然,对于什么才是值得追求的“AGI圣杯”,仁者见仁,智者见智
(四)不冷不热地思考高性能计算路线上的两种走法我认为把DeepSeek当作一个事件看,代表的是高性能计算思潮的崛起,从中既反映出DeepSeek的成就所在,也自然显示出其不足高性能计算是与美国相反的计算路线,在中国形成已有近20年历史早在上个世纪,国家863计划就开始实施“国家高性能计算环境项目美国计算主义的路线无以为名,可称为高速度计算高速度与高性能的不同,反映技术与技术经济的区别技术不受资源(如GPU)制约时,越快就越好,主要靠上规模、堆硬件实现;技术经济在资源约束(从担心系统、芯片“卡脖子”到强调应用)下,强调性价比,一个突出特征是强调成本打个形象的比方,同为轿车,美国车设计不太考虑省油,是因为石油资源不受限制;而日本车设计主要考虑省油,是因为担心石油哪天被断供AI也是如此高性能计算路线在中国有两种走法,一种是弯道超车,另一种是换道超车DeepSeek代表的是弯道超车的一支,如专家判断的,是在美式路线的既定赛道内,通过强化成本控制,提供高性价比的算力走这条路,时间在前DeepSeek只是第一个冒头的,最近五年会是不断开花结果之时DeepSeek的出现不是偶然的梁文锋说取得成就是“站在巨人肩膀上”,国内外都误以为巨人是指巨头、大厂,其实不尽然这个巨人应该说主要是中国科研院校,特别是北大、北邮和清华三校DeepSeek的140人团队,大多是这三校的应届毕业生如果没有导师这个群体,以及国家高性能计算环境的近20年打造,梁文锋到哪儿去找那么多博士论文成果,连人带论文都拿来,而且拿来就可以用,用了就可以超过美国巨头举例来说,DeepSeek的一个窍门是重视模型算法和硬件工程的配合,其中的技术就由这些学生以DeepSeek-AI的名义发表在论文Fire-FlyerAI-HPC Acost-effectivesoftware-hardwareco-designfordeeplearning中其中的HPC,就是高性能计算highperformancecomputing的缩写美国巨头现在总觉得自己才是“巨人”,从DeepSeek这个鸡蛋里挑有没有自己的骨头(研究成果)这些应届生是站在HPC这个巨人肩膀上成长起来的其实巨头们找一下DeepSeek中全部应届毕业生的毕业论文,就知道技术是哪里来的了举例来说,要想了解DeepSeek中不常见的3D生成技术是从哪儿来的,到清华大学检索一下,可得知是清华博士生孙景翔在DeepSeek实习期间,与导师刘烽斌等共同完成的诸如此类,不胜枚举高性能计算路线的第二种走法,目前还潜伏在冰山下的大海中,这种走法的特征是换道超车所谓换道,就是指与美国主流计算主义分道扬镶的路线最大的不同,在于范式追的时候是同范式的,超的时候用的是不同范式范式的不同,涉及的主要是对“科学是什么”的理解有了根本性的分歧其中的思路,从国家数据空间发展战略中可以看到,目前国家数据空间发展战略正处在二期工程阶段开花结果,还需要多年以后应该说,DeepSeek作为中国应届毕业生群体的代表作,还没有进入这个主力赛道DeepSeek包括马上涌现的大批同行者,作为高性质计算这个大的中国思潮的一部分,只看到LLM成本问题的表层,即与AI物质科学范式有关的那一方面当然解决了这方面的问题,成就也堪称伟大但是,再过几年,美国人就会领教中国主力军团的出击,看到冰山一角下庞大的水下部分那将是一场范式革命,是从目前的客体范式向未来的主客体统一范式转变的伟大长征我们可以从上面介绍的钟义信、蔡恒进的思想中,从外围体会到其中的潮流上的思路美国最前卫的科学家也有类似想法,但不成气候而在中国,这不是一个人两个人的思想,而是代表整个群体走向共识的技术觉醒关于融入机关工作的几点思考DeepSeek目前,DeepSeek人工智能大模型作为一种新兴的技术,正快步“融入”机关工作前不久,在郑州“新春第一会”上,省委常委、市委书记安伟提出“聚焦打造智慧政府、责任政府、法治政府,加快引入DeepSeek等大模型,以AI技术全面植入、全面赋能政务服务,有效提升智能化、精准化、无纸化水平”为有效推进DeepSeek等大模型加快融入机关工作,提升政务数据处理能力,优化行政决策,推动政务流程智能化,促进跨部门协作与信息共享,笔者认为应进一步解决好DeepSeek等大模型融入机关工作可能面临的数据安全和隐私保护等问题
一、明确目标与定位一方面DeepSeek等大模型确实能提高工作效率,提升决策质量,增强机关的服务能力和水平另一方面它只是辅助工具,它不能完全替代人的工作它能为机关的决策和工作提供数据支撑,确保决策和工作客观、准确它能推动机关工作的创新,提高工作的质量和水平机关在优化行政决策过程中,可以利用DeepSeek等大模型技术进行数据分析和预测,从而更好地制定政策例如在公共健康领域监测疫情传播趋势并预测潜在风险,以提前采取应对措施同时,通过自动化工具减少人为干预,提高决策的客观性和准确性;在推动智能化政务流程中,可以实现政务流程的智能化升级另外,还可用于优化内部管理流程,如公文处理和资源分配等,提升整体行政效率它在支持多模态数据处理与分析中,不仅在文本处理方面表现出色,还支持图像、语音等多种数据类型的处理,使其在行政管理中具有广泛的应用潜力,尤其是在促进跨部门协作与信息共享,其开放性和灵活性能够整合不同部门的数据资源,实现跨部门的信息共享和协同工作但DeepSeek等大模型在融入机关工作时,可能存在数据安全和隐私保护方面的隐患,例如可能涉及跨境传输导致信息泄露的风险
二、数据安全与隐私保护DeepSeek等大模型融入机关工作时,数据安全与隐私保护至关重要既要建立严格的数据管理制度,又要加强对数据的加密、备份和访问控制,确保数据安全和保密同时,要严格遵守相关法律法规,保护公民的个人隐私建立严格的数据管理制度要明确数据的收集、存储、使用和共享规则,确保数据的合法性、安全性和保密性要加强对数据访问的权限管理建立严格的数据加密技术采用先进的加密技术对数据进行加密处理,防止数据在传输和存储过程中被窃取或篡改同时,定期对数据进行备份,防止数据丢失或损坏建立严格的数据安全培训对工作人员进行数据安全和隐私保护的培训,提高他们的安全意识和操作技能,避免因人为疏忽导致的数据泄露建立严格的应急响应机制一旦发生数据安全事件,能够及时采取措施进行处理,降低损失和影响只有在确保数据安全与隐私保护的前提下,DeepSeek才能更好地融入机关工作,发挥其应有的作用
三、与现有系统的融合DeepSeek等大模型融入机关工作,要通过全面评估、合理方案、加强沟通协作以及充分测试验证等措施,实现与现有系统的有机融合在DeepSeek等大模型融合过程中,要充分考虑系统的兼容性和稳定性,避免出现系统冲突和数据丢失等问题进行全面的系统评估深入了解现有系统的功能、架构和运行情况,找出其优势和不足之处,为DeepSeek等大模型融入提供依据制定合理的融合方案根据评估结果,结合DeepSeek等大模型的特点和优势,设计出既能充分发挥DeepSeek等大模型作用,又能与现有系统无缝衔接的融合方案建立有效的沟通机制在DeepSeek等大模型融合过程中,涉及多个部门和人员,需要加强沟通与协作,确保各方能够理解和支持融合工作进行充分的测试验证在融合方案实施后,要进行充分的测试和验证,确保DeepSeek等大模型与现有系统的融合达到预期效果对测试中发现的问题,要及时进行调整和优化,以提高系统的稳定性和可靠性
四、人员培训与能力提升DeepSeeK等大模型要在机关发挥应有的作用,需要对机关工作人员进行相关业务培训,使工作人员能够熟练掌握DeepSeeK等大模型的实际操作方法,提高机关人员对DeepSeeK等大模型新技术的认识和应用能力,提升工作效率和质量一要明确具体培训目标二要建立完善的考核机制三要注重能力提升的持续性
五、持续优化与改进DeepSeeK等大模型融入机关是一个不断完善和优化的过程要建立有效的反馈机制,及时收集用户的意见和建议,根据实际需求进行持续优化和改进,确保DeepSeeK等大模型能够更好地满足机关工作的需要建立紧密的合作机制深入了解机关的工作流程和需求,确保DeepSeek等大模型与之紧密结合这需要与相关部门进行充分的沟通和调研建立有效的反馈机制鼓励机关工作人员提出对DeepSeek等大模型使用的意见和建议,及时收集并分析这些反馈信息,以便发现问题并进行针对性的改进建立完善的维护机制根据机关工作的实际需求,对DeepSeek等大模型进行技术升级和功能拓展与维护,让机关以科学的第一性原理来指导和组织创新创业活动与注重技术应用的创业活动不同,科学驱动型创业要求创业者高度重视基础研究,而基础研究取得进展无法一蹴而就,需要创业团队敢于投入、勇于冒险、甘于寂寞、持之以恒地逐步推进DeepSeek等优秀科创企业的创业者多接受过科学知识的学习和基础研究的训练,为其接续探寻科学进展并指导创业活动打下了扎实的基础为此,需要采取以下措施一是完善科技、教育、人才三位一体体系建设,持续加强基础研究,引导和支持更多青年学子投入科学研究队伍,在学习和训练中不断提升创业者的科学精神和素养,涌现出更多科学驱动的创业实践活动;二是引导和支持创业者加大基础性和前沿性研发创新投入,注重与领域内高水平人才和机构加强科研合作,遵循科学知识持续深耕细分领域,奋力攻克关键核心技术;三是提炼总结和宣传推广具有科学家精神特质的优秀企业家案例,激励更多创业者扎根难而正确的科技创业活动持续打造更高能级的产业链创新链产业链和创新链是科技创业活动高效开展的关键支撑绝大多数科技创业活动定位于产业链和创新链中的某一特定环节或领域这种“专精特新导向的创业活动,需要与上下游客户和供应商协同发展,也需要衔接融合应用相关的科技成果在追赶阶段,创业活动对原材料、零部件以及科技知识的要求总体不高,现有产业链和创新链可以提供有效支撑但在引领阶段,科学驱动型创业活动对上下游合作伙伴、科研院校等知识源提出了较工作人员充分了解DeepSeek等大模型优势和使用方法建立科学的评价机制定期对DeepSeek等大模型融入机关工作的效果进行评估总之,DeepSeeK等大模型融入机关需要在目标定位、数据安全、系统融合、人员培训和持续优化等方面下功夫,以提升政务数据处理能力、优化行政决策过程、促进跨部门协作与信息共享等,提高决策的客观性和准确性,提升整体行政效率,全面提高机关工作效率和服务质量政务系统接入几个问题不容忽视DeepSeek数字化转型浪潮席卷各行各业,大模型在政务服务领域的应用已成为政府提升服务水平的重要抓手作为一款开源大模型,DeepSeek凭借其在成本和性能上的优势,在政务服务、公共管理和城市治理等多个领域展现出巨大的应用潜力然而,在未经过系统论证和整体规划的情况下,简单地接入或碎片化地部署DeepSeek,将面临数据安全、系统适配、成本效益等多重挑战
一、赋能政务服务现状据不完全统计,全国已有超过100家政府单位接入DeepSeek,涵盖智能问答、政策分析、交通便民、12345热线等多个场景这些实践表明,政府正在努力让DeepSeek成为提升服务效能的重要工具,争取为公众带来更便捷、更智能的服务体验但同时部分地方也出现了“你上我也上”的现象,缺乏对实际需求和应用效果的系统性思考和论证,个别地方甚至出现了夸大宣传
二、暴露出来的问题如果未经系统化的规划和设计,简单地部署DeepSeek大模型也面临诸多风险资源浪费与效率失衡风险目前,部分地方政府在引入DeepSeek时缺乏统一的规划和标准,导致重复建设和资源浪费例如,一些地方政府在未充分评估实际需求的情况下,投入大量资金引入DeepSeek及算力设备,但由于技术适配性不足或使用场景有限,最终未能实现预期效果,造成投入产出比失衡此外,当前人工智能技术发展很快,不断出现新的技术和设备迭代,如果没有进行系统和长远的规划,数月之后又要进行系统升级甚至重建生成式模型的幻觉所引发的可信度风险DeepSeek作为生成式AI模型,其输出结果可能存在不可解释性和“幻觉”问题,即生成的内容看似合理但并不符合实际情况在政策咨询场景中,如果系统提供的答案存在错误或误导性信息,可能引发公众对政府服务的不信任,甚至导致决策失误数据安全与模型可靠性带来的系统性风险DeepSeek的应用依赖于海量数据的训练和调用,这可能带来数据泄露、滥用或被恶意攻击的风险例如,政务数据中涉及大量敏感信息,如果安全防护不到位,可能导致隐私泄露、数据篡改等,进而影响政府公信力和社会稳定过度依赖技术导致的系统脆弱性与应急能力不足风险如果政府部门过度依赖DeepSeek等人工智能技术,可能导致系统在面对技术故障、网络攻击或突发事件时显得脆弱例如,一旦DeepSeek系统出现故障,可能直接影响政务服务的正常运行,甚至引发公众对政府应急能力的质疑
三、建议对策对策建议框架示意图一是准确评估业务应用场景对模型的需求,避免资源浪费与效率失衡在引入DeepSeek之前,政府部门应充分调研和评估实际业务场景的需求,明确技术的适用性和优先级例如,对于高频、标准化程度高的业务(如政策咨询、信息查询),可以优先引入DeepSeek以提升效率而对于复杂、涉及重大决策的业务,则需谨慎评估技术的适用性同时,建议建立统一的建设标准和评估机制,避免各地重复建设,确保资源投入与产出效益相匹配二是准确评估模型和算力成本,平衡投入与收益的关系在推进DeepSeek大模型与政务服务的深度融合前,系统化论证算力资源、模型开发运维成本与业务收益的平衡关系,是规避技术盲目投入、实现可持续智能化转型的核心前提例如有的行政审批的智能化应用中,人工智能系统虽将部分环节处理时间大幅压缩,但因需额外增设人工复核岗位,实际综合成本不降反升因此,需通过严谨的经济性论证,才能避免因短期政绩驱动导致的资源错配,真正实现“技术投入-治理效能-财政可持续性”的三角平衡三是准确评估数据载体的安全边界,筑牢数据安全防线DeepSeek的应用依赖于海量数据的训练和调用,因此必须明确数据的安全边界,确保敏感信息不被滥用或泄露具体措施包括,对于非公开数据,要禁止使用API调用的方式,避免数据被截取或泄露同时,优先采用国产化算力基础设施,确保数据主权和系统安全性此外,引入加密技术和访问控制机制,防止数据在传输和使用过程中被篡改或窃取定期开展数据质量与安全审计,及时发现和修复潜在风险通过这些措施,确保数据在安全边界内高效流动,为DeepSeek的应用提供可靠保障四是建立内容安全常态化防控机制,提升技术可信度与公众信任针对DeepSeek可能存在的生成内容不可解释性和“幻觉”问题,政府部门应建立常态化全生命周期的内容安全防控机制在模型上线前,要对模型和相关数据进行全面的内容安全评测,达到安全要求方可上线模型上线后,要对模型运行中的输入内容、推理过程和输出结果进行实时监测和防控此外,应构建内容安全“红队攻击”机制,不定期对模型进行模拟攻击以发现漏洞,时刻保障智能系统的安全性
四、结语DeepSeek大模型在政务领域的应用可以为政府服务带来效率的提升和智能化水平的升级,但同时也面临资源浪费、数据安全、技术可信等多重挑战需要准确评估业务需求、平衡投入产出、筑牢数据安全边界、建立内容安全防控机制,主动应对这些潜在风险,推动技术与政务服务的深度融合,为公众提供更智能、更可靠的政务服务时代,诗歌何去何从AI春节期间,DeepSeek横空出世,我尝试其指定创作了一首题目为《大圣》的诗歌,出来的诗歌是这样的“你从一块顽石中醒来,花果山的风吹过你的毛发,水帘洞的瀑布洗去你的懵懂,那一刻,你抬头,看见了天空你手持金箍棒,像握着一道闪电云靴踏过的地方,山崩地裂,星辰颤抖你说我要这天,再遮不住我的眼可天宫太高,高得连风都变得冰冷你挥舞金棒,打碎了琉璃盏,踢翻了炼丹炉,却打不破那无形的枷锁五指山压下时,你笑了,笑这天地,竟以为一座山就能压住一颗心五百年,风吹雨打,日月轮转,你的毛发依旧金黄,眼中的火焰从未熄灭直到那个和尚走来,轻轻揭去符咒,你说师父,我跟你走可你知道,真正的自由,不是无拘无束,而是心中有火,眼中有光即使戴上金箍,你依然是那个大圣,踏碎凌霄,笑傲生死如今,你站在云端,看人间烟火,看沧海桑田你说这天地,不过是我手中的一粒沙“读了这首诗,我开始有点蒙,也有些震惊这是很完整的一首诗歌,甚至可以说,如果要找一首同题的朗诵诗,没有比这一首更恰当的了因为,这首诗高度概括了孙悟空的形象,并且有一些提炼的金句随后几天,我都在琢磨这首诗,也因此发现了DeepSeek的优点和缺点DeepSeek的创作,是建立在对现有文化产品(例如原著、电视剧、动漫和电影等)的理解和整合之上,从中提炼出情节、历程、语言、形象和行动等关键元素,具有公共性这种公共性使得诗歌能够被公众理解和接受,也非常适合朗诵因为太个人化的诗歌,读了别人听不懂这首诗过滤了复杂或过于个性化的元素,使其更贴近大众的理解水平这说明DeepSeek的概括力是超越了一般人的但问题也在这里,这首诗里很多内容是整合甚至可以说是模仿洗稿出来的,并非原创,我们能从这首诗里读出一些公共用语、剧本台词和其他诗歌的痕迹AI创作是建立在人类已有文明基础上的,是一种综合、提炼与总结但AI写作有一个问题,它是面对过去的统合,并不能开拓新的未来,因为它不可能亲历和体验,因而无法产生新的情感及感受并将之转化为新的文学而人的生活是面向未来的探险,我们每天都在面对新的挑战和机遇我们感受到新的东西,马上可以把它写成文学,比如遭遇生活的惨痛经历,比如在山水间的新鲜活泼感受,比如恋爱时的激动不安,人的文学,一定是可以讲出创作背后的故事的,因为人有亲历性的现场感,而AI创作,只是对已有文学的重新组合最近,我就网上一些人认为DeepSeek将消灭诗人和诗歌,作了回应我说AI创作是共同创作,是集体智慧的产物,可以引起普遍共情,我无法预测DeepSeek诗歌写作水平最后会发展到何种程度,但就我个人写作实践及对诗歌意义的思考,我认为作为一个诗人,写好个人史就可以诗歌里面会保存和记录情感、生活、时代乃至精神人诗互证是诗歌的本质如何写好个人史,可以回归到诗歌的本质去思考,诗歌的本质是个人化的生命结晶和生活呈现;也可以回归到诗歌的起源去寻找应对之道,诗歌的起源,早有古老的智慧告诉过我们诗缘情,诗言志以及人诗互证诗缘情诗歌的根本特征就是其抒情性,“抒情”两个字,最早就出现在屈原的《九章》里“惜诵以致愍兮,发愤以抒情”,屈原因进谏遭遇不公对待,所以要倾诉内心的幽怨和情绪所以,屈原也是抒情的始祖如何理解“抒情”二字?情,当然是指情感那么,“抒”指什么?陈世骥先生考证,抒有编织、制作的意思,可以理解为形式、技巧、工艺,抒情,即是对情感的编织、规划、设计与构建,简而言之,是赋予情感一定的形式,将情感形式化,就诗歌而言,当然就是指将情感文字化,以语言的形式表达情感诗歌,是语言的艺术诗言志中国诗歌精神的密码就是“诗言志朱自清先生称“诗言志”为中国诗歌的“开山的纲领”,“诗言志”在很多古代典籍中都有记载,“诗以言志”(《左传》)、“诗以道志”(《庄子》)、“诗言是,其志也”(《荀子》)、“诗言志,歌永言,声依永,律和声(《尚书律、“诗言其志也(《礼记律……可见,在先秦前后,“诗言志”已成为诗歌共识如何理解“志”?许慎《说文解字》曰“志,意也从心,之声”,志可以理解为意愿、意向、意义、思想等意思,总之,属于精神性范畴也有把情志即情感和思想统一起来理解的,孔颖达称“在己为情,情动为志,情志一也”,但我以为,相对而言,情是个人性的,志就包含他者及社会的视角情是个人发动,志就有指向,有针对性,需要对象,需要协调,需要方向,还需要接纳“志”更具公共性因素所以,我觉得“诗言志”,可以理解为表达情怀、理想和志向,倡导某种价值,弘扬某种精神诗是文字的最高形式,不能等同于一般的情感抒发情绪宣泄,诗应该有更高的使命,那就是“诗言志”诗歌的起源,可以这么来理解诗缘情是诗之基础,诗言志是诗之超越,或者说诗之要求,诗之标准「道始于情”“道生于情”,精神的源头其实是情感情感经过疏导,就可能上升为“道或者理”,并可能最终转化为精神因此,唯有“诗言志”,诗歌才能成为精神的传道者和弘扬者人诗互证屈原是历史上第一个署名的诗人,《诗经》更多是集体创作,只有到了屈原,因为其强大的人格主体和艺术风格的辨识度,才成为署名诗人为什么?这是因为抒情建立于主体基础上抒情要求主体性,所以才有屈原形象的显现AI本质上是一种技术主义,有着集体智慧,但没有个人主体性DeepSeek是最好的复印机和资料整理员,但它没办法开创、无法亲历,创造性不够曾经有人问我为什么小说家、散文家称之为“家而诗人称之为“人”?我是这样理解的,诗歌是最突出作者主体性的文学体裁,诗如其人,人如其诗人诗互证,人诗对应,人诗合一,既是古老的诗人之为人的意义,也是未来诗人得以自立自证的标准和尺度因为,诗永远是人之精神印迹和生命证据诗,一直最具个人性和独特性,也证明人之个体性和独特性高的要求,需要有更高能级的产业链创新链才能匹配支持,否则就会极大地约束优质创业项目的成功率DeepSeek等优秀科创企业的成功,往往需要调动整合利用优质的产业和技术资源,与中国本土乃至全球产业链创新链的有力支持紧密相关,如发达的数字基础设施、优质的软硬件研制等在一些产业层次较低、科创资源较为薄弱的地区,前沿的科创项目难以得到本地化配套支持,因而陷入“孤岛”式创业,加剧了创业的难度和失败率在美西方一些国家实施“脱钩断链”的背景下,国家和地方在培育发展科创活动中更需重视本国和本区域产业链创新链的转型升级一是识别出产业链创新链中的断点堵点,通过内培外引等方式加快“强链”“补链”“拓链“,不断完善链条环节和提升链条水平;二是引导和支持链条各主体强化专业化分工协作,尤其是推动大中小企业融通创新发展,形成共创共促共享的发展格局;三是积极推动先进技术的场景开放和创新,让前沿技术有更多的试错迭代和推动应用的机会,助力技术和市场更有效地互促发展建设更具包容性的创新创业生态系统创新创业生态系统是科技创业活动持续涌现的氛围和土壤当下很多人在关注DeepSeek、宇树科技、游戏科学等,被称作杭州“六小龙”的新兴科技企业为何会出现在杭州其中一大原因在于杭州拥有包容性较强的创新创业生态系统OpenAI的两位人工智能科学家在《为什么伟大不能被计划》一书中考察了科技发展史,认为对未知的机会秉持开放和灵活的态度、多些包容能够收获更多“意外”的伟大发现,但这并不意味着创业者可以“躺平”,而是要保持持续的“好奇”和不懈的探索在追赶阶段,创业者有既定的学习追赶榜样,可以参照既有路线有计划地前行但在引领阶段,创业者站在科技和商业的“无人区”前沿,创业活动更富未知性和探索性,反复迭代和失败再失败往往成为常态,此时需要浸润在包容性强的创新创业生态中才能接续探索可从以下几方面建设更具包容性的创新创业生态系统一是营造宽容失败的文化,认识到失败也是一种宝贵的财富,为创业失败者提供更多的精神和物质支持,鼓励连续创业,持续激活创业活力;二是减少对创业活动的“过度”关爱,在坚守法律和道德等原则基础上,允许创业者在“无人区自由探索,为创业者针对性地提供赋能型创业服务;三是形成创新创业生态合力,打造出创业者、在位企业、政府部门、科研院校、中介服务机构等多主体合力发展科技事业的共同使命,让科技创业者从“孤军奋战”走向“抱团取暖”培育更多具有科学家精神特质的企业家,是中国持续涌现出世界影响力的科技领军企业的基础力量打造高能级的产业链创新链,可以为广大科技创业者在创新突破、降本增效等活动中提供坚实的保障包容性强的创新创业生态,则犹如我们每日呼吸的新鲜空气,润物细无声,成为科技创业者最喜好的阳光雨露从看人工智能自主创新的战略价DeepSeek值随着全球科技竞争的加剧,人工智能已成为国家竞争力的重要标志无论是国家还是行业、个人,都在积极探索如何利用人工智能赋能发展、推动产业升级和产品创新,以及个人职业发展今年年初,DeepSeek推出的DeepSeek-Rl大语言模型,在有限资源投入下达到了国际领先水平,标志着中国AI技术自主创新的重大突破这不仅推动了业界对大模型研发模式的重新思考,也引发了国际市场对中国AI产业发展前景的高度关注事实上,DeepSeek-Rl的出现只是中国AI自主创新的一个缩影,在追求高水平科技自立自强已成为国家战略共识的背景下,如何围绕人工智能构建自主可控、开放协同的发展格局,才是更为关键的命题DeepSeek-Rl最引人注目之处在于其对模型训练方式的优化,不同于常见的依赖大规模算力和高投入的方式,该模型强调算法与算力的协同设计,在蒸镭算法、数据筛选和算力调度上进行了多项改进,并取得了与部分国际先进大模型相近的应用效果这种“以巧取胜”的策略为正在探索大模型商业化和场景落地的市场提供了新的思路即便在不占有绝对资源优势的条件下,通过底层技术和研发思路的不断创新,同样能够跻身国际前沿此外,DeepSeek在一定范围内开放和共享相关研究成果,表明国内AI产业对开源协作的重视度不断提升,若企业在关键技术上具备更多自主权,又能积极融入开源社区、联合产业链伙伴打造应用生态,那么无论是在模型进化还是在产业应用层面,都可能形成稳健的迭代机制对于中国AI的整体发展而言,通过多元合作和数据要素的高效流动,加快技术成熟与行业落地,既能够降低研发成本,也有助于推动各行各业尽快享受智能化带来的效益近年来,国内对人工智能领域的投入不断增加,一些科研机构和企业在语音识别、计算机视觉、自然语言处理等领域取得了显著成果国家出台的《新一代人工智能发展规划》及各类产业扶持政策,促进了核心技术突破和跨界应用,营造了多元主体共同探索、区域协同发展的良好环境随着新一轮科技革命和产业变革的加速,人工智能已成为推动数字经济和制造业升级、智慧城市建设以及社会治理创新的重要动力,展现出广泛的应用前景我国庞大的市场规模和多样化的应用场景,为AI研发和产业化提供了得天独厚的优势,包括海量数据、丰富的行业需求和完善的供应链基础等,这些要素共同为企业技术迭代和商业模式验证创造了良好条件在看到机遇的同时,必须承认我们在一些关键核心技术领域仍存在一定短板当前,全球AI产业链呈现高度分工格局,高端芯片及其制程、基础软件平台等领域在国际范围内的竞争日益激烈,一些国家还对我国科技企业采取了程度不等的限制措施在这种背景下,能否掌握更多具有自主知识产权的核心技术,直接影响着我国在未来产业生态中的地位和韧性更进一步说,人工智能正在引发的数据权益、伦理规范、国际竞争规则的深层变革,同样离不开自主创新与开放协作并重的发展理念只有在底层技术拥有一定主导权的同时,持续提升对外合作水平,才能既保障自身发展安全,也能为全球科技共同进步贡献更多中国方案因此,我们需要从更宏观的角度深入思考并实践加速人工智能自主创新的路径,为我国的人工智能领域持续注入发展动能首先,进一步鼓励面向核心技术的联合攻关我国幅员辽阔,区域发展层次丰富,高校、科研院所和产业界对人工智能具有多元需求和科研动能通过完善产学研结合机制,让更多团队专注在大模型、智能芯片、操作系统等基础层面开展长期研究国家可以借助重大专项、重点实验室、行业联盟等方式,持续为底层技术的冲关提供政策与资金支持其次,着力培养和吸引高水平人才人工智能的竞争归根结底是人才的竞争可以通过提高科研岗位吸引力、优化人才评价体系、加强国际学术交流等多种手段,为顶尖创新力量提供良好的学术环境和配套条件在此基础上,积极培育跨学科、跨行业的复合型队伍,满足AI产业在技术落地、产品设计、市场运营等各个环节的多层次需求再次,大力推进人工智能与实体经济的深度融合我国在工业制造、物流运输、医疗教育等领域都有巨大的智能化改造空间若能在这些典型场景中率先实现规模化应用,不仅能快速验证技术成果,也能推动企业降本增效,提高行业整体数字化水平这种“以用促研的路径已在多个细分领域展现出积极成效,值得在更大范围内推广实践最后,在坚持自主可控的前提下,不断拓展国际合作与规则对话人工智能是一门全球性、开放性的科学,没有任何国家或企业能够单打独斗从开源社区共建到跨国企业合作、从国际标准讨论到多边治理协商,都需要我国在掌握核心技术的同时积极参与,为自身争取更大的话语权和发展机遇尤其在数据安全、算法伦理和知识产权等关键问题上,亟须形成一套既具国际特点又兼顾本土实际的规范体系总之,人工智能的发展已步入新阶段,技术迭代加速,商业应用和社会影响迅速扩展我国在政策和产业层面的长期布局,为AI自主创新奠定了坚实基础DeepSeek-Rl的成功展示了国内企业在前沿领域的突破潜力,坚定了我们推进高水平科技自立自强的信心未来,通过聚焦关键技术攻关、完善人才体系、推动行业应用落地以及积极参与国际合作,我国完全能够在新一轮科技革命和产业变革中赢得更大主动权,为构建开放、包容、互利共赢的全球创新生态贡献更多力量。
个人认证
优秀文档
获得点赞 0