4月24日,由中国软件行业协会主办的第三届中国国际软件发展大会暨中国软件行业协会成立40周年纪念活动在北京召开。本次大会以“智能时代的软件产业”为主题,聚焦软件根技术、开源软件和生成式人工智能对全行业的根本性变革,探讨数据要素和未来产业对全行业的深远影响,并回顾中国软件产业40年发展历程,引领整个软件行业做一次深刻的总结,重装上阵再出发。大会设置开幕式、高峰论坛等环节,邀请两院院士、领军企业代表、相关行业机构代表、高校专家等到会。
北京航空航天大学软件学院院长胡春明致辞。以下是发言实录:
尊敬的各位领导大家好,非常感谢有这样的机会以软件研究者的视角谈谈最近的感受。在过去的一段时间内,人工智能、机器学习,特别是最近的大模型和软件产业、软件工程发生紧密地交织,从学术论文的视角看,几乎是井喷的趋势,而且这些工作已经渗透到软件开发、软件运营等环节。
大模型语言能力的涌现,体现了从量变到质变不是在于某一种能力的运用,而是在于一组能力的融合,特别是在语义理解、问答、数字的理解方面出现了非常高的能力提升。这个能力的提升,自然就带来了一种尝试——大模型能不能辅助到软件开发的全过程,比如说我们看到文献的分析过程、软件设计、软件开发、软件质量确保、软件维护与管理等方面都看到很多已有的工作在发挥作用。
总体来看,我们认为大模型似乎有了一种能力来整合软件的开发、运维,提升软件的开发效率和质量。如果这些能力进一步往前优化,而且这个事情一定会发生,我们在考虑大量的low-level底层的编码任务可以通过可信赖、自动化的基于模型的处理来完成的时候,我们的软件开发过程会带来怎样的变化?很多年以前编译工具帮助我们把思考问题提升到高级语言的层次,不考虑汇编语言的底层细节,如果有这样的智能辅助工具,在行级、段级和函数级的代码编程上能够提供支撑,我们的软件建模理解是不是可以比现在的高级语言再上一个层次?
今天已经看到的是,代码的大模型在辅助生成代码任务上已经见到很好的效果,特别在一些细分领域,刚才百度的王海峰老师也提到,现在百度做的Comate推介代码生成率已经达到45%,意味着使用这样的工具对软件产业的开发效率带来了事实上的提升。
我们还能够看到的,包括学术论文里面看到的特点,大模型正在作为“平庸”的专家在发挥作用,这里面的“平庸”并不是贬义,大模型虽然现在取代不了行业精英,取代不了深入的思考,大模型目前基本的理解能力已经能够在特定任务流的关键环节发挥一般专家能够发挥的作用,这样的现实需要被很好地整合到软件开发过程当中,因为反应开发很多环节是人力密集型的开发工作,基于规则理解的人力密集型开发活动,有可能在未来一段时间能够得到某种形式的替代。
我们也看到另外的例子,比如在安全软件的形式化验证方面,我们做形式化验证必须抽取些性质,以前都是专家的工作,有很多研究者试着用传统小模型的方式解决,有一定效果,但是我们看到现在通过LLM+有限的Prompt能够从自然语言抽取安全攸关性质的理念,可以看到大模型能够从一些领域发挥有限的专家作用。
还有一个可以看到的变化,刚才在企业很多尝试里面已经看到,Agent-oriented能够解决一定的问题,很多复杂的任务,比如在代码级编程再往上走,很多复杂的任务上有可能基于多Agent的相互协作和沟通,去完成和物理环境的交互,和信息的交互,进一步完成高层软件任务的开发。在这里面,工业界也有些尝试,像微软开源的AutoGen,尽管我们做了尝试,想更灵活地使用还有挑战,但总体上我们已经能看到这种方法在软件开发过程中能够发挥的作用。
尽管当前LLM大语言模型存在局限性,比如大家会challenge生成代码的安全性。软件设计和形式验证等抽象任务中的表现今天还做得不够,正好也是下一步继续发展大模型在软件、软件工具上地切入点。
总体上有这么几种新的考虑,既然模型要在软件的运行、软件的开发、软件的工具环境里面扮演这么重要的角色,未来的软件会是怎样的形态?以前有种提法叫软件1.0、2.0、3.0,3.0,它不是简单的捏合,而是某种程度更深入的结合。刚才百度海峰总的报告提到系统1、系统2的提法,某种程度上基于大模型构造Agent就是系统1和系统2耦合的尝试,这种场合也许有其他的模式,正好是学术界应该更多探索和尝试的。
作为软件人机协作智能交互的新范式,以前通过群智化的方法已经有很多探索,结合我们讲的模型到片段级的生成,在此基础上向上走,我们相信在人机协作、多Agent协作上应该有更大的空间。再延伸一步,我们以前讲的在安全攸关,成为更加广泛地基于大模型的开发新范式。在这里面我们看到些例子,比如在PLC安全代码生成,可以用大模型做中间的尝试,基于模型的设计诊断和恢复、形式化验证做些辅助的裁减,形成代码生成的方式。
复杂任务场景下的多Agent的协同,也有可能是未来我们做软件工具、软件开发方法上很重要的探索方向,多Agent的设计范式去构造应用软件,可以通过自然语言、软件模型、软件代码的混编实现动态的对话和功能的高速调用。这些今天都是从学术界的研究看到的趋势方向,其实有些方面已经在我们的软件企业、大的平台类企业做尝试,未来有很多的发展空间,学术界更应该和快速发展的软件产业一道,共同把新的方向探索好,把它转化成新质生产力,以上是我的汇报,谢谢大家。
(声明:所有会议实录均为现场速记整理,未经演讲者审阅,国际在线登载此文出于传递更多信息之目的,并不意味着赞同其观点或证实其描述。)
1、“国际在线”由中国国际广播电台主办。经中国国际广播电台授权,国广国际在线网络(北京)有限公司独家负责“国际在线”网站的市场经营。
2、凡本网注明“来源:国际在线”的所有信息内容,未经书面授权,任何单位及个人不得转载、摘编、复制或利用其他方式使用。
3、“国际在线”自有版权信息(包括但不限于“国际在线专稿”、“国际在线消息”、“国际在线XX消息”“国际在线报道”“国际在线XX报道”等信息内容,但明确标注为第三方版权的内容除外)均由国广国际在线网络(北京)有限公司统一管理和销售。
已取得国广国际在线网络(北京)有限公司使用授权的被授权人,应严格在授权范围内使用,不得超范围使用,使用时应注明“来源:国际在线”。违反上述声明者,本网将追究其相关法律责任。
任何未与国广国际在线网络(北京)有限公司签订相关协议或未取得授权书的公司、媒体、网站和个人均无权销售、使用“国际在线”网站的自有版权信息产品。否则,国广国际在线网络(北京)有限公司将采取法律手段维护合法权益,因此产生的损失及为此所花费的全部费用(包括但不限于律师费、诉讼费、差旅费、公证费等)全部由侵权方承担。
4、凡本网注明“来源:XXX(非国际在线)”的作品,均转载自其它媒体,转载目的在于传递更多信息,丰富网络文化,此类稿件并不代表本网赞同其观点和对其真实性负责。
5、如因作品内容、版权和其他问题需要与本网联系的,请在该事由发生之日起30日内进行。