环球创业频道导航栏_fororder_WechatIMG203

    滚动   |   环球快讯   |   环球专访   |   政策解读   |   会员页面   

崔宝秋:开源是AI的未来

2020-01-08 15:52:39  来源:中央广电总台国际在线  责编:王涛

  国际在线消息:1月8日,中国软件产业最具影响力盛会——“2020中国软件产业年会”在北京国家会议中心举行。本次年会将探讨在当前智能化引领、数字化转型背景下如何充分发挥软件驱动下的数字变革,推动经济发展的质量变革、效率变革和动力变革,以及工程教育计算机类专业认证发展趋势等重大问题;探索软件的进步和发展如何提升云计算、大数据、人工智能、区块链等新技术、新模式、新业态演进,以及如何为经济发展不断注入新动能等众多焦点问题。

  大会现场,小米集团副总裁、集团技术委员会主席崔宝秋发表“小米在开源战略与实践”主题演讲。

  以下为现场实录全文:

  尊敬的各位领导、各位嘉宾,各位软件行业的同行们大家下午好!我是崔宝秋,来自小米。今天我非常荣幸受邀参加软件行业的盛会,也非常激动。我今天想分享一个什么呢?关于小米在开源的一些战略与实践。

  开源这个话题近一两年来由于AI的兴起被政府、行业、教育界、企业界都在拼。小米在过去七八年来我们在拥抱开源,做出自己的打法和成绩,我们做了很多事情,哪些可以大家借鉴的,这个就是今天分享的题目。

  讲小米在开源做了哪些事情,为什么这么做,就不得不介绍一下什么是开源。开源过去几十年大概的发展路径是什么,为什么小米今天要拥抱开源,为什么制定小米这样的开源战略。首先我个人是一个开源软件的爱好者,开源软件的信仰者到今天开源运动的倡导者,开源我认为是未来软件的未来。

  开源是一个理念,开源是一个运动,讲到开源我们不得不提一下自由软件。开源软件的概念是1998年有的,在这之前更多提的是自由软件。这里是我前几年总结的自由软件和开源软件的区别。开源软件我认为在一定程度上帮助了自由软件迅速的扩展,迅速的被企业所接受,一定程度上助长了自由软件的快速成熟,但是自由软件早期的理想主义纯粹的打法制定了今天开源软件背后的一些价值观,一些逻辑,开放与共享或者一些自由,给软件使用者一定的自由。

  这个是过去很多年来,有20多年开源的一些主要的里程碑事件。从1983年GNU这个系统的诞生,自由软件版本的Unix的系统。到1985年自由软件基金会的成立,这是我1995年以后最大的一个基金会。1991年Linux,自由软件操作系统内核操作系统的诞生,到1998年Open Source,未来企业创造一个奇迹的概念。

  随着云计算和大数据的兴起,这些背后来自于互联网,来自于搜索引擎,来自于谷歌、雅虎这样的公司。过去十几年自由软件和开源软件在云计算和大数据时代扮演非常重要的角色。今天在AI时代很多开源软件都来自于这两个时代,自由软件发展非常迅猛,软件在云计算和大数据时代,波动了行业的效应。比如说Hadoop。

  到AI时代,我开始还有点担心,AI时代大家会不会继续拥抱开源,AI时代的开源软件是不是有一些障碍,但是很快我这个顾虑就打消了。今天可以看到国内外很多AI巨头都在纷纷拥抱开源。这个里面几个国内外的谷歌、微软、亚马逊、Facebook、百度。这几个是AI时代的几个巨头,举一些小的例子,系统框架到模型数据,AI时代开源愈演愈烈,包括我们政府,中国各行各业都在关注AI时代的开源。

  这个熟悉AI的人不陌生,在AI领域开源,我们最早在Torch2002年,到TensorFlow,后面就是Paddle Paddle还有Caffe,这些都代表了AI软件做的一些事情。

  2019年初小米制定了手机+AIoT双引擎的战略,我坚信在AIoT时代我们更应该离不开开源,云计算、大数据到AI,今天的AIoT,我们要打造小米分布式连接、云、边缘计算到端云计算整体的分布式的计算环境、分布式的能力系统,这个里面也离不开开源。深度学习到大数据、云计算,这个里面开源软件仍然是无处不在。我们今天更加离不开开源。

  所以今天大家都是软件行业的从业人员,这句话我相信大家都认同,“开源力量、势不可挡”。

  企业角度,过去我是开源的爱好者,今天我是代表企业,关于企业不管是初创公司,还是巨头公司,为什么要拥抱开源,我列了几句话大家也不陌生。第一个就是要站在巨人的肩膀上。实际上今天在企业里重复建设是屡禁不止的。开源软件第一个就是让大家站在巨人肩膀上创新,而不是从零开始。

  还有开源软件已经非常成熟,云计算、大数据到AI。拥抱开源软件可以有助于企业打造良好工程文化,推动一个喜欢技术的氛围。同时开源软件因为它的质量,优秀的开源项目,快完成的系统价格、设置、算法都是非常美妙。经过整个社区多人产业,它的代码是有一定领先性的,所以拥抱开源可以帮助企业提升代码质量。拥抱开源另外一个非常好的好处对这个企业带来很多人才。因为很多开源软件都是行业内的,那么就是开源,世界上有很多这样的人才供企业来挑选。

  开源软件实际上有自由软件内在的精神就是开放与共享,这两个词也是我们今天的一个价值观。实际我认为在过去上世纪90年代到2000年初,到今天,我们中国的软件行业对开源,在开源上我认为走过一条比较崎岖的路。早期人们不太熟悉开源,不太了解自由软件精神,初期的打法欠缺到今天人们对技术软件已经非常了解的情况下,不同的公司还在犯不同的错误,很多常见的错误。这个里面简单总结一下,也是表明小米我们为什么建立自己的开源战略,就是解决开源中各个企业,这里面有一些错误,第一个就是支出,只想拿来而不想回报,不想分享,只愿意站在巨人肩膀上享受短期的回报,这是一个最简单的错误。

  第二个是知识共享,但是没有把共享做到极致,缺乏共享,或者不知道共享,不愿意共享,有的人懂得共享,但是共享的渠道不知道怎么共享,但是社区不接受。还有一个就是不够开放,咱们国内很多企业是为了开源而开源,没有真正把开源项目持续维护,和社区一起打造。

  所以在我加入小米的时候就告诉大家拥抱开源是应该的,是对的,我们不仅仅要站在巨人肩膀上,同时要给巨人指方向。

  围绕这个原则我当时制定了小米的开源战略,基本上有五大原则:第一要快。快速的掌握,这就是小米也总提的专注、极致、口碑、快这七个字也是不谋而合;第二个坚决不重造轮子,开源在我们做之前,开源建设有没有比较成熟的软件满足我们的需求,坚决不要重造轮子,只是为了刷自己的存在感而重造轮子是坚决不允许的;第三个原则就是不用则已,要用则精,很多人拿了开源软件小规模的试用,没有真正的掌握,一旦上线用户变大,考虑的时候,出了问题不会解决,因此就摒弃开源软件,说开源软件不好等等,这个就是常见的错误,没有真正的掌握,我们不求完全的理解,但是要能驾驭,要精;第四个就是坚持开放与共享,避免掉到上一个PPT讲的严重的错误。第五个是目前我在小米推的时候很多人不太懂,当时小米还小。小米为什么还要极力推动自己的Committer,在重大的关键性,小米自己要掌握而且要小米自己的主页。其实我是在想一定要按照小米指定的方向或者照顾到小米未来的方向,以便于小米这样的企业长期做着巨人的服务,为什么要推出巨人的服务?其实不是为了名,不是为了利,当然利就是为了尊重减少企业在软件研发和维护的成本,巨人照顾企业的,企业回报、企业回馈的时候一定把自己的改进优化、通用化,让企业在社区骨干中的距离越来越小,大大降低企业在软件研发上的成本。

  从2012年开始到最早期小米探讨这个概念,其实最早是2010年开始,但是后来大数据时代,这个简单记录了小米在开源上的关键大事,我们用开源,贡献把自己的项目回报给社区,云计算、大数据、AI我们都做了。

  接下来我分享四个比较典型的案例,也是小米的一个打法。第一个就是Apache HBase,三个项目管理委员会的人,最终这个国际的开放项目主席也是小米的工程师,这样真正到企业上为巨人去做贡献,赢得了话语权。小米在这个项目的贡献2018年占23%,2019年10月份占到了三分之一,所以这是一个案例。

  第二个案例是Pegasus是Java,因为当时这个是OCR,这些在许多关键的时候,它的性能是不可预测的,所以在很多对延迟、时延非常明显的用户环境我们不得不用这个系统,基于这两个,我们花了两年时间最后向外开源写了自己的Pegasus,这个是小米的一些玩法,这是我们最近发布的版本,这个也是得到科学院的一个一等奖。

  第三个案例在MACE,小米是一家手机公司,但是它更注重的是以手机硬件核心的移动互联网公司,小米很多设备,未来在AI+手机的超级互联网的基石,这么多电视、PC、手机、手环、手表很多智能设备、可穿戴都需要AI技术,当时我们要强化端上的AI优化,市面上没有我们这么需要的,用处这么大的,所以我们自己研发了小米自己的移动端深度学习框架,叫MACE,这个当时也花了很长时间自己研发的。2017年上线,2018年开源。今天已经是小米最火的一个内容运用的AI框架,很多也得到大家的普及认可。这是得到的一些奖励。这是第三个小米的开源案例。

  第四个案例,正是因为小米在开源上的深度拥抱,我们打法比较纯粹、比较理性的,也是非常科学的,我们也吸引到国际界比较有名的开源领域的一个牛人加盟小米,它是原来霍普金斯大学的教授Daniel Povey。这里他除了小米的生产信息外,小米在科研化,也是吸引小米的一个主要的工具。所以今天小米开发的开源技术对小米非常重要,小米一定要注重开源技术,首先我们要打造国际开源社区。

  四个案例代表小米在开源上的一些做法,不能代表小米的全部。

  面向未来我是非常乐观的,开源的未来是非常大的,很光明的,开源是有未来的,开源是AI的未来。在AI的时代要更加广义的开源,不仅要代码开源而且要数据开源。在今天的大数据,通过AI技术出来,数据的共享完全不一样了。其中知识图谱是一个特别特殊的数据,这些也需要大家共建。小米积极参与,包括OpenBase项目,共同参与打造全球最大的一个开放的。

  因为今天中美关系等等让开源科技开放,我也呼吁未来打造一个更加开放,极致的开放,没有国界,共享、平等、全球化的运动。开放共享需要平等,需要在行业的AI领域一些AI巨头慢慢形成一种寡头垄断的现象。代码式开源、项目式开源逐步开放,这个已经在使用一些国外项目的一个顾虑。

  开源更加不应该有国界,开放、共享、平等与全球化,一起让开源没有国界,一起让中国的开源走向世界。谢谢大家!

 (声明:所有会议实录均为现场速记整理,未经演讲者审阅,国际在线登载此文出于传递更多信息之目的,并不意味着赞同其观点或证实其描述。)

分享到:

国际在线版权与信息产品内容销售的声明:

1、“国际在线”由中国国际广播电台主办。经中国国际广播电台授权,国广国际在线网络(北京)有限公司独家负责“国际在线”网站的市场经营。

2、凡本网注明“来源:国际在线”的所有信息内容,未经书面授权,任何单位及个人不得转载、摘编、复制或利用其他方式使用。

3、“国际在线”自有版权信息(包括但不限于“国际在线专稿”、“国际在线消息”、“国际在线XX消息”“国际在线报道”“国际在线XX报道”等信息内容,但明确标注为第三方版权的内容除外)均由国广国际在线网络(北京)有限公司统一管理和销售。

已取得国广国际在线网络(北京)有限公司使用授权的被授权人,应严格在授权范围内使用,不得超范围使用,使用时应注明“来源:国际在线”。违反上述声明者,本网将追究其相关法律责任。

任何未与国广国际在线网络(北京)有限公司签订相关协议或未取得授权书的公司、媒体、网站和个人均无权销售、使用“国际在线”网站的自有版权信息产品。否则,国广国际在线网络(北京)有限公司将采取法律手段维护合法权益,因此产生的损失及为此所花费的全部费用(包括但不限于律师费、诉讼费、差旅费、公证费等)全部由侵权方承担。

4、凡本网注明“来源:XXX(非国际在线)”的作品,均转载自其它媒体,转载目的在于传递更多信息,丰富网络文化,此类稿件并不代表本网赞同其观点和对其真实性负责。

5、如因作品内容、版权和其他问题需要与本网联系的,请在该事由发生之日起30日内进行。