国际在线消息:4月7日,由中国软件行业协会主办的2021中国软件产业年会在北京举行,大会以"数字经济新时代——软件产业赋能高质量发展"为主题,瞄准产业变革和时代发展趋势,涤荡思想与共识,汇聚知识与力量,展示中国软件产业新成果。
同时,2021中国软件产业年会发布会活动也在分会场如期举行,目的是搭建软件行业的高端交流合作平台,展示我国软件领域最新科技成果,阐释软件赋能产业的新变革、新业态。本次发布会将会有新华网、贝壳找房、拓尔思、中软协、教培委等单位,联袂首发各自领域的最新研究报告和创新成果。
发布会现场,拓尔思信息技术股份有限公司副总裁王丁发布了新产品——“智拓拓尔思人工智能平台”。
以下为实录全文:
王丁:各位领导、各位来宾、各位媒体的朋友大家上午好!
很荣幸能够代表拓尔思做本次产品的发布,我们这个产品是叫做“智拓拓尔思人工智能平台”。在发布产品之前我先对拓尔思做一个简单的介绍,让各位朋友对我们有个总体的认识。
业内对我们的认可第一个标签是大数据,我们是一家大数据企业,实际上我们这几年一直在追求对内容的研究,我们愿景是成为一家语义智能的领军企业。从我们的拓尔思的发展历史上来看,实际上我们是93年成立的,可以说是一个标准的国产软件的老兵,我们可以看到拓尔思整个发展也是经历了四个阶段。从最开始被业内熟知是做智能检索,到后来做内容管理,然后到做大数据,到做人工智能,我们所有的技术的研究可以看到都有一条主线,就是围绕着内容去展开,围绕着知识去展开。在这样的拓尔思的基因体系下,我们也是顺理成章或者是非常顺畅的阶段,推出了我们新的人工智能产品平台。
我们这个人工智能产品平台是在去年推出,实际上推出之后,很多用户对我们这个产品评价非常高,为什么?因为我们在这里面是非常重视一个点,非常重要的一个点,我们谈到我们要和行业去进行整合,去结合。我们不是去做纯粹的AI技术平,因为我们知道AI技术平台实际上有很多大厂在做,拓尔思要找差异化的竞争,找到我们的赛道,所以我们要做的是行业的应用和行业的赋能。
我们在做人工智能相关技术研究时候可以看到,我们2000年左右的时候,可能大家还没有提AI、没有提人工智能时候,拓尔思就一直在进行人工智能文本分析和文本挖掘相关的研究,我们也获得了很多的荣誉,包括国家的、政府的。
可以看一下我们智拓平台的总体架构。从产品角度上来看,我觉得我们是有几个特点,首先我们是一个全的链条或者一个全的生态,包括从我们的数据资源、AI开发、算法模型等等,我们对整个AI平台的运行前的必备条件是一定要具备的,但是这个可能并不是这个产品对外推出或者对外宣传的重点。我们对外宣传、对外推出包括给用户提供的核心价值还在于我们技术能力以及技术能力和行业的整合。我们也总结一下整个平台的几大优势,首先整个体系的完备、算法的丰富,还有我们特别强调一点场景的落地,因为AI如果我们找不到场景、找不到行业可能就是一堆算法、一堆技术工具、一堆代码。只有AI和场景结合之后才能把它的真正的作用发挥出来。发挥出来之后,这些作用我们需要什么?我们可能是需要的是这些数据的驱动,我们需要知识的驱动。
拓尔思整个产品定位还是面向B端和G端,所以整个部署时候会强调私有化的部署。另外我们整个现在拓尔思所有的产品研发从我们设计之初就会把国产化包括信创作为我们的技术指标。
后面我们会围绕平的能力,包括开发能力、技术能力、行业能力去展开,给各位嘉宾做一个简单的介绍。
开发能力方面,我们要把这个平台给到用户之后,要把平台的主动权给到用户。主动权给到用户的核心是他可以和自己的实际、业务和场景结合,构建自己的模型,做自己的知识的标注。刚才初总讲的时候也提到了一点,现在的AI如果只是有数据标注工程师是不够的,更多需要的是知识工程师,开发这个能力更多的是面向知识工程师。以前的标准更多是视频和图像的标注,但是实际上AI真正难的是对文本的标注,需要我们大量的团队在里面。行业知识工程师需要一个技术平台,整个知识图谱就会给他提供人机交互的智能平台。标注过程中我们也会为我们的工程师、用户提供大量的数据,这个是拓尔思本身积累的数据,这些数据都是非常专业化的,包括在前期已经经过拓尔思一系列的知识化的处理,他拿到之后能够快速的上手,这里面是我们整个工作的界面包括流程的控制。
第三,说一下整个平台的技术能力。
技术能力大家都可以想到,我们平台从是几个方面展开,一个是自然语言处理,一个是图像,一个是音频,一个是视频,这可能是现在所有在做AI平台大家都会涉及的几块。但是我们这里面也会有个侧重,拓尔思最擅长或者我们现在最希望去突破的是在资源语言处理方面的能力。我们主要是围绕着对内容的分析和处理,包括从知识加工还有我们的发现,我们会不断的突破我们的算法,包括我们的算法和行业的结合,另外我们会进一步突破,我们了解到了知识,怎么样生成知识,包括我们已经在做的一些研究,比如文本的自动生成,还有我们整个语言的自动生成、自动问答等等这样的应用场景。
文字识别从以前的OCR,但是现在OCR仅仅是文字的识别、抠图或者抠文字,AI领域的识别更多要把识别和场景结合。一是要识别出来文字是什么,同时应该要识别出来这个文字是在哪里,所以我们应该是把这个文字和场景都结合。在不同地区和不同内容上我们所写出来的文字表达出来的意思是不一样的。
在内容鉴别方面也是我们现在在重点突破,包括有大量应用的一个场景。我们的内容鉴别主要围绕文字、图像和视频展开,包括我们对图像的识别,还有对视频里面的一些敏感内容,包括关键帧的识别,这也是我们做一些基础研究的方面。
整个拓尔思AI技术平台也是不断的积累我们的能力,我们很多技术能力可能来源于实战和我们具体应用场景中,比如像图像识别,最早的技术平台不具备这项能力,我们也多是年来服务于国家专利局,他有大量的专利图片和专利的申请比对,这种比对实际上就是图像比对的技术要求。所以我们做了将近十年左右的积累,会把我们来源于实战的算法和能力转化为产品的积累。我们也在不断的去拓展我们的一些产品的应用场景。
可以看到整个拓尔思在AI领域是有很多自己的特色和方向的。比如我们知道很多大厂做图像的检索和识别,他更多的是用于我们常见的方向和领域。拓尔思可能更多是专业的领域,比如我们在专利方面、军工方面等等,我们可能更多的服务的是另外一个群体,B端和G端的群体。这是我们视频分析方面的一些能力。
最后也是我们一直强调的,就是AI的行业技术能力和技术场景。我们一直认为如果我们有个成熟的AI平台,是有技术生命力的,但是缺少技术竞争力,需要我们技术和场景结合。现在拓尔思也是拓展了很多行业的场景,我们把拓尔思擅长的场景把AI整合进来。第一是我们和媒体的融合,因为拓尔思有很大一块业务是做媒体融合,我们在媒体方面是通过我们的AI技术去帮助媒体在策划、传播、生产、审核、分发方面提供一系列智能化处理工具,我们核心是给媒体人进行赋能。第二个场景是金融科技,拓尔思在金融科技领域主要做两块,一块是面向于G端,是帮助政府去打击非法集资、打击经济犯罪,从海量数据中刻画出来嫌疑平台和嫌疑人的协同场景。同时还会给B端提供服务,主要是面向银行和金融机构,他在进行贷款审核时候,我们利用我们的AI技术,包括我们的语义分析技术提供一系列辅助的支撑。第三个主要应用场景就是在公安的一些场景,我们最核心的应用就是怎么样去帮助公安把他的卷宗和整个案卷做一个智能化分析。
因为时间有限,我们整个的产品的发布就到此告一段落,非常感谢大家,也希望进一步能够对我们拓尔思包括我们的产品能够做进一步的了解。
(声明:所有会议实录均为现场速记整理,未经演讲者审阅,国际在线登载此文出于传递更多信息之目的,并不意味着赞同其观点或证实其描述。)
1、“国际在线”由中国国际广播电台主办。经中国国际广播电台授权,国广国际在线网络(北京)有限公司独家负责“国际在线”网站的市场经营。
2、凡本网注明“来源:国际在线”的所有信息内容,未经书面授权,任何单位及个人不得转载、摘编、复制或利用其他方式使用。
3、“国际在线”自有版权信息(包括但不限于“国际在线专稿”、“国际在线消息”、“国际在线XX消息”“国际在线报道”“国际在线XX报道”等信息内容,但明确标注为第三方版权的内容除外)均由国广国际在线网络(北京)有限公司统一管理和销售。
已取得国广国际在线网络(北京)有限公司使用授权的被授权人,应严格在授权范围内使用,不得超范围使用,使用时应注明“来源:国际在线”。违反上述声明者,本网将追究其相关法律责任。
任何未与国广国际在线网络(北京)有限公司签订相关协议或未取得授权书的公司、媒体、网站和个人均无权销售、使用“国际在线”网站的自有版权信息产品。否则,国广国际在线网络(北京)有限公司将采取法律手段维护合法权益,因此产生的损失及为此所花费的全部费用(包括但不限于律师费、诉讼费、差旅费、公证费等)全部由侵权方承担。
4、凡本网注明“来源:XXX(非国际在线)”的作品,均转载自其它媒体,转载目的在于传递更多信息,丰富网络文化,此类稿件并不代表本网赞同其观点和对其真实性负责。
5、如因作品内容、版权和其他问题需要与本网联系的,请在该事由发生之日起30日内进行。