百度NLP十年的初心与坚守:从理解语言到改变世界的可能
自然语言处理(NLP)是人工智能皇冠上的一颗明珠。 这样的说法在人工智能领域流传许久,现实中发生的却是这样一幕:计算机视觉、语音识别等领域纷纷跑出了多个独角兽,冲刺IPO的消息也时常出现。可作为“皇冠上的明珠”的NLP领域,却难见独角兽的影子,大多数创业者还停留在A轮或B轮融资。 NLP如何走出困局? 在NLP领域深耕十年,被称作“中国NLP灯塔”的百度给出了切实的答案。8月25日举行的百度大脑语言与知识技术峰会上,伴随着一系列语言与知识产品的发布与升级,百度NLP的全景布局和钻研了十几年的核心技术一一亮相。 01 翻越认知智能的高山 把时间调回一个多月前的ACL 2020。 作为NLP领域最负盛名的国际顶会,ACL 2020收到了3429 篇论文投稿,其中被接收的779篇论文中有185 篇来自中国大陆,占比仅次于美国。距离2010年首次有中国科技企业的论文入选ACL,仅仅过去了10年时间。 除了论文数量的逐年增长,中国NLP学者的面孔也陆续在ACL上出现。 2013年,百度CTO王海峰成为ACL历史上首位华人主席;2014 年,同样来自百度的吴华出任 ACL 程序委员会主席;2015年,哈工大教育部语言语音重点实验室主任李生教授获得 ACL 终身成就奖;2016 年,百度的赵世奇当选 ACL 秘书长;2018年,ACL 宣布创建亚太区域分会,王海峰担任创始主席;2020 年,百度组织了 ACL 大会上首场同声传译研讨会…… 以百度为代表的中国力量在NLP的世界舞台上不断出彩,本身就是一种话语权的象征,而左右话语权的核心因素正是学术成就。 仅以百度为例,过去十年是百度NLP高速增长的十年,在NLP领域摘得了包括国家科技进步奖在内的20多个奖项,在30多项国际竞赛中夺得冠军,累计发表的学术论文超过300篇,专利申请高达2000多项。 其中最具代表性的无疑就是百度的语义理解技术与平台文心(ERNIE)。 2019年12月,基于ERNIE 2.0改进的模型在权威榜单GLUE上首次突破90大关,超越人类基线3个点,获得全球第一;3个月后的人工智能顶级会议AAAI 2020上,NLP预训练领域入选论文《ERNIE 2.0: A Continual Pre-Training Framework for Language Understanding》被选为Oral展示;2020年的世界人工智能大会上,ERNIE有了中文名字“文心”,并一举斩获最高奖项SAIL奖(Super AI Leader,卓越人工智能引领者)。 学术上的一系列成就,意味着百度已经站在了NLP研究的最前沿,成为中国NLP领域的领军者,并与谷歌、微软一道被视为“全球AI三巨头”。 可对于百度来说,技术的价值绝不只是在象牙塔中“高光”,在NLP的学术领域走进殿堂的同时,也在循序推进应用场景中的落地。 刚刚结束的百度大脑语言与知识技术峰会上,第一个重磅产品就是在NLP核心技术基础上延展开发的文心ERNIE——语义理解技术与平台,针对传统NLP定制常见的成本高、耗时长、可迭代性差等短板,文心集成了优秀的预训练模型、全面的NLP算法集、端到端开发套件和平台化服务,提供了一站式NLP开发与服务。 这或许就是百度给出的答案,想要推动NLP的产业应用,仅仅在学术上站在山巅还不够,需要的是帮助整个行业翻越认知智能的高山,以低门槛、低成本、高效率的平台优势加速NLP的落地。 正如百度CTO王海峰所言,百度“致力于更好的与学术界、产业界携手,推动语言与知识技术发展,进而推动人工智能技术持续进步,为产业持续升级、社会经济高质量发展贡献力量。” 02 走进行业应用的深处 以往在谈及NLP的应用门槛时,最常见的回答有两个:一是技术相对落后的硬伤,二是缺乏相对独立的场景。 对于第一个问题,经过大量真实应用场景淬炼的文心ERNIE已经给出了解决方案,全面降低了NLP的定制开发成本。 (百度集团副总裁吴甜) 引用百度集团副总裁吴甜分享的一组数据:在数据标注方面,文心的语义理解能力可以降低90%的数据标注量;在算力方面,文心集成了ERNIE预训练模型,可以节省90%的算力;在开发时长方面,传统的开发方式需要一周的工作量,开发者在文心上仅需配置或编写少量代码,可以减少85%模型开发时长,进而全面降低NLP定制开发的成本。 对于第二个问题,针对NLP落地应用时的高频场景,百度新发布或升级了一站式的场景化解决方案: 其一,面向企业文本场景的智能文档分析平台TextMind。 语义理解是NLP的基础,也是应用场景最广泛的服务。比如大多数企业的商业合同仍采用人工审核的方式,存在效率低下、漏查漏报等商业风险,TextMind基于OCR、NLP等技术,可以对20类文档进行智能比对、解析、审核,与知识图谱能力结合后能够自动分析合同中隐含的法律风险。 其二,面向媒体行业进行场景升级的智能创作平台。 百度智能创作平台上线至今,已经自动创作了200多万篇文章、超过15万条短视频、辅助创作的日均调用量超过35万,累计落地20多家机构媒体。同时围绕策、采、编、审的媒体工作场景,百度推出智能策划、智能采编、智能审校三大场景方案,帮助媒体降低创作成本,提升创作效率。 其三,面向交互场景升级的智能对话定制与服务平台UNIT。 UNIT上线以来已经服务了超过2.7万开发者,支撑了超过10万个智能对话应用,积累的知识条目总量达到2.4亿,与用户进行了超过4200亿次交互。全新升级后的UNIT进一步降低了任务式对话、智能问答的定制成本,其中数据标注成本降低了30%以上,并且融合了新一代对话引擎以提升交互体验。 其四,面向翻译场景全新发布的AI同传会议解决方案。 AI同传并不是什么陌生的概念,百度在2017年就推出了同传系统,衍生出了桌面助手、翻译APP等产品。AI同传会议解决方案主打的亮点是全场景、全流程,只需要一台电脑和一部手机,就能迅速搭建出一套同传服务,不仅可以随时对专业术语进行干预,还能自动生成会议记录。 值得一提的是,百度瞄准的四个场景分别对应了NLP领域的理解、生成、对话、翻译,这样的设计绝非无意之举。 过去十年的时间里,百度语言与知识技术培养吸引了大量的全球顶尖人才,推出了以王海峰为代表的百度NLP“十年十人”。这些顶尖大牛们的技术信仰和探索精神,既向外界展示了百度的技术硬实力,也让外界看到了百度加速NLP走向行业深处的拳拳之心。 03 产业智能的百度方案 至于百度这般赋能NLP行业的原因,可以借鉴百度CTO王海峰的观点:“在百度语言与知识技术的布局和发展中,我们始终在注意把握两个趋势,即技术发展趋势和产业发展趋势,并力争引领趋势。” 对于技术趋势的理解,可以借用这样一个比方:感知智能是AI感知外部环境的能力,包括听觉、视觉和触觉,相当于人类的耳朵、眼睛和手;认知智能是AI理解、联想、推理的能力,需要AI像人一样思考并解决问题。 (编辑:焦作站长网) 【声明】本站内容均来自网络,其相关言论仅代表作者个人观点,不代表本站立场。若无意侵犯到您的权利,请及时与联系站长删除相关内容! |