中国AI能有今天的成就,正是由无数王海峰这样的科学家、工程师和企业家们几十年如一日的热忱与坚持所缔造。

王海峰,1971年出生,博士,百度首席技术官(CTO),兼任深度学习技术及应用国家工程实验室主任,中国电子学会、中国中文信息学会、中国人工智能产业发展联盟、新一代人工智能产业技术创新战略联盟等机构副理事长,还兼任中国联通、东软控股、开源中国等公司的董事或董事长。

他是自然语言处理领域世界上最具影响力的国际学术组织ACL(Association for Computational Linguistics)50多年历史上首位华人主席(President),ACL会士,ACL亚太分会AACL创始主席,IEEE工业顾问委员会(Industry Advisory Board)委员;获国家科技进步奖二等奖一项,中国电子学会科技进步一等奖五项,均排名第一;获第十三届光华工程科技奖;2017年获首届全国创新争先奖,是唯一来自互联网行业的获奖人;2018年获得首个吴文俊人工智能杰出贡献奖,并当选为人工智能学会会士;入选国家百千万人才工程,被授予“有突出贡献中青年专家”称号;享受国务院政府特殊津贴;已发表学术论文157篇,已授权或公开的专利申请300余项,获中国专利银奖2项。

ACL授予王海峰会士称号时的评价:“为机器翻译,自然语言处理和搜索引擎在学术界和工业界做出了重大贡献。”

 

越过辽阔天空,飞向遥远星空,学生时代的AI征途

1980年12月,中央电视台引进了手冢治虫的经典作品——当时还是黑白动画片的《铁臂阿童木》,这部中国引进的首部动画片,成为了一代人科学幻想的启蒙。那年王海峰9岁,当时的理想就是成为科学家,将有感情并能够思考的像阿童木一样的机器人变成现实。

80年代后期,王海峰在哈尔滨第三中学读高中时开始真正接触计算机,学习编程。1989年,他考入了哈工大计算机系,开始了实现科学梦想的征途。1993年,在王海峰准备本科毕业设计的时候,因为机器翻译让他“感觉对国际交流很有用”,进入时任哈工大党委副书记李生教授的实验室,开始研究机器翻译,从此踏上以自然语言处理为研究方向的人工智能探索之路。

当时王海峰毕业设计做的是李生教授带领团队所研制的汉英机器翻译系统第三代——CEMT-III的优化。他在这个项目中不仅展现了研究者的严谨和执着,也展现了一个杰出工程师的系统把控和流程拆解能力,这个项目对王海峰后来的科研探索和技术产业化产生了很多潜移默化的影响。其后在哈工大攻读硕士期间,王海峰又参与了863的汉英双向机器翻译项目。他几乎扎根在二十几平米的实验室里,和师兄弟以及导师一起忙的日夜颠倒。当时获取最新的学习资料非常困难,王海峰就经常往北京跑,去北京的国家图书馆里找各种文献,复印几千页的资料,然后坐二十几个小时的火车将资料背回哈尔滨。1995年,863汉英双向机器翻译项目在最终测评中,获得了全国第一。

1996年,王海峰开始在哈工大攻读博士,由李生教授和时任哈工大校长助理的高文(现为中国工程院院士)共同培养。他在机器翻译上的研究更加深入,积极探索前沿,将循环神经网络的方法引入了机器翻译领域,发表了《基于神经网络的汉语口语言语行为分析》、《基于神经网络的汉语口语多义选择》等论文,这在当时的国际学界也是超前的。

 

风云际会,初露锋芒,产业界的探索之路

1999年初,王海峰博士毕业,面临两个选择:留在大学任教还是走出去让自己的研究成果被更多人利用。当时微软的产品有非常多的遍布世界各地的用户,王海峰选择加入微软中国研究院。在微软中国研究院一年多的时间里,王海峰了解了如何把学术研究带到应用领域、带到工业界,同时跟世界级专家学者的交流,参与顶级学术活动,也极大拓宽了他的眼界,王海峰也从自然语言处理领域拓展进入了搜索这个新领域。

2000年前后,互联网兴起,王海峰敏锐感觉到互联网的时代到来了,决定投身互联网创业大潮。当时香港特区政府推出了“优秀人才计划”,王海峰成为最早被该计划遴选至香港的优秀人才之一,加入了以搜索为主要业务的isilk.com公司。

2012年3月,王海峰加入东芝(中国)研究开发中心,带领团队在自然语言处理领域创新突破,发表了一系列高水平学术论文,成为那个年代极少数在国际计算语言学会(Association for Computational Linguistics,ACL)年会这样的国际顶会上发表论文的大陆学者之一。 

虽然在东芝取得了丰富的科研成果,成为国际自然语言处理领域的著名科学家,但是王海峰不满足于此,科研成果能够大规模产业化落地、真正服务于人是他的理想。他意识到,想要拥抱更广泛的应用场景,必须具备更多的数据、更大的实验平台和应用平台。而这些条件,非常明显蕴藏在开始走向高速发展的互联网行业。

 

从无到有完整布局推动百度AI生根发芽茁壮成长

2009年8月,百度召开了第四届“百度世界大会”,推出了全新计算平台“框计算”,用户可以在“搜索框”中输入服务需求,系统对需求进行智能化理解并返回给用户匹配的结果。王海峰敏锐地注意到,如果搜索引擎想达到更高的智能化水平,必须要有强大的自然语言处理技术支撑,尤其是语言分析、语义理解、知识获取等核心技术,而这些技术领域,恰好是王海峰所擅长、所追求的。而当时百度也在寻求自然语言处理方向的带头人,王海峰很快进入了百度。

王海峰来到百度的重要职责之一就是组建百度第一个人工智能核心技术部门——自然语言处理部,加入百度之后王海峰的学习与工作强度进一步加大。每天早上七点就会到办公室工作,开始快速学习和消化百度的已有技术体系。通过出色的学习能力和旺盛的工作精力,王海峰和团队很快取得了成果,帮助百度快速提升了搜索结果质量。

那时候,谷歌已经发布了多语言机器翻译系统,以免费的服务吸引了大部分互联网用户,包括大量中国用户,真实翻译需求源源不断地发往大洋彼岸的服务器。有鉴于此,国家“十二五”863计划信息技术领域重大项目专门立项攻克这项技术,研发国人自主的机器翻译引擎。

在立项时,王海峰提出可以在中英机器翻译上超过谷歌,当时在场的很多专家都表示难以置信。而事实证明,这一项目的执行周期原本为三年,而百度翻译在一年多的时间里,就在中译英准确率上超过了谷歌。2011年6月30日,百度翻译正式上线。

联合项目合作团队,百度翻译在课题验收时已经“圆满完成 ”了包括英语、法语、德语、西班牙语、阿拉伯语和日语在内的共计14种语言和36个方向,翻译质量领先世界。这项成果在2015年被授予国家科技进步二等奖。

目前,百度翻译已形成包括翻译PC版、翻译APP、AI同传会议版以及翻译开放平台等完整的产品矩阵,可支持203种语言互译,每天翻译的字符数超过千亿,服务了40多万企业和个人开发者,覆盖30多个行业,为服贸会、进博会等上百场国际会议提供机器同传服务。

除了自然语言处理技术以外,王海峰还在百度陆续开创了一系列AI技术方向,包括知识图谱、机器学习、语音、图像、深度学习、个性化推荐等。在当时,这些技术还没有展现出充足的商业化前景,但这一布局对于百度AI后续的发展却意义非凡。这些技术构成了百度AI的核心竞争力,支撑了搜索、推荐、地图、输入法等互联网产品的智能化,驱动了智能云、小度系列硬件、智能驾驶等新业务的发展,让百度从一家互联网企业转型为人工智能平台型企业。

深度学习是促进新一代人工智能快速发展的重要基础技术,百度也是世界上最早将深度学习应用于搜索引擎的公司之一。2012年国内听说过这个名词的人并不多,王海峰2011年开始关注深度学习,2012年年初带领团队正式立项深度学习,半年多的时间就上线了基于深度学习的语音识别系统。

2014年1月,王海峰开始负责搜索业务,进一步将AI技术与搜索引擎深度融合发展,打造了百度智能搜索。智能搜索在很大程度上颠覆了传统的网页搜索。在智能搜索中,用户既可以输入文字,也可以输入语音、图片等表达多样化的需求,智能搜索引擎通过跨模态语义理解技术可以精准地理解用户需求、理解内容,进而基于知识图谱、互联网信息、服务等多种方式全方位的满足用户需求,极大提升了用户获取信息的效率。同年王海峰主持研发了集成自然语言处理、语音、视觉等技术的小度机器人,探索人们更智能获取信息和服务的新形式。依托领先的AI核心技术,小度机器人的能力远超同时代主流智能助手产品提供的简单垂类满足和搜索引擎调起等功能。2015年9月,创新孵化的“度秘”正式上线对外提供服务,这是专为用户提供秘书化信息服务的机器人助理,如今“小度、小度”正以各种方式陪伴着用户,在百度APP、地图导航、小度音箱等产品中,用户可以随时随地与TA交流、获取知识和信息,享受服务。

2016年6月,得益于在人工智能技术与搜索领域的积累,王海峰带领团队只花了25天就推出了全新的信息流产品。当时虽然整个系统要从零做起,但很多基础能力已经具备。2017年3月,王海峰整合了当时百度所有AI相关的技术研发部门,成立AI技术平台体系(AIG),包括自然语言处理、知识图谱、语音、视觉、大数据、AI平台与生态,以及由深度学习实验室、大数据实验室、硅谷人工智能实验室等组成的百度研究院。整合后的AIG在王海峰带领下,技术上坚持前沿探索与基础研究并举,同时推动多技术融合创新、平台化支持应用落地。在2018年百度AI开发者大会上百度大脑3.0发布,核心技术发展进入“多模态深度语义理解”阶段,开源开放的AI平台展现出生态的繁荣。

随着深度学习技术不断发展成熟,人工智能在产业中的应用越来越多样。基于对技术发展趋势和产业发展趋势敏锐的洞察,王海峰于2019年率先提出:以深度学习为代表的新一代人工智能是通用性技术,呈现出“标准化、自动化、模块化”的特征,开始进入工业大生产阶段。回顾工业革命的发展历史,其核心技术机械技术、电气技术和信息技术,都表现出很强的通用性。王海峰领导研发的飞桨产业级深度学习开源开放平台,以及以飞桨平台为核心基座的百度大脑,已成为软硬一体AI大生产平台,凝聚265万开发者,服务10万企业,为我国产业智能化升级、经济高质量发展贡献了重要力量。

2019年5月,王海峰被任命为百度首席技术官(CTO),同时继续担任AI技术平台体系和基础技术体系总负责人。同年9月,百度智能云事业群组也并入王海峰的职责范围。这反映出百度对AI战略的坚定投入,也是对王海峰及其团队在技术上的创新积累以及应用成果的高度认可。

2020年突如其来的新冠疫情肆虐全球,严重影响了我们每个人的工作和生活。在抗击疫情过程中,王海峰带领团队快速响应,第一时间上线了智能外呼、AI多人测温、地图迁徙大数据、LinearFold算法、疫情防控机器人,远程办公、线上课堂等等应用,展现出来的忘我投入和科技创新,为抗疫贡献了科技的温度和力量。

现在,百度已成为全球领先的AI平台型企业,软硬一体AI大生产平台百度大脑具备AI全栈能力,拥有包括国内服务规模最大的AI开放平台、自主创新的“智能时代操作系统”飞桨深度学习平台等,通过百度智能云,把AI能力输送给各行各业,加速各行业的智能化进程。

 

王海峰一直以来的理想就是通过人工智能技术的研究和实践,造福人类。2019年《连线》(WIRED)杂志采访王海峰的时候提到:王海峰二十多年来致力于AI的开发,专注于技术研究和产业应用。王海峰在采访的最后时说:“毫无疑问,人工智能的发展将带给人们幸福,人工智能带给人们潜移默化的改变,人民的幸福感已经在提升,人工智能将使我们的生活更加美好和更加智能。”

不忘初心,方得始终。王海峰多年来坚持在人工智能领域前行,始终探索前沿,创新和突破基础技术,致力于人工智能的应用转化和规模落地。他的理想,正在成为现实。中国AI能有今天的成就,正是由无数王海峰这样的科学家、工程师和企业家们几十年如一日的热忱与坚持所缔造。