【专家观点】胡郁：人工智能需要一场认知革命么？（31页PPT加报告全文）

查看原文

其他

【专家观点】胡郁：人工智能需要一场认知革命么？（31页PPT加报告全文）

2015-08-28 战略前沿技术

本文由杨静lillian（公众号：lillian_yang_1111）授权转载，原文来源于中国人工智能学会公众号（CAAI-1981 ）

【专家观点】张潼：互联网大数据发展趋势（29页PPT及报告全文）

【专家观点】谭铁牛：智能化时代生物识别的机遇与挑战（附报告全文）

【专家观点】李德毅：大数据认知（附报告全文）

【专家观点】杨强：从“互联网+”到“+智能”（28页PPT)

【专家观点】沈晓卫：认知计算引领产业智能化（PPT精选及报告全文）

8月15日，由中国人工智能学会主办的“2015第五届中国智能产业高峰论坛”在上海成功举办，吸引了诸多人工智能领域学术、产业、舆论界领袖级人物。科大讯飞高级副总裁、讯飞研究院院长胡郁应邀出席，并在会上做了题为《人工智能需要一场认知革命吗》的主题演讲。

人工智能何时将实现真正革命性突破？

胡郁表示，在这个问题上有存在两派的观点，一个是霍金、马斯克和比尔•盖茨，他们认为人工智能很危险。而理智派的观点，如FaceBook人工智能负责人Yann LeCun和大量人工智能业内人士则认为人工智能还远未达到能够威胁人类的地步，还有很多技术探索工作要做。

如果计算机可以完全模仿人类大脑的神经活动，是不是就可以产生和人类智能类似的功能？

在胡郁看来，神经网络和人脑的工作方式基本没有关系。

“只是结构上可能有点相似，如果从仿生的角度来讲人工智能大脑是最浅层的仿生，工作算法方面和人脑的工作机理没有什么联系的。但是投入了研究以后究竟有没有突破性的变化没有人能够预测，要等五到十年看看效果才能知道。”胡郁说。

人工智能研究面临的最大挑战是什么？

“语言的使用区分了人与动物，也将是人工智能研究面临的最大挑战！”胡郁认为，人工智能主要分为计算智能、感知智能、认知智能。科大讯飞主要做感知智能和认知智能，感知智能方面包括语音识别、手写识别、图像识别等，讯飞已经在感知智能领域有了多年的技术积累，并取得了重要的技术与应用成果。

2014年，科大讯飞正式对外发布“讯飞超脑”计划，目标是能在认知智能研究方面有所突破，并将研究成果应用到包括智能客服、自动阅卷、人机交互等领域。真正实现让机器从“能听会说”到“能理解会思考”。

以上内容选自科大讯飞微信公众号。下面是科大讯飞高级副总裁、科大讯飞研究院院长胡郁的发言，全文加PPT,由中国人工智能学会供稿，静沙龙记者王嘉俊整理。

其实这个讲座在今年3月22号一个比较大的人工智能活动中，我跟几个人工智能的专家在一起研讨过。在这半年里面，随着大家对人工智能理解越来越多，我对这个问题的理解也在不断的深入，今天也非常高兴有机会跟大家进行分享。

我今天主要讲四个方面的问题。

一、When？

什么时候人工智能将实现革命性突破？

国际上有很多非常有影响力的大牛或者是大咖论述过这个问题。例如，最伟大的科学家之一霍金讲：“人工智能不一定是好事。”比尔盖茨也说：“人工智能让我比较担忧。”最新的创业偶像马斯克说：“我们需要万分警惕人工智能，它们比核武器更加危险。”我们把他们叫做“人工智能威胁派”。

而另外一方面，业界有很多人，包括在座的很多专家，大家其实从另外一个角度看待人工智能，我们把他们叫“人工智能的理智派”。比如，机器学习大神Michael Jordan，Facebook的Yann Lecun等。

可以看到有一个问题是大家都关心的，那就是机器什么时候能实现智能的突破？我们知道，计算机出现到现在大概70年左右。那么我们就要问一下，人类的智能是怎么突破的？非常有意思的是，人类历史学家对这个问题研究了很长时间，而且已经得出了结论。以色列的一位年轻的历史学家尤瓦尔.赫拉利的《人类简史：从动物到上帝》中写到：七万年前，从非洲大陆走出来的智人实现了“奇点”的突破，占领了整个世界。

所以大家就会想知道，七万年前来自非洲的猿人到底发生了什么，好像智力一下子突然开窍了，统一了地球呢？猿人在地球上已经存在了300到400万年了，到7万年前才实现了智能的突破，这里面是一个非常长的时间。而计算机出现的时间刚刚只有几十年的时间，和猿人产生智能的时间周期相比，计算机刚刚度过的时间只能算一瞬间。

二、How？

人工智能如何才能实现最终的突破呢？

最近讨论比较热的一个话题是，神经科学对人工智能发展促进的可能性。最近这两年，美国政府已经顺利完成人工基因测序的研究。美国和欧洲正在开展一个新的为期十年的40亿美金的基础研究投资，美国叫“大脑图谱”，欧洲叫“人类大脑项目”。在这个方面，我国各个方面也在积极推进“中国脑计划”，比如中科院卓越创新工程里面，也涉及了这方面的研究。

我们可以看到，对于脑神经科学的研究，对于人工智能是可以产生促进作用的。现在脑科学的进展，已经使我们知道大脑里面的不同区域可以处理不同的细节。大家看左图，当一个图像进来以后，我们看到了不同的像素、点、线、轮廓最后到人脸，这是一个非常复杂的图像处理过程，需要使用几百亿个神经元。

而且非常有意思的是，人脑在处理各种不同的多媒体信号的时候，例如声音、图像、触觉，都是从细节到抽象逐步的向上传递，并且最后综合在一起的。当你看到一幅猫的图片的时候，你的大脑里已经有预备有猫的叫声，猫如果发出猫的声音，你的反应是正常的。如果猫发出的是老鼠的声音，那你觉得这是不正常的，又会调出另外一套处理机制。

如果把人的大脑皮层剖析开，就会发现大脑皮层是由六层的神经元结构构成的。最重要的一点是什么呢？大脑皮层记忆的方式，跟我们电脑的存储是完全不一样的。比如：大脑主要存储序列模式。一首歌曲从前到后听是能够记得住旋律的，而倒过来放我们就不认识了。包括自联想的回忆模式。比如：看到猫脸上半部，人脑的神经网络会帮你自动的联想出猫脸的下半部出来。

对比来说，电脑只能做运算和存储，而不是记忆。前一段时间跟李德毅院士专门探讨了记忆是如何帮助人脑实现智能的问题，我觉得在这方面的研究还差的很远，还有大量改进的空间。

迄今为止工业界人工智能的成功经验是什么呢？以谷歌为代表的世界互联网公司，包括中国的阿里、腾讯、百度、讯飞，已经找到了一条路，那就是利用深度神经网络与大数据结合，这已经成为当前人工智能实现的一条主流路径。我觉得这条路径中还有一个非常重要的内容，就是基于互联网和移动互联网的“研究-工程-产品-用户”大闭环优化。

从2013年开始，其实DNN已经被广泛的应用在合成、识别、评测、增强等一系列方向。我们可以看到现在这个方面的工作，已经成为了当前机器学习和统计模式主流。现在的DNN对人脑神经网络的借鉴是非常非常抽象的，我们其实可以通过对人脑的研究进一步的优化DNN。

大学和研究院所要想做人工智能方面的工作，当前相对于互联网公司，一个很难比较的地方是什么呢？我总结了一个“研究-工程-产品-用户”大闭环优化的核心思想，用简单的四个字，可以说是“大、智、移、云”。

移动互联设备对智能交互（包括语音图像）提出了迫切的需求，而传统的嵌入式移动设备不能够提供足够的运算能力且缺乏足够的电力供应，而云计算出现以后，这些复杂的计算都可以放在云上。通过云计算自然就存储了大数据，而这些大数据结合刚刚讲的深度神经网络，可以很好的解决人工智能问题。我自己把它总结成为一个效应，叫“涟漪效应”。

“涟漪效应”就是水滴刚刚滴入水面的这个过程，会产生一个波纹逐步的覆盖整个水面。我们可以想象一个人工智能产品刚开始投入到市场上的时候，有些性能是不好的，就像讯飞的语音输入法。水波纹每一圈向外扩散就会有更多人使用，更多人使用，真实数据和使用经验就会放到云上，系统会根据这些数据和经验进行自我学习和更新。当它扩散到更多的人使用的时候，就是波纹覆盖水面扩大的时候，已经是改进以后的系统。前一千万人免费使用系统的同时也贡献了宝贵的数据和经验。当第一千万零一个人使用的时候，他就会觉得：“哇，怎么这么好？”。

2010年以前的语音识别是不能在真实场景下使用的，我们科大讯飞刚推出语音输入法的时候，在实验室里面测试识别率是90%的系统，在真实的环境下识别率是多少呢？55.8%。但是利用涟漪效应和“大、智、移、云”，现在已经识别率达到了95%。人是多少？99.5%。但是现在识别率还在以每年30%的速度往上提升，大概5年以后就可以逼近人类的水平。

现在工业界所依赖的大闭环优化、深度学习和大数据方面，跟脑科学的研究思路有没有可能结合呢？我觉得是完全有可能的。因为现在人工智能网络借助于新的学习机理甚至于拓扑结构上的改进，将可以进一步成为人工智能发展强有力的推动力。

例如，一种新型的递归型深度神经网络RNN已经成为当前语音识别的一个新的标准配置，比传统的DNN方法可以再提高20%-30%。RNN就是一种非常新的网络拓扑结构，和人脑神经网络可以时间上可以进行信息积累类似，通过网络拓扑结构的优化和改变可以实现对序列性数据更好的处理能力。

三、Who？

人工智能到底是什么样的一个技术？

上次开中国人工智能大会的时候，我被问到一个问题：人工智能跟机器人是什么样的关系？大家都知道，人工智能和机器人的定义里面都是这样一个过程：一套完整的能够进行感知、认知、决策和执行整个过程的人工处理机制。

人工智能自1956年DartMouth会议有了定义以来，大家一直在追求的是通过计算机数字世界和虚拟世界完成这样一个机制。但是做机器人的专家是从哪个角度呢？他们是在物理世界和真实世界中探求能不能实现这样的机制。因为做机器人的，一定要在物理世界里面执行。现在做人工智能的人员长期与虚拟数字世界打交道，而现在要到一个真实的物理世界干活了。而作为长期在真实物理世界中工作的机器人专家来做，当前必须在数字化世界中获得更强的智能。我要讲的是，现在这个时代，也许这两方面要进行更紧密的融合。

四、Where？

当前人工智能发展到什么阶段了？

世界上一个非常著名的公司Gartner研究过，一项新的技术从开始研究到最后成功的产业化之间要经过很多过程，包括一开始的推崇备至发展到期望巅峰然后到跌入现实低谷的痛苦，很多技术在这个过程中慢慢的消失了，或者被新的技术代替了。但是在这个过程中我们看到，我们所讲的人工智能其实是一个非常广泛的概念，他的各项技术以不同的状态分布在整个曲线上。

工智能里面很多项技术发展是不均衡的。上次李德毅院士跟我探讨过一个概念。我原来说的是计算机有计算能力和记忆能力。后来李院士讲：“这是不对的。”后来我就改了，我讲：“计算机现在比较强大的是运算能力和存储能力。” 1996年IBM的深蓝计算机战胜了当时的国际象棋冠军卡斯帕罗夫，从此，人类在这样的强运算型的比赛方面就不能战胜机器了。江苏卫视有个《最强大脑》的节目，让每一个人类选手记100个4位数，然后让你问第58，第64个4位数是什么？这对于计算机来讲，根本就不是个问题。所以从运算智能的角度来说，人类早就不是机器的对手。

我们看到机器在感知世界方面，比人类还有优势。人类都是被动感知的，但是机器是可以主动感知的。比如：激光雷达、微波雷达和红外雷达都是。可以看到不管是Big Dog这样的感知机器人，还是自动驾驶汽车，因为充分利用了DNN和大数据的成果，机器在感知智能方面已经越来越接近于人类。

但是，我们不要忘了一件事情，人类跟动物的区别是什么呢？是人类拥有自己的语言，有语言就可以表达知识，有知识就可以进行逻辑推理，而有逻辑推理以后我们就有向更高阶段发展能力。我们认为语言的使用区分了人与动物，也将是人工智能面临的最大挑战。

其实前一段时间就有人跟我提：“动物难道没有认知吗？”动物对自然世界确实有认知，但是它的认知也只能是停留在哪些是固体、哪些是液体、哪些是能吃，哪些是不能吃的等等。所以我说，动物只能对自然世界产生简单的认知，同时对人造世界的自然属性产生认知！动物能够看到月亮，但是它不知道月亮是一颗星球。如果一只兔子来到这个会场，它会知道这里有很多活物（人），有桌子、椅子这些固体，但是它不能理解这些物体和人类社会之间的关系。

现在我要问的问题是，计算机能理解这一切吗？我觉得这是非常关键的一点。如果这时候让我们回过头来看一看人类智能的突破。七万年前智人的智能好像有过大的突破，研究表明，这是因为他们有特殊的语言和认知。我们到现在分析人类历史都知道有农业革命、工业革命、信息革命，但是在七万年前，现在历史学家有一个公认的，在七万年前人类发生了“认知革命”。其中的核心是智人拥有丰富的语言，从而产生了三个结果，这些智人通过语言更好的描述自然世界，从而可以执行更加复杂的计划。比如：河边有一只狮子，猴子和鸟类可以发出类似的声音，但是智人已经能够描绘出狮子多大，跑的多快。

我曾经以为八卦是女生特有的专利，现在我才知道八卦对于人类发展非常重要。因为有了语言，智人可以对人类的社会关系进行“八卦”，从而可以组织150人以上的团队。而最重要的一点，就是智人有了语言之后可以描述在梦中想到的东西和他们脑子里面想到的东西，从而产生虚构、产生宗教，产生各种概念。

正是因为这样的，现在很多正在做人工智能研究的专家，包括我前面说的大牛Michael Jordan和Yann Lecun等也已经意识到，自然语言理解对于人工智能来说是一个突破口。

在今年3月22号的《静.沙龙》人工智能研讨会上，我对杨强教授当时提的一个概念非常尊崇。最近有一本书是《从0到1》，美国Peter Thiel写的，他讲的“从0到1”是美国擅长的原始创新，而他讲的“从1到N”是中国擅长的全球化。杨老师提出来一个，说现在我们人工智能研究大部分做的还是从1到N的工作，我们让机器干很多事情看起来像是有智能一样。但是其实在人工智能领域大家一直追求的从0到1的事情，就是让机器真正具有思维的能力。这个角度上，我们是不是可以从自然语言理解上突破？我觉得是可以值得期待的。

如果机器已经在运算智能上比人类强很多的话，在感知智能上已经给了我们很大的威胁，而最需要突破也是最难的就是认知智能。

我在科大讯飞所领导的讯飞超脑计划，就是想实现包括感知智能和认知智能在内的全面突破。在感知智能领域，在语音识别、手写识别方面每年保证30%-50%的错误率的下降。进一步的，我们不仅能够识别普通话，我们还能够识别方言；不仅能够理解人类和机器的对话，而能理解人类和人类的对话；不仅能够识别联机手写的字符，还能识别离线手写的字符。我们在认知智能上的研究目标，关键是让机器能理解会思考，必须要突破语言理解、知识表示、联想推理，自主学习等多个方面。

国家现在也立了一个项目：“类人答题系统”。评判一个人智商的标准是什么？让你参加考试，虽然这个方法很多人都在批判，但是没有其它更好的办法。美国华盛顿图灵中心在做，让机器人通过美国高中生物测试。日本国立情报研究所在做能够考上东京大学的高考机器人。

我国863计划也在做一个项目，就是要做一个高考机器人，我是首席专家。在7月份，我们开了启动会，全国31单位共9个子课题正在进行攻关。

将来一份试卷不管是手写识别的，还是选择题涂抹的，我们都可以先把它通过OCR转变成计算机可以理解的文本和图像，再让计算机自动的答案的正确程度进行评判，这其实是把感知智能和认知智能结合在一起。

现在合肥的会考和安庆会考中，英文和中文的考试已经全部使用了整套感知智能和认知智能技术，取得了非常好的效果，以后我们将会全面推广到包括文科和理科的所有方面。

我们可以看到随着这些技术的发展，人工智能将来在智能硬件、车联网、机器人、自动客服、教育等方面都会发挥越来越多的作用。我相信在这样大的环境下，最后人工智能大家所期望的梦想一定能够实现。

谢谢大家！

【战略前沿技术】一网打尽系列陆续推出，请回复以下关键词查看相关文章：
回复“谷歌”或“google”，查阅“google创新”专题系列文章；回复“工业4.0”或“industry”，查阅“工业4.0”专题系列文章；回复“神盾”或“DARPA”，查阅“美国高级研究计划局DARPA”专题系列文章；
回复“颠覆”或“distructive"，查看“智库建设”专题系列文章；
回复“3D”或“4D”，查阅“3D打印”与”4D打印“专题系列文章；
回复“硅谷”或“silicon”，查阅“硅谷”专题系列文章；回复“石墨烯”或“graphene"，查阅“石墨烯”专题系列文章；回复“智能制造”或“inte manu”，查阅“智能制造”专题系列文章；回复“智能”或“intelligence"，查阅“人工智能”专题系列文章；回复“军民”或“integration"，查阅“军民融合”专题系列文章；回复“激光”或“laser"，查阅“激光武器”专题系列文章；回复“智库”或“tank"，查阅“智库建设”专题系列文章；
其他主题系列陆续整理中，敬请期待……

【战略前沿技术】2014-2015年历史文章目录已上线，回复“目录”即可查看，敬请关注！

【战略前沿技术】已开通原创、评论以及对原创作品的打赏功能

欢迎评论：对于文章有任何问题和看法，请移步文末进行吐槽和评论!

欢迎投稿：对于原创性作品将优先发表，并将获得读者打赏的全部!

欢迎打赏：请对原创作品随意和任性打赏，打赏将全部归作者所有!

【战略前沿技术】
引领科技创新发展
1

微信公众号：tech999

个人微信号：tech9999

邮箱：2669537857@qq.com

一把短刀，怎么就让他连捅18人？！

向杨大市长道歉

向不容妄议的杨市长道歉

以色列搞大了：伊朗说要直接出兵参战

黄晓菁，这位杭州泰隆银行女员工自爆视频火了，带给我们那些思考？