CNN与RNN有什么不同?

2018-09-21 19:51:31·  来源:英伟达NVIDIA企业解决方案  
 
1982年由David Hasselhoff主演的热播美剧《霹雳游侠》可谓有先见之明,剧中有一辆充满未来感的庞蒂亚克火鸟汽车。这辆会说话的自动驾驶汽车也以好莱坞的方式生动
1982年由David Hasselhoff主演的热播美剧《霹雳游侠》可谓有先见之明,剧中有一辆充满未来感的“庞蒂亚克火鸟”汽车。这辆会说话的自动驾驶汽车也以好莱坞的方式生动地为我们上了一节关于图像和语言识别的课。



如果是今天重写剧本,Hasselhoff的AI汽车KITT将会具有从卷积神经网络(CNN)和递归神经网络(RNN)进行深度学习的功能,方便观察、聆听和对话。

这是因为CNN如同眼睛一样,正是目前机器用来识别对象的图像处理器。相应地,RNN则是用于解析语言模式的数学引擎,就像耳朵和嘴巴。

从上世纪 80 年代,CNN迎来快速发展,已成为当今自动驾驶汽车、石油勘探和聚变能研究领域的“眼睛”。在医学成像方面,它们可以帮助更快地发现疾病并挽救生命。

如今,数十亿人也在不知不觉中享受着CNN带来的便利:在Facebook上发布朋友的照片,使用自动标记姓名的功能,同时也让自己的社交活动变得更加顺畅。

如果将CNN从火鸟汽车上去掉,“火鸟”便不再拥有自主驾驶的电脑眼,那么它就会沦落为另一个毫无二致的动作道具。

另一方面,如果将RNN从自动驾驶“火鸟”座驾上剥离,就会失去智能电脑声音,以及KITT的法语和西班牙语命令。

毫无疑问,RNN正在加速基于语音的计算革命。它们是自然语言处理大脑,可为Amazon Alexa、Google Assistant和Apple Siri提供听力和语音。它们为Google的自动完成功能提供预见性,可以自行填写搜索查询中的行。


回到未来

如今CNN和RNN使得这种自动驾驶汽车已不再只是好莱坞式的幻想。汽车制造商正在快马加鞭开发未来的KITT型汽车。

当今的自动驾驶汽车甚至可以在上路之前进行模拟测试。这样,开发人员即可测试并验证车辆的眼睛能否以“超人”的感知力来洞悉世界。

得益于CNN和RNN,各种AI驱动的机器都具备了像我们眼睛和耳朵一样的能力。经过在深度神经网络领域数十年的发展,以及在处理海量数据的GPU高性能计算方面的长足进步,大部分AI应用都已成为可能。

CNN简史

早在自动驾驶汽车出现之前,人类大脑神经元之间的生物联系就启迪着研究一般性人工神经网络的研究员。CNN的研究员遵循了同样的思路。

1998年,CNN迎来了一个开创性的时刻。那一年,Yann LeCun及LéonBottou、Yoshua Bengio和Patrick Haffner 共同发表了一篇具有影响力的论文《基于梯度的学习技术应用于文档识别》(Gradient-based Learning Applied to document Recognition)。

文中描述了学习算法如何帮助用最少的预处理对手写字母中的模式进行分类。其研究在读取银行支票的精度方面打破了历史记录,而且这项技术现在已得到了广泛的商业应用。

它为AI的未来点燃了希望。作为该论文的首席研究员,LeCun于2003年成为纽约大学的教授,并于2018年以首席AI科学家的身份加入Facebook。

下一个突破性的时刻是2012年,多伦多大学的研究员Alex Krizhevsky、Ilya Sutskever和Geoffrey Hinton发表了一篇开创性的论文《深度卷积神经网络的 ImageNet 分类》(ImageNet Classification with Deep Convolutional Neural Networks)。

这项研究推动了对象识别技术的发展。该三人小组训练了一个深度卷积神经网络,对来自“ImageNet 大规模视觉识别挑战赛”的120万张图像进行分类,其错误率得到了空前降低。

这也引发了今天的 AI 热潮。
分享到:
 
反对 0 举报 0 收藏 0 评论 0
沪ICP备11026620号