深度学习让人工智能专家震惊的是其在图像识别上的进步。深度学习系统可以准确的将物体分类并添加主题,使YouTube视频分类达到16%的准确度。这个数字虽然看起来很小,但是已经比上一代系统提高了70%。需要注意的是,YouTube的系统所用的深度学习是将视频分到22000个分类中,许多分类连常人无法区分。而当把分类缩小到1000个时,系统识别的准确率瞬间提高到了50%。
Google对深度学习的态度是坚定的。首先,可以为YouTube提供更好的图像识别功能,为语音搜索提供更快更精准的识别,为自驾驶汽车提供更复杂的图像识别系统,以及优化搜索和广告投放等等。
加盟百度前,徐伟曾作为Facebook资深科学家,担任关键技术单元“大规模推荐平台”负责人。
美国“911事件”发生后,徐伟团队在深度学习领域的研究成果被应用于美国火车、机场等监控系统,通过分析旅客行为来智能搜集迹证,判断可疑人士。
苹果的 Siri 语音助手和 Google 的 Street View 就是两个例证。
图像的表征和搜索方式还只是停留在图像的基本笼统的数据特征。而深度学习则把图像的表征划分为多个层次,并且高层次的表征依赖于低层次的表征。这样,一张人脸就能被划分为更低层次的眼睛、鼻子、嘴巴。如果需要,我们还可以在眼睛、嘴巴这个层次进行细分,比如将嘴巴分为上下嘴唇。
深度学习的创新之处不仅在于它能将数据的提取之后组合为不同层次,而且还能学习到具体需要多少个层次才能将数据进行最佳表示。”
在未来,科学作家 John Markoff 认为,深度学习会使监测技术更价廉,结果更易用;会帮助市场分析人员发现消费者的购买模式;会为自动驾驶汽车和机器人的发展奠定基础。
收集与我们相关的数据并存放在云端,然后供机器更好的理解和预测我们的需求,Nuance 正是想以这种方式来改变我们对机器的使用。
Google 的语音加人工智能技术,最典型的就是通过 Google Now 搜索网页。Nuance 的语音技术基于统计推断,通过音素(音节)和上下文来进行识别。而 Google 则是使用名为深度学习的技术,该技术由人工智能大牛 Geoffrey Hinton 倡导,在 2013 年初 Google 聘用了他。Hinton 的方法识别效果更好,而且还免费提供给安卓开发人员使用,但 Nuance 却还收授权费。
这个世界是层次化的。唯有哺乳动物拥有新皮质,进化的新皮质可以让我们更好地理解世界的结构,以便我们更好地根据需要改造世界、解决问题。我们的思考是层次化的。人类的第一项发明是语言,语言就是层次化的。
要想理解自然语言,就得理解概念和世界上的事物,包括抽象事物和具体事物。知识图谱现在已经有 7 亿条目,其间的链接有几十亿,而且现在还在迅速增长。我是没有办法创造这样的东西的。知识图谱绝对是我即将要用的东西。因为如果你要对语言表达的东西建模,就得链接到所有概念的知识库,这里面已经有许多关系存在了。此外还有很多其他的技术,如句法分析,不过在 Google 之外你是看不到这些技术的。
比如,为了赋予机器“视觉”,研究人员需要建立最基本的一层人工神经元,用来探知如物体的边缘形状等基本信息,第二层神经元可以将第一层感知到了物体边缘性状拼凑起来,鉴定较大块的物体形状,然后再加一层将第二层检测到的信息再拼凑从而使机器明白
物体整体的形态。这里面关键的一点是,软件可以自行做到这一切——旧的“伪人工智能”往往需要工程师人工输入物体视觉或者声音的信息,然后由机器学习算法来处理这些信息数据。
借助深度学习(Deep Learning)的方法,社交网站可通过软件计算出用户发布内容中的情绪,哪怕文本比较模糊,还可识别照片中的物体,从而比较精确地预测用户行为。
因篇幅问题不能全部显示,请点此查看更多更全内容