机器学习祖师爷Tom Mitchell:带着理性拥抱机器学习的热潮 - 大数据疑难解答_大数据疑难解析_大数据行业分析 -
当前位置:技术分享 > 疑难解答 > 正文

机器学习祖师爷Tom Mitchell:带着理性拥抱机器学习的热潮2018-05-14 10:46:02 | 编辑:hely | 查看: | 评论:0

实际上,除了 Michael I Jordan,还有一位机器学习领域的祖师爷级教授 Tom Mitchell 也来到了 GMIC 2018。本文对 Tom Mitchell 教授进行了专访,教授风度翩翩,语言严谨但也非常温和。
上个月,全球移动互联网大会 GMIC 2018 在北京开幕。此次主题为「AI生万物,谐音爱生万物,科学技术要有人文的温度,机器有爱,真芯英雄」的大会上,全球人工智能领袖汇聚全球业界顶尖领袖,探讨在基础硬件、大数据与开源平台、深度学习为代表的算法等人工智能领域的最新洞见,是年度行业发展的风向标。

此前就报道了 Facebook 首席 AI 科学家 Yann LeCun 的开场演讲《AI 的最新技术趋势》,也整理了 Yann LeCun、Michael I.Jordan、李开复等人关于 AI 的现状与未来的圆桌讨论

实际上,除了 Michael I.Jordan,还有一位机器学习领域的祖师爷级教授 Tom Mitchell 也来到了 GMIC 2018。本文对 Tom Mitchell 教授进行了专访,教授风度翩翩,语言严谨但也非常温和。

 

专访机器学习祖师爷 Tom Mitchell:带着理性拥抱机器学习的热潮

 

Tom Mitchell,美国卡内基梅隆大学(CMU)计算机科学学院机器学习系主任、教授,美国工程院、艺术与科学院院士,美国科学促进会(AAAS)、国际人工智能协会(AAAI)Fellow,他在机器学习、人工智能、认知神经科学等领域卓有建树,撰写了机器学习方面最早的教科书之一《机器学习》,是机器学习领域的著名学者。

问:现在机器学习非常火热,我们听说今年 CMU 计算机系的硕士博士申请大爆发。您觉得机器这个专业现在过热了吗?

Tom Mitchell:我觉得学生们很聪明,他们知道机器学习可以在未来的职业道路中发挥很大作用,所以他们有充足的理由选择学习机器学习。对于职业选择来说,我了解到要求具备机器学习能力的职位现在有最高的薪水,在美国是这样,我虽然不清楚中国的情况但我相信也是一样的。这方面的人才确实有短缺,因为很多公司都认为,有一些在机器学习方面有天分的员工,会对公司的未来起到关键作用。

问:您对申请这个专业的学生有什么建议吗?

Tom Mitchell:你可以在编程和统计这两个方面进行充分的学习。我自己就教授机器学习课程,然后课程结束之后查看学生们的表现的时候,我觉得带来最大区别的是他们的数学能力。很多学生都知道如何编程,因为这是要求的。实际上,如果你想做机器学习做的比较好,那你需要数学、微积分、线性代数几门课都学得比较好。所以我现在也对我教的课程做了一些改动,在上课的第一天,学生们可以做一个在线测试,花十分钟左右的时间做一些简单的题目,比如如何做矩阵乘法、如何算导数、如何算一个东西的概率,这可以帮助他们自己以及我判断基础知识水平。我觉得这就是最好的准备方式。

问:许多知名教授和研究员都被高薪吸引到了科技企业里。有人认为这会影响未来年轻学者的培养,您同意这种观点吗?

Tom Mitchell:这样的观点我并不同意。我自己现在就在学校,我也收到了一些 offer 希望我离开学校到企业里去,他们开给我的薪水也确实比在学校当教授的薪水要高得多。但是我拒绝了他们,我喜欢待在学校里面。但我觉得总的来说,首先,确实有很多学者被吸引到了业界去;这也确实给大学带来了一些痛苦。不过如果你把眼界放得广阔一些,看看 AI 的发展,看看 AI 对整个世界的积极影响,我觉得有才能的人到了企业里面是好事,包括初创公司,他们确实对整个世界造成了影响。那么大学会因此分崩离析吗,也不会。而且我觉得,整个人才库本来就是流动的,我觉得这是其中的关键。如果企业来学校招了更多的人,我们也就培养出更多的教授来。

问:也有人说科技巨头招走了人以后并没有做出显著的研究成果。您同意这样的观点吗?

Tom Mitchell:这个观点我也不同意。我们很多研究者都用PyTorch或者TensorFlow作为我们深度学习研究的基础工具。那这些工具是哪里来的呢?就是这些科技巨头。那么如果没有这些科技巨头的话,能够使用深度神经网络的人也就少了。所以他们也是有积极作用的。这些科技巨头的问题是,他们没有足够的动力分享自己的研究成果。以前所有的好想法都会公开出来,而到了这个时代,很多好想法会深藏在企业里面。我作为一个学者,对这件事情觉得有点沮丧。不过我也可以接受这个结果,因为我觉得这也代表了 AI 正在走向整个世界。

问:深度学习是现在最流行的机器学习方法,虽然强大但每个模型都还是只能解决特定的问题。更通用的人工智能有可能通过深度学习实现吗,还是需要等待新的方法出现?

Tom Mitchell:我觉得我们现在的深度学习方法有一些明显的缺点。比如,虽然我们现在在许多自然语言处理问题中使用深度学习方法,这可以算是自然语言处理领域的最新发展了,但是没有什么深度学习系统能够表示出来我现在说的这句话的意思。因为它们都是基于内容的向量表征的,那我们其实并不清楚一个向量要如何才能表示一个量化的句子。比如我说:「每个毕业了的学生都至少学了三门计算机科学的课程,而且有一位自己的导师。」那么只要我提取出其中的关系是「对于每一个 x,都有 xxx 的 y」,想要用向量来表示它就会非常难。那么,着眼未来地看的话,对于深度学习会如何影响自然语言处理,其中一个重要问题就是,我们能否找到一种表示信息的方法,它能够提取出我说的句子中的微妙信息,但同时还具备向量表示这样的相似性特点——两个相近的向量有很大概率表示的是相似的信息。

问:您如何看待 AutoML?谷歌在研究 AutoML,我们近期采访过的一家中国公司也在研究 AutoML。他们的目标是希望用 AI 生成 AI,减少深度学习开发中需要的人力,降低使用深度学习的门槛。您觉得这是一个有潜力的方向吗?

Tom Mitchell:我觉得开发这些能够自动决定参数、自动决定学习算法的工具是一个很好的方向。不过如果有的公司觉得这样就可以让电脑自己完成这些工作,而不用雇一个很懂的人的话,那就很危险了,这会是一个很糟糕的想法。通过一些工具把问题变得简单永远是好事,但是现实中想要把机器学习运用在自己的应用中的时候,经常遇到的其实是,「我学这个数据能不能学到我想要的学到的东西」、「我要如何表示输入数据才能让它和我选的学习算法兼容」类似这样的问题。这样的问题是现在的 AutoML 还解决不了的。

问:波士顿动力研发的机器人经常给人带来惊喜,但据我们所知他们使用的还是传统控制理论。用神经网络控制的机器人能够达到那样的表现吗?能的话需要多久?

Tom Mitchell:这是一个很棒的问题。我觉得这其中的关键问题不是要用神经网络替换传统控制方法,而是要把传统控制方法和深度神经网络结合到一起。我觉得我们现在就已经可以看到一些结合的趋势。比如你想想无人机的话,他们就是传统控制方法和深度学习的很好的结合。今年秋天我教的一门课「深度强化学习」就是关于这个话题的。在我关注的范围内,传统控制有一个特点,即便当这个系统要适应一个新环境,那只要这个系统的设计是正确的,我们就有理论可以保证它的动作可以保持在某一个操作范围内。比如,你开一架飞机,让它自动降落,如果它使用是一个传统控制系统,那么这样的传统控制系统就有理论上的保证,不管降落的时候路是不是凹凸不平,它的动作都能保持在一定的操作范围内。那么我们在机器学习以及强化学习里面缺少的,就是这样一种理论,如果系统在新的环境里面要从糟糕的状况学习达到一个好的状况,我们没有什么理论可以限定它在这两个状态之间的过程里会做些什么。传统控制理论就在成功做到了这一点,其中部分原因就是这些系统都是较为简单的系统,所以我们能够推导出这样的理论保证。对于把深度神经网络作为学习机制的系统,它的结果要开放得多,我不是很确定我们能不能得到这样的理论。不过这在我看来会是一个非常重要的研究领域。

问:您认为脑科学(神经科学)与人工智能之间是什么关系?脑科学的知识在您的研究中是否重要?

Tom Mitchell:神经科学对我自己的研究来说很重要。因为我这几十年的研究里就有接近一半的时间都在做脑成像的实验来研究大脑是如何工作的。目前来说,很不幸的是,神经科学对人工智能的影响很小,而人工智能反过来对神经科学有很大的影响。我个人在两个领域都做着研究,因为我相信在未来的发展中两个学科的互相帮助会比以前更多。我希望我是对的。

问:前段时间,来自 20 个国家的超过 50 位 AI 学者签署了一封公开信,抵制韩国科学技术院与军工企业联合研发基于人工智能的自主武器。您对人工智能用于武器的态度如何?

Tom Mitchell:我觉得这是人们尝试让 AI 做的最危险的事情之一。我觉得,即便他们的公开信里面点名批评的是韩国,但事实是每个国家都在考虑这个方向。公众也对此缺少了解,当我看报纸的时候,我感到很惊讶,人们担心 AI 会侵犯他们的隐私,但他们并不为 AI 可能会成为武器的这件事情所担心。我觉得这很荒唐,我们似乎关注错了重点。我们现在能做什么还很难说。但我觉得我们应该做的,会和我们对待生物武器、化学武器的事情很类似。我们应该把反对武器化AI的国际性条约作为目标,就像我们成功达成了国际条约阻止化学战争的出现一样。我们确实需要做这件事情。所以我为他们的公开信鼓掌,只不过过单独针对韩国似乎有些不公平,实际上所有国家都有参与。

上一篇:朱诗雄:Apache Spark中的全新流式引擎Structured Streaming 大数据和「数据挖掘」是何关系?下一篇:

公众平台

搜索"raincent"或扫描下面的二维码