美国华盛顿大学人工智能教授
㈠ 把2.5万工程师变成机器学习专家是怎样的体验
谷歌转型:把2.5万工程师变成机器学习专家是怎样的体验?
卡森·霍尔盖特(Carson Holgate)正在接受忍者培训。
但这里的忍者指的并不是武术——她已经有不错的武术功底。26岁的霍尔盖特是空手道黑带二段。现在的培训重点是算法。霍尔盖特几周前加入这个项目,她希望借此掌握机器学习方面的技能,这是一种比身体对抗更加强大的技术。作为谷歌Android部门的一名工程师,霍尔盖特是参加今年忍者学习项目的18名程序员之一。该项目从各个团队招收有才华的程序员,向他们传授人工智能技术,以便提升其产品的智能性——尽管这有可能让他们开发的软件更加难以理解。
正在接受机器学习“忍者训练”的谷歌工程师卡森·霍尔盖特。正在接受机器学习“忍者训练”的谷歌工程师卡森·霍尔盖特。
“该项目的标语是:你想成为一名机器学习忍者吗?”谷歌内部机器学习产品经理克里斯汀·罗伯森(Christine Robson)说,她负责管理这个项目,“所以我们从谷歌各个部门招收人员,用6个月的时间为他们提供机器学习培训。让他们跟着导师学习6个月机器学习,并进行一些项目。他们可以由此入手,从而掌握大量知识。”
霍尔盖特4年前拿着计算机科学和数学学位来到谷歌,对她来说,这是一次掌握最热门软件技术的机会:使用学习算法和海量数据,教给软件完成任务的方法。多年以来,机器学习都被视作一个高度专业的领域,仅有少数精英人群能够掌握这种技术。但这个时代已经结束了,最近的结果表明:由模拟生物大脑工作方式的“神经网络”驱动的机器学习技术是将计算机与人类能力融为一体的正确方式。
在某些情况下,甚至可以借此打造出超人。谷歌希望在内部扩大这类精英人群的范围,甚至希望让机器学习成为一种常规技术。对霍尔盖特这样的工程师而言,忍者项目是一次实现自我飞跃的绝佳机会,可以向精英中的精英学习知识。“这些人都在开发不可思议的模型,而且都有博士学位。”她言语间流露出无法掩饰的敬畏之情。由于该项目会将所有学员都称作“忍者”,所以她开始有些难以接受,但最终还是克服了心理障碍。“我起初很难接受,但还是学着接受了。”她说。
考虑到谷歌员工人数众多——其总部的6万员工中约有半数是工程师——所以这个项目的规模其实很小。不过,这个项目却标志着谷歌内部的认识开始发生变化。尽管谷歌从很早以前就开始使用机器学习技术,而且一直在这一领域积极聘请各类专家,但该公司直到2016年才开始真正痴迷于机器学习技术。谷歌CEO桑达尔·皮查伊(Sundar Pichai)在去年末的财报电话会议上阐述了该公司的想法:“机器学习是一项有颠覆性的核心技术,我们可以借此重新思考我们做一切事情的方式。我们还会尽力将它应用于所有的产品中,包括搜索、广告、YouTube或Play。我们还处于发展初期,但你会看到我们以系统化的方式将机器学习应用到所有这些领域之中。”
很显然,如果谷歌要在旗下的所有产品中融入机器学习技术,就需要精通这项技术的工程师。正如机器学习畅销书《算法大师》(The Master Algorithm)的作者佩德罗·多明戈斯(Pedro Domingos)所说:“机器学习是阳光下的一项新生事物,这是一项可以自己发展的技术。” 编写这样的系统需要找到合适的数据,选择合适的算法,然后为成功营造合适的环境。之后就要给予系统足够的信任(这对程序员来说是一件很难做到的事情),让它们自己完成工作。
“通过这种方式思考解决方案的人越多,我们就会变得越好。”谷歌机器算法项目负责人杰夫·迪恩(Jeff Dean)说。他估计,谷歌目前约有2.5万工程师,但只有几千人精通机器学习,占比大约为10%。他希望最终的比例能接近100%。“如果能让所有工程师都在一定程度上掌握机器学习技术,那就太好了。”他说。
他认为这个愿望能否实现呢?
“我们会尽力尝试。”他说。
神奇技术
多年以来,约翰·迦南德里(John Gianandrea)一直都是谷歌机器学习的重要推动者,而作为该公司的最新动向,他最近成为了搜索业务主管。但当他2010年加盟该公司时(他是在谷歌收购MetaWeb时随之一同加入谷歌的,那家公司的庞大数据库已经以知识图谱的形式整合到谷歌搜索中),他在机器学习和神经网络方面并没有太多经验。
谷歌最权威的计算机科学专家杰夫·迪恩正在制作机器学习方面的工具,领导团队进行相关工作。谷歌最权威的计算机科学专家杰夫·迪恩正在制作机器学习方面的工具,领导团队进行相关工作。
但在2011年左右,来自神经信息处理系统(以下简称“NIPS”)大会的一条消息令他感到震惊。似乎每年都会有团队在NIPS上宣布机器学习的最新进展,涉及翻译、语音识别和视觉系统等诸多领域。一些令人惊讶的事情正在悄然发生。“当我第一次关注时,NIPS的内容十分晦涩难懂。”他说,“但过去3年间,这一领域在学术界和产业界都得到了蓬勃发展,去年的参会人数大约有6000人。”
随着神经网络算法的进步,加上摩尔定律带来的强大计算能力,以及谷歌和Facebook等科技公司挖掘出来的庞大用户数据,机器学习的新时代就此拉开帷幕。迦南德里也加入其中,他认为这将成为谷歌的核心。与他志同道合的还包括迪恩,他是“谷歌大脑”(Google Brain)的联合创始人,这个神经网络项目来自谷歌旗下的研究部门Google X(现已更名为X)。
虽然迦南德里否认“机器会杀死我们”这样的预言,但他的确认为,机器学习系统将成为一项革命性的技术,从医疗诊断到无人驾驶汽车,各行各业都将利用这种技术。虽然机器学习不会取代人类,但它却会改变人类。
迦南德里以Google Photos为例进行了解释。这款产品的标志性功能是能够在图片中识别出用户指定的物品,这令人感觉颇为神秘,甚至有些不安。他给我展示一些边境牧羊犬的图片。“当有人第一次看到这个场景时,他们会以为发生了与众不同的事情,因为电脑不仅为你计算出偏好,甚至还推荐你观看一段视频。”迦南德里说,“它可以理解画面中的内容。” 他解释道,通过专门的学习,电脑便可“知道”边境牧羊犬的样子,而且可以识别出不同年龄和毛长的边境牧羊犬。
人类当然可以做到这一点。但没有一个人能够从数百万张图片中筛选出来这些照片,同时还能识别出不同的犬种。但机器学习系统就可以做到。如果它学会了一个犬种,便可使用相同的技术识别出另外9999个犬种。“这才是真正新颖的地方。”迦南德里说,“通过这样一个狭小的领域,你可以看到某些人所谓的超人究竟能达到什么效果。”
逐步探索
需要强调的是,谷歌早已了解机器学习的概念,该公司的创始人始终坚信人工智能的前景。机器学习已经整合进谷歌的很多产品,尽管未必采用了最近大热的神经网络技术(早期的机器学习往往依赖更加直接的统计方法)。
事实上,谷歌10年前就开始通过内部培训,向该公司的工程师传授积极学习技术。2005年初,当时负责谷歌搜索业务的彼得·诺维格(Peter Norvig)向科学家大卫·帕布洛·科恩(David Pablo Cohn)提出建议,希望了解谷歌能否采用卡内基梅隆大学组织的相关课程。科恩表示,只有谷歌自己才能教授这种内部课程,因为谷歌的运营规模与其他公司都大不相同(可能只有美国国防部是个例外)。所以他在谷歌总部的43号楼(那里当时是搜索团队的总部所在地)订了一个大房间,每周三在那里开设两小时的课程。就连杰夫·迪恩也参加过几次课程。“那是全世界最好的课程。”科恩说,“作为工程师,他们都比我优秀得多!”
那个课程广受欢迎,甚至变得一座难求。就连班加罗尔办事处的员工都会特意等到午夜过后接入远程教学系统。几年后,一些谷歌员工把授课演讲内容制作成了短片,结束了直播授课的历史。科恩认为,当时的那个课程算得上是MOOC(大规模开放在线课程)的先驱。接下来几年,谷歌还针对机器学习培训展开了其他的尝试,但组织上并不严密,内容上也并不连贯。科恩2013年离开谷歌后,机器学习才突然间成为了至关重要的领域。
在2012年之前,这种认识尚未形成气候,直到迦南德里决定“吸收大量从事这项工作的人”,并将他们安排到同一栋办公楼之后。脱胎于该公司的X部门的谷歌大脑也加入进来。“我们吸收了很多团队,将他们安排到同一栋办公楼内,还提供了全新的咖啡机。”他说,“有些人之前只是一直在从事他们所谓的感知计算——声音和语音识别等技术——现在都可以与那些从事语言工作的人展开沟通。”
逐渐地,这些工程师们开发的机器学习技术开始出现在谷歌的热门产品中。由于视觉和语音识别以及翻译是机器学习的主要领域,也就难怪这项技术成为谷歌语音搜索、翻译和Photos等服务的重要组成部分。迪恩表示,随着他和他的团队对机器学习的理解逐步深入,他们开始以更具野心的方式探索这项技术。“我们之前或许会在系统的组件中使用机器学习技术,”他说,“现在则会使用这项技术替代整套系统,而不是为每一个组件设计更好的机器学习模式。”迪恩表示,如果现在让他重新编写谷歌的基础架构,其中的很多内容都不再是预先编好的代码,而是后期学习而来的。迪恩更为人所知的身份是Bit Table和MapRece等革命性系统的联合创造者。
谷歌大脑联合创始人格雷格·考拉多正在和多个团队协作,将人工智能转化成为自己的软件。谷歌大脑联合创始人格雷格·考拉多正在和多个团队协作,将人工智能转化成为自己的软件。
机器学习还能够实现一些原本无法想象的产品功能。2015年11月推出的Gmail自动回复便是其中之。这项功能源自谷歌大脑项目联合创始人格雷格·考拉多(Greg Corrado)与Gmail工程师巴林特·米克洛斯(Bálint Miklós)之间的一次对话。考拉多之前曾经与Gmail团队合作使用机器学习算法探测垃圾信息,归类邮件内容,但米克洛斯提出了一些更激进的建议。能否利用机器学习技术自动生成回复邮件,省去移动用户在狭小的键盘上输入文字的繁琐过程。“我大吃一惊,因为这个建议太疯狂了。”考拉多说,“我后来想,借助我们一直以来都在研究的预测性神经网络技术,或许的确可能实现这种功能。一旦我们意识到这是一个机会的时候,就必须去尝试一下。”
为了提高成功概率,谷歌让考拉多和他的团队与Gmail部门展开了密切合作。这种派遣机器学习专家进驻产品部门的做法如今已经越来越普遍。“机器学习既是科学又是艺术。”考拉多说,“这就像烹饪——没错,烹饪过程发生了化学反应,但对于真正对烹饪感兴趣的人来说,必须要学习如何搭配手中的食材。”
传统的人工智能技术在理解语言时,需要将语音规则嵌入系统,但在这个项目中,系统可以利用现代化的机器学习技术,借助足够的数据像儿童一样自学。“我的语言能力并不是从语言学家那里学来的,而是通过听别人说话学来的。”考拉多说。但真正令智能回复变得切实可行的,是它的成功很容易定义——他们的目的不是创造一个妖艳的虚拟斯嘉丽·约翰逊(Scarlett Johansson),而是希望它能回复真正的电子邮件。“这项服务的成功标志是,系统可以生成一个对用户有用的备选回复,以便用户能够真正使用这些内容。”他说。因此,只需要知道用户是否点击了系统推荐的回复内容,便可对其进行训练。
但当该团队开始测试智能回复时,用户却注意到了一些怪异的事情:它经常会推荐一些不合时宜的暧昧语言。“其中一个比较失败的情况是:只要系统感觉困惑,它就会说‘我爱你’。”考拉多说,“这并不是软件漏洞,问题出在我们让它做的事情上。” 这个程序已经了解了人类行为的一些微妙之处:“如果你感到担忧,那么说一句‘我爱你’是一种很好的防御策略。” 考拉多帮助该团队压制了系统的热情。
去年11月发布的智能回复取得了巨大成功——Gmail Inbox应用的用户现在可以直接从系统提供的三条备选内容中选择一条进行回复。由于系统提供的回复内容非常切题,用户经常感到惊讶。在通过该应用发送的回复信息中,有十分之一都是由机器学习系统生成的。“这个项目能够成功还是令我感到有些惊讶。”考拉多笑着说。
类似于智能推荐这样的例子还有很多,它们都充分说明机器学习系统在谷歌业务中发挥的作用。或许最终的拐点是当机器学习成为搜索的一个必不可少的组成部分时——作为谷歌的旗舰产品,搜索几乎为该公司贡献了所有营收。多年以来,由于搜索引擎对谷歌过于重要,所以始终没有融入机器学习算法。“由于搜索在公司内部占据的份额巨大,高级管理者深度参与其中,所以很多人都怀疑我们无法真正取得进展。”迦南德里说。
其中部分阻力源自文化因素——必须要让那些有极强控制欲的程序员适应带有禅宗韵味的机器学习模式。长期掌管谷歌搜索业务的阿密特·辛格(Amit Singhal)曾是传奇计算机科学家杰拉德·萨尔顿(Gerald Salton)的助手。萨尔顿在文档检索方面的开创性工作启迪辛格帮助谢尔盖·布林(Sergey Brin)和拉里·佩奇(Larry Page)把研究生时期编写的代码,扩展成了可以适应当今网络时代的程序。(这使得他成为了“检索派”的一员。)
他从20世纪的方法中梳理出了令人惊讶的结果,但如果要将机器学习系统整合到关系谷歌命脉的复杂系统中,他却持怀疑态度。“进入谷歌的前两年,我负责搜索质量,试图用机器学习来改进排名。”大卫·帕布洛·科恩说,“结果发现阿米特的团队是全世界最优秀的,我们把阿里特脑海中的所有内容都变成了硬编码,以此实现进步。已经找不到比他更好的方法了。”
到2014年初,谷歌的机器学习大师们认为需要改变现状。“我们与排名团队展开了一系列讨论。”迪恩说,“我们认为至少应该尝试一下,看看能不能有一些收获。” 他的团队所设想的那个实验最终成为了搜索的核心:文件排名与搜索请求的匹配程度有多高(需要以用户的点击为衡量标准)。“我们跟他们说,可以用神经网络计算额外的分数,看看到底有没有用。”
答案是:确实有用。这套系统如今已经成为谷歌搜索的一部分,被称作RankBrain。它于2015年4月上线。谷歌还是像以往一样对如何改进搜索讳莫如深(究竟是与长尾理论有关?还是更好地解读了模糊不清的搜索请求?),但迪恩表示,RankBrain“融入到每一个搜索请求中”,虽然未必会影响所有的排名,但的确对很多搜索请求的排名都产生了影响。另外,实际的影响幅度也很大。在谷歌计算排名时所使用的数百个信号中(这些信号可能包括用户所在的地理位置,或者页面标题是否与搜索请求匹配),RankBrain现在的用途排名第三。
“我们成功利用机器学习改进了搜索结果,这对公司来说意义重大。”迦南德里说,“这引发了很多人的关注。” 华盛顿大学教授佩德罗·多明戈斯则给出了另外一种说法:“检索派与机器学习派始终都存在斗争。机器学习最终赢得了胜利。”
内部培训
谷歌面临的新挑战是如何让所有工程师都熟悉机器学习。还有很多公司也都秉承着相同的目标,其中最引人关注的当属Facebook,该公司与谷歌一样着迷于机器学习和深度学习。这一领域的毕业生变得非常抢手,而谷歌正在努力保持对毕业生的吸引力:学术圈多年以来都流传着一个玩笑:即使不需要顶尖学生,谷歌也会招聘他们,避免人才被竞争对手抢走。(这个玩笑的错误之处在于,谷歌的确需要这些人才。)“我的学生无一例外都得到了谷歌的录用通知。”多明戈斯说。目前看来,竞争的激烈程度有增无减:就在上周,谷歌宣布将在苏黎世开设一个新的机器学习实验室,有很多工作岗位有待填补。
但由于学术项目尚未培养大量机器学习专家,为员工提供在职培训面成为了必要措施。但这却并非易事,尤其是对于谷歌这样的公司而言。这里有很多世界顶尖工程师,他们一生都在研究传统的编程方式。机器学习却需要截然不同的思维模式,精通编码的工程师之所以能有如今的成就,往往是因为他们希望完全控制一套编码系统。机器学习还需要掌握一些数学和统计学知识,但是很多程序员却对此不屑一顾的,即便是那些能够写出超长代码的超级黑客也不例外。
克里斯汀·罗伯森的职责是在机器学习方面孵化谷歌内外的人员。克里斯汀·罗伯森的职责是在机器学习方面孵化谷歌内外的人员。
这还需要一定程度的耐心。“机器学习模型不是静态代码——你需要不断为其提供数据。”罗伯森说,“我们一直在不停地更新模型,而且还要不断学习,增加更多数据,调整预测方式。它就像是一个有生命的东西,这是一种截然不同的开发模式。”
“这是一个使用不同的算法进行实验的学科,需要挑选那些真正适合使用场景的训练数据。”迦南德里说。尽管他也是新的搜索业务主管,但却仍然把在谷歌内部传播机器学习理念作为自己工作的一部分。“计算机科学那一部分不会消失,但需要更加关注数学和统计学,而对数十万行代码的关注度则需要相应地降低。”
至于谷歌所担心的障碍,完全可以通过明智的在职培训来解决。“归根结底,这些模型中使用的数学原理并不那么复杂。”迪恩说,“谷歌聘用的多数软件工程师都可以掌握。”
为了进一步帮助不断扩容的机器学习专家团队,谷歌开发了一系列强大的工具,帮助他们选择合适的算法训练模型,加快培训和提炼过程。其中最强大的是TensorFlow,它可以加速神经网络的构建过程。TensorFlow源自谷歌大脑项目,由迪恩和他的同事拉加特·芒格(Rajat Monga)共同发明。它能把构建系统过程中涉及的晦涩难懂的细节变成标准化的内容——尤其是在谷歌2015年11月开始将其开放给公众后,这种做法的效果更加得以显现。
尽管谷歌煞费苦心地将这种行为描述为一种无私的举动,但该公司也承认,如果新一代程序员都能熟悉该公司内部的机器学习工具,那对谷歌未来的招聘活动将会起到莫大的帮助。(质疑者甚至指出,谷歌的TensorFlow开源项目是为了追赶Facebook,后者已经在2015年6月公布了早期机器学习系统的深度学习模块Torch。)不过,TensorFlow的功能以及谷歌的开源模式很快受到了程序员的欢迎。迦南德里表示,当谷歌首次提供TensorFlow课程时,共有7.5万人报名参加。
但谷歌仍为自己的程序员保留了很多好东西。该公司在内部拥有一套更加优秀的机器学习工具——Tensor Processing Unit(以下简称“TPU”)。他们虽然使用这项创新已经多年时间,但直到最近才对外宣布。这是一种针对机器学习程序优化的芯片,就像GPU是专门针对图形处理优化的芯片一样。该公司的庞大数据中心里使用了数以千计的TPU(具体有多少恐怕只有上帝和佩奇才知道)。通过赋予神经网络这种超级计算能力,TPU为谷歌带来了巨大优势。“如果没有它,我们就无法实现RankBrain。”迪恩说。
但由于谷歌最需要的还是设计还提炼这些系统的人才,他们也在不断尝试各种方式来为工程师提供机器学习方面的培训。这些培训的规模各异,其中也包括为期两天的速成班。谷歌希望这只是初步尝试,工程师随后还会寻找更多资源来深入学习。“已经有数千人报名参加下一次课程。”迪恩说。
该公司还在通过其他一些措施,为外部人才提供机器学习培训。今年初春,谷歌启动了Brain Residency项目,利用谷歌大脑项目为有潜力的外部人才提供了为期一年的集训。“我们称之为你的深度学习职业生涯的开端。”罗伯森说,他负责协助管理这个项目。尽管这27名来自不同学科的机器学习学员中,可能有一些会留在谷歌,但他表示,该公司的目的是让他们自行发展,利用自己掌握的先进知识在世界各地传播谷歌的机器学习技术。
前景广阔
当今时代,机器学习正在逐步走上中心舞台,而谷歌则希望以人工智能公司的身份继续占据主导。所以,从某种意义上讲,卡森·霍尔盖特在忍者项目中学到的知识正是这一计划的核心所在。
她的课程最初是一个为期4周的新兵训练营,由谷歌最先进的人工智能项目产品负责人提供指导,教给他们如何将机器学习融入项目中。“我们把忍者带进会议室,格雷格·考拉多站在白板前解释LSTM(长短期记忆,一种可以打造强大神经网络的技术)。他做着夸张的手势,讲述这种系统的工作方式、利用何种数学原理、如何应用于实际。”罗伯森说,“在最初的4个星期里,我们几乎用到了我们的所有技术和所有工具,为的是给他们带来切身体会。”
霍尔盖特从新兵训练营毕业了,她现在正在使用机器学习工具开发一款Android通讯功能,帮助谷歌员工彼此交流。她正在调整超参数,清理输入数据,去掉停止词。但她已经不可能回头,因为她知道人工智能技术就是谷歌的现在和未来,甚至可能是所有技术和所有东西的未来。
“机器学习时代已经来临,”她说,“前景无比广阔。”
㈡ 乔治华盛顿大学计算机专业人工智能方向研究生怎么样毕业后在美国找工作容易吗
乔治华盛顿大学工程与应用科学学院(School of Engineering and Applied Science)成立于1884年10月1日,当时的名称是Corcoran科学学院。在1962年,学院从哥伦比亚学院独立出来。它是第一个在工程领域接受女性学位申请人的学院,同时也是全美授予女性工程学博士学位最多的学院。火箭筒是于1942年在学院中发明的。
学院自建立以来,一直强调“要引领科技的发展”的原则。在最新2015年USNEWS工程学院排名中乔治华盛顿大学位居全美第90位。
学院下设5个科系及将近20个研究生学位项目,所有系都提供涵盖学士、硕士和博士的学术学位及职业学位和专业认证。
• 土木和环境工程系(Department of Civil and Environmental Engineering)
• 计算机科学系(Department of Computer Science)
• 电气与计算机工程系(Department of Electrical and Computer Engineering)
• 工程管理和系统工程系(Department of Engineering Management and Systems Engineering)
• 机械和航空航天工程系(Department of Mechanical and Aerospace Engineering)
• 生物医学工程系(Department of Biomedical Engineering)
学院的战略重点为生物医学工程,信息科技和通讯以及安全可靠性 运输。由于学院地处“北弗吉尼亚科技走廊”地带,同时也是美国最密集的科技产业带之一,学生可以接触到从世界级的科学家到前沿科技的决策者这样的技术变革者,以及像国家科学基金会、美国航空航天署太空飞行中心、海军科研实验室、国会图书馆这样的支持性组织。
在校生可出席或参加当地的“研究和发展展览会”,参加“美国科学工程节”活动,共同庆祝科学和工程方面的新进展。毕业生有机会获得在LG电子公司、美国宇航局、波音公司、微软公司等世界知名企业的就职机会。学校还会安排学生进入微软、Hyundai公司、3M公司实习。
㈢ “人工智能”,“大数据”+教育如何驱动教育的未来
近日,由论答公司主办的教育大数据研讨会在北京举行,讨论会主题为“大数据+教育,有哪些可能性?”。本次研讨会主要关注数据在教育领域的应用,具体包括自适应学习、学习数据分析和教育数据挖掘。来自宾夕法尼亚大学、人民大学、华中师范大学的专家和企业界代表,共同探讨了教育大数据和自适应学习领域的技术趋势和产业机会
Ryan Baker是国际教育数据挖掘协会(International Ecational Data Mining Society)的创始人、《教育数据挖掘》杂志(Journal Ecational Data Mining)主编,在各类期刊和会议发表了260余篇学术论文,先后主持了美国科学基金会(National Science Foundation)、盖茨基金会(Gates Foundation)等研究基金的多项重大项目,累计获得研究经费超过1600万美元。
他也在哥伦比亚大学教育学院和爱丁堡大学同时担任教职,他在Coursera和edX上开设的“Big Data in Ecation(教育大数据)”课程,有来自100多个国家和地区的学生注册。
研讨会现场,Ryan Baker通过远程视频,分享了他对教育大数据的体验和应用。据他介绍,目前在教育大数据领域主要有四大研究组织,分别研究人工智能与教育、教育数据挖掘、学习数据分析和大规模学习。
Ryan Baker表示,在教育领域广泛应用大数据的时代正在到来。教育数据挖掘有很多的应用方向,包括:预测学生是会辍学,还是会成功完成学业;自动检测学生的学习投入程度、情感、学习策略,以更好地达到个性化;给教师和其他相关人员提供更好的报告;教育科学的基础研究和发现。
他认为,个性化教育至少要做到三件事情:
1、确定学生的有关数据;
2、了解对于学生的学习来说什么是真正重要的;
3、有针对性地为学生提供合适的教学。
而通过教育数据挖掘,我们可以推断很多事情:
学生的元认知和求助。比如,这个学生有多自信?当他需要帮助时,有没有在寻求帮助?他有没有在给自己解释问题,有没有思考这个答案是正确的还是错误的?最重要的,当他面临挑战时,能否坚持下去?
没有投入学习的行为。比如,“玩弄”系统,为了找到正确的答案,有的学生会试各种不同的答案,从“1”试到“38”。粗心,本身会做,但是不用心,最后给出的答案是错的。有些孩子会做非常难以解释的行为,比如不用方程符号,而是画了一个笑脸。
学生情感。Baker的研究团队和其他研究团队,已经创造了研究模型,可以根据数据推断,学生是否感到厌倦、沮丧、困惑、好奇、兴奋、快乐,是否投入,等等。
长期的学习结果。比如,学生能够记住刚才他学的东西吗?学生准备好学习下一个主题、下一个知识没有?中学生能上大学吗?他会从大学毕业还是辍学?
Ryan Baker表示,要获得这样的推断,只需要学生与系统交互的数据,不需要学生戴上头盔检测器。目前,这些模型已经开始大规模应用于自适应学习,应用于几十万的美国学生。Ryan Baker列举了一些自适应学习系统的案例。
Knewton
通过系统决定学生下一个要学习的问题是什么,已在全球的多个领域多个学科中运用。
ALEKS-ALEKS
用的是先行知识结构和知识点模型,来选择最适合学生的学习材料。比如,一个学生在学习上出现了问题,系统能够检测出来,是以前学的知识点出了问题,然后让学生回到以前的知识点上去学习。ALEKS系统应用于美国高中、大学的数学、科学学科。
Cognitive Tutor
系统能自动检测学生的知识,直到学生掌握为止。比如,系统不会让学生学习下一步的知识,直到他展示出他已经学好了他现在正在学习的知识。系统能够给学校提供数据报告,学校根据报告能够更好地让学生投入到学习中去。每年大约被50万的美国初高中生用于数学学习。
论答
论答公司的系统与ALEKS的系统有些类似,也是用先行结构和知识点模型,选择合适的学习材料。同时也是自动检测学生的知识状态直到学生掌握为止。应用领域目前包括数学和英语,完全针对中国学生开发。
Reasoning Mind
用各种自动检测的模型来检测老师的教学是否有效。通过数据生成报告给每个地区的教学管理员,让他们找到方法帮助老师提高教学。主要是用于美国的小学数学。
Duolingo
自动检测学生记忆,来决定什么时候回顾已经学过的知识。在全世界范围内应用于外语词汇的学习。
其他的像Civitas,Course Signals,Zogotech都是地区供应商,运用风险预测模型提供行动信息预测。它们会对学生做出预测,可能学不好、会失败,把报告提供给老师。已在世界范围内的大学应用。
Ryan Baker指出,在这些系统中,有足够的证据证明,至少以下两个系统是非常好的。
1、胡祥恩教授在美国做了大量实证研究,证明ALEKS系统对于帮助学生学习是有效的。他的研究证明,ALEKS系统对于不同人群的学生是同样有效的;特别值得提出的是,ALEKS可以帮助少数人群群体提高学习成绩。
2、Ryan Baker本人领导的研究团队与论答公司合作的研究表明,学生通过论答系统学习,比通过传统的在线学习系统学习,效果更好。他们在中国3个不同的地区做的3次实证研究,都证明了论答系统的有效性。
Ryan Baker分析了教育大数据算法模型的潜在发展方向。他认为,这些模型的长期潜力是,通过学生的知识和学习模型来确认,学生什么时候需要更多的支持:
首先是“mastery learning”,学生在掌握一个知识前,不会让他去学习下一个知识。当学生需要支持的时候,自动介入;同时告诉老师和父母,这个学生什么时候需要支持。
通过学习投入程度模型判断,学生什么时候开始变得厌倦、沮丧了,并调整学习活动,让厌倦的学生不再厌倦,让沮丧的学生的学习变得更容易一些。
学习投入程度模型还可以检测,在线学习中,什么样的学习活动,能让学生更容易地投入进去,并最终发现,什么样的学习活动对学生更好、对什么样的学生更好。
这样的模型也能告诉老师和父母,学生什么时候开始变得不再投入学习了。
还可以运用学习模型确认,学生什么时候没有真正学会,需要更多支持。
最后,Ryan Baker指出,下一步的目标是优化之前已经验证的经验和方法,然后把它们运用到系统中,最终让中国和世界上的数十亿学生受益。
讨论:“因材施教”的千年理想该如何照进现实?
王枫博士,论答公司(Learnta Inc.)创始人兼CEO
胡飞芳博士,美国乔治华盛顿大学(George Washington University)统计学终身教授,中国人民大学统计与大数据研究院的教授
胡祥恩博士,美国孟菲斯大学(University of Memphis)心理系、计算机科学系、计算机工程系终身教授,华中师范大学心理学院院长
马镇筠博士,论答公司联合创始人兼首席数据科学家
辛涛博士,北京师范大学中国基础教育质量监测协同创新中心常务副主任、博士生导师,兼任国家督学、教育部基础教育课程教材专家工作委员会委员、中国教育学会学术委员会委员。
技术发展到今天,“因材施教”如何实现?
王枫:因材施教,我首先到的是,每位学生学习的内容都不一样。如果有新的技术或者系统,系统应该像一个好老师一样,不会头疼医头脚疼医脚。比如说,一元二次方程做错了,好老师不会简单说一元二次方程做错了,你继续再做十道一元二次方程的题目,这其实是很差的老师,他没有真正去全面评判学生,到底是哪些掌握好、哪些掌握不好。
一个好的老师可能会说,我全面地看了你整个学习,可能你的问题不是出在一元二次方程上面,老师看了你做的题目,一元一次方程没有掌握好、因式分解也没有掌握好,你继续做一元二次方程是浪费时间。这就是从系统角度来说,系统做到了根据每个学生最基础的先行知识点的结构,给你提供最适合你当前学习的知识点,题目也好、视频也好、还有其他各种各样的学习内容。
胡飞芳:因材施教是我们教育的理想状态。孔子很早提出因材施教,在他当时的历史环境里面,因材施教可能更多是个体性的,因为那时学生少、老师也少,因材施教相对比较容易做到。
随着历史的发展,我们有更多的人需要教育时,我们做的一件事情是什么呢?就是做了一个标准化。标准化做的是什么?课堂教育。课堂教育从某种意义上来讲是标准化。现在这个历史阶段,教育大数据可能真正要做到的就是因材施教,自适应学习本身想做的也是这个。
胡祥恩:因材施教事实上在学习理论里有两个:一个是outerloop“学什么”,一个是innerloop“怎么学”。用技术来细化因材施教是教育产业走向成熟的一个标志。但是这个路非常非常难,因为“怎么学”那个层次非常非常难。
马镇筠:“因材”代表认识到学生的个体化差异,“施教”指进行差异化教学,这是根本思想。但如果考虑到时代背景,孔夫子时代专注的是学生的职业发展方向,也就是说,把适合当政治家的培养成政治家,把适合当学者的培养成学者。现在再提因材施教,我们其实能做得更多、更精细化。
比如,“因材”,对“材”的分类不仅是职业方向,还会考虑到学生的学习状态、学习目标、潜在能力、兴趣偏好等。而且,传统意义上的因材施教考虑的是学生个体间的差异,没有重视学生本身状态是在发生变化的,学生在不断学习,状态甚至兴趣各方面都可能发生变化。
但这些是自适应学习能够做到,甚至比传统的因材施教做得更好的地方。再说到“施教”,现在我们能做的几件事,包括学习路径推荐,给不同的学生匹配他最合适的学习内容,这种非常精细化的层面,我们已经有了一定的技术积累。
怎么判断一个产品做到了真正的自适应?
马镇筠:大多数产品的学习过程可以分为测、学、练,可以从这三个环节去看这个产品做到什么程度。
测,各种学习机构都有测评。但是国内只有论答团队第一个做出来能够在几十道题内,精准判断你一百个知识点,哪21个没掌握,哪79个掌握了。市场上大部分竞品,只会告诉你,知识点掌握率或者分数,79分或者知识掌握率达到79%;或者一些其他维度的总结,比如逻辑思维能力比较强、阅读的磨炼技巧比较好、学习动力哪方面稀缺。他们做了降维,本来很复杂的学习状态这样说出来,相对比较容易实现。但如果要做到具体告诉你,哪些知识点掌握、哪些知识点没掌握,这个难度就高很多了。
关于学习路径推荐的话,很多题库类的软件,知识点学完之后,会给一些题目推荐,但真正实现路径推荐的很少很少。路径推荐也是很核心的,有20个知识点没掌握,先学哪个知识点,后学哪个知识点,学习顺序是非常关键的,必须遵循循序渐进的原则,哪些知识点是前提知识点,哪些知识点是后续知识点,随机给你知识点去学习的话不能起到最好效果。真正到了练或学的环节,推荐什么样的视频,先推视频还是先推文字讲义,推简单题、中等难度题还是复杂题目,都需要根据学生实际情况来决定。
刚才只是举了几个例子,具体涉及到背后的算法、整个系统跟学习内容的结合以及整个教学流程的实现,中间很多环节必须要打通,形成一个闭环,才能对最终的结果负责。
辛涛:我的研究领域是教育和心理学的测量和评价。我个人的学术观察,基本上在现代这领域是两个类型。一个是心理测量领域,有一套成熟的方法,包括早期的IRT(Item Response Theory)和现在的ADT。另外一个是人工智能检测。心理测量系统,是一小群人在做;人工智能化是大的方向,现在是显学,给大家提供了明显的可能性。重要的是,那些背后的算法,能够在企业里真正实现出来。现在可能很多算法已经在那儿了,大体上路径是通的。
自适应学习基本上是把学习和评价联动起来了。因为,要自适应学习,必须有一个系统随时看到学生学到什么程度,这个完全是评价。但是,评价完了之后有一个新的呈现。这一块现在已经有一些很成熟的一些东西了,但不是一时半时可以说得特别具体的。
我做教育的测量和心理测量,人工智能那块我不熟。但是,从教育测量角度来说,在自适应学习和新技术结合之前,很大一块还是自适应考试,CAT(computer adaptive test)。系列化产生一个CAT变成了一个自适应学习的过程。总的来说,使用最简单、最机械化的方法,连续的CAT实际上是可以破解一个学习过程的。
测评本身经历了好几个阶段,通常用三个应用介词表示。
accessment to learning and teaching;
现在国家倡导的,accessment for learning and teaching,测评要对学习和教学有帮助;
跟信息化结合,accessment as learning and teaching,它是学习提供的完全融合的一个环节。
王枫:什么样的自适应学习系统才是真正的高级自适应学习系统?在中国的落地到底是怎么样才能真正落地?我在马博士的基础上想补充一点。
自适应系统如果一定要分级,也可以简单分一下。一种最基础的系统是基于规则的,比如说埋点。一个学生做10道一元二次方程题目,我预先埋好了,你做错了,立马给你推五道一元一次方程题目、五道因式分解题目。这个是埋点埋好了,这是规则,预先由老师或公式设置好了。
但这个规则有用性是非常有限的,因为每个学生不一样,A学生是因为一元一次方程不会,B学生可能是因式分解不会,C学生可能连小学的乘法快速运算都不会,这个没法预先直接埋点准备好。
所以自适应系统真正到了更高级一点的话,一定是真正通过大数据、根据算法模型来分析学生的学习数据,匹配下一步应该学什么。
在中国,自适应学习有效应用于教学有三个前提条件。做到这三点,自适应学习在中国的教育里面前途无限。
好的产品。必须要有针对中国本土化的自适应学习产品,把它开发出来。像ALEKS系统的确算法不错,但里面连一套国内的高考题都没有,家长不会让小孩子用这样的系统,因为直接影响应试目标。真正本土化开发的话,没有一成不变的算法,世界上最好算法就是没有开发出来的。教育非常复杂,每个学科不一样。比如数学后台有强大的关系,先行后续关系;英语没达到数学这么强的相关性,但算法是一样可以应用的。
好的学生、家长、老师。有了好的产品,首先学生应该真正投入进去学习。像Ryan Baker教授讲的,学生如果随便学一下,再好的系统也没用。第二,家长得督促孩子学习。第三,老师非常重要。老师应该做有价值的事情,比如给学生做个性化的辅导答疑,给学生针对性的讲解,组织学习活动小组,鼓励学生发挥创造能力,领导能力的培养。
学校以点带面。学生大部分时间都在学校里面学习。如果学校里最基本的、有效的在线教学产品都不应用的话,其实是有问题的。但是改变绝对不是简单的行政命令可以解决的。一个好的产品,一定是从点到面,逐步推广。自适应学习,更适合有明确目的的学习,像应试教育这块可以做得更好。所以学校可以应用进去。
胡祥恩:我觉得大家做自适应也好、因材施教也好,比较好的例子大家可以看一看。教育这个领域有多大,自适应概念就该有多宽。所以说,实验室里面有很多小的做得非常非常好的东西,只是没有到市场上面去,有很多非常非常巧妙的算法、一些东西。你会发现很多欧洲的、美国的实验室做的system,我每次看了都有种,自己是坐井观天的感觉。
怎么看待人工智能在教育中的应用?
胡飞芳:AlphaGo跟master,谷歌做了一个非常好的广告,人工智能在某些方面可以做得非常好。但是,我现在给你们讲另外一个谷歌自己不会去说的例子,但这也是事实。2008年、2009年的时候,谷歌推出一个免费产品,用各种搜集到的数据,预测美国的流感发展趋势。开始时很成功,预测跟实际发生的情况很相似。但到2015年,他自动撤回去了,不再提供预测。因为在2012跟2013年预测的时候,预测结果跟实际情况相差非常远。
这说明像这种不确定性的问题,人工智能还有非常大的局限性。一旦有不确定的数据,就有噪音。数据量很大时,大数据可能产生大噪音。怎样使噪音下降?2015年一个哈佛教授的研究团队在谷歌的基础上,用谷歌的数据去做同样的预测。他用了什么呢?就是用了模型,实际上模型在很多时候降噪是很有用的,用模型去预测,而不完全是人工智能的方式去预测。结果,他做出来的预测基本都比较准。
人工智能相对比较成功的,是比较确定的问题,所谓的确定是不管有多少种可能性,还是一个确定的东西。而流感很多时候是完全不确定的因素。
教育其实很多时候也是不确定的。同样一个人,现在让他回答这个问题,他可能思路清楚地回答出来;过了一个小时后,即使是同样类型的问题,按道理他应该回答出来,结果他回答不出来。这是说,实际上有很多因素在干扰的时候,人工智能的功能是不是会减少一点。把模型跟人工智能加在一起,会弥补人工智能在某些方面的弱点,这样会更好。
怎样促进商界和学界的交流,更好地把学界已经有的一些成果,运用到市场上来?
胡祥恩:教育产业应该是一个最大的产业,教育产业事实上是一个知识产业链。到目前为止,很多人认为自己要做一整套系统而在美国汽车业,最赚钱的是供应商,是做轮胎、做玻璃的。一旦标准化之后,一个人如果螺丝钉生产得最好,他就能够养活几家人、几代人。
到目前为止,美国推的就是教育标准化,教育内容的标准化、教育技术的标准化。比如说97年的时候,就说怎么样把内容标准化,你做的东西我可以用。我只是做整个教育知识产业链里面一个小块,做得很好。教育整个的产业链,有可能发挥特别特别技巧的那些小的公司,就能够在这个产业链里面生存、可以做得很好。第一个是要标准化,第二个要理解整个教育是一个产业链。
㈣ 美国科学家研制出如何用脑电波来控制机器人
戴上一顶共有32个独立的电极与大脑头皮接触的帽子,通过接受人脑思维产生的脑电波,机器人可完成一系列动作指令,包括捡拾物品及左右移动等。 随着人工智能技术的飞速发展,机器人的使用正变得越来越频繁,让人类逐渐从体力劳动中解放出来,美国科学家正试图让机器人来完成我们心中的想法。美国华盛顿大学教授拉杰什·瑞奥展示了他们最新研制成功的脑电波控制机器人。演示者戴上一顶特制的帽子,这顶帽子上共有32个独立的电极与大脑头皮接触。通过接受人脑思维产生的脑电波,这台机器人可以完成一系列动作指令,包括捡拾物品以及左右移动等。灵感来自电脑研究用脑电波控制机器人的想法来自人类对相关电脑的研究。此前,一些科学家已经开发出可以用脑电波控制的电脑。研究人员借助于植入大脑运动皮层的特殊装置,帮助一名四肢瘫痪的病人用大脑操纵电脑完成某些动作。这项研究由美国马萨诸塞综合医院的利·霍赫贝格和布朗大学的约翰·多诺霍共同领导。试验对象是3年前因脊髓损伤而四肢瘫痪、现年25岁的马修·内格尔。研究人员把特殊的电脑芯片植入内格尔的大脑运动皮层,使他能用脑电波查看电子邮件,操控电视,移动辅助机械臂。植入内格尔大脑运动皮层的芯片有4平方毫米,上面有100个电极。内格尔想着他要完成的动作时,100个电极传感器开始记录大脑活动,把这些信号传递给电脑,通过电脑解码和处理后最终转化为运动指令。患者用思维完成任务如果人脑能控制电脑,控制起机器人来就顺理成章了。科学家们只需要通过可进行扫描大脑皮层的感应电极,便可接收并解读患者脑部发出的信号。机器人通常都是按照事先设计好的程序执行任务,而这种新型机器人则完全可根据人们的想法迅速地自行制定新的行动程序。通过接受人脑思维产生的脑电波,机器人可以完成一系列动作指令,包括捡拾物品并把它们拿到另一目标桌子上,机器人还可以左右移动。研究人员把实验用的桌子和物品摆放在机器人前面,机器人通过计算机视觉系统找到桌子的位置,辨认桌子上的物品。发现物品画面被传送到人脑-计算机界面,操控者戴上一顶特制的电极帽控制机器人,这顶帽子上共有32个独立的电极与大脑头皮接触。操控者把注意力集中在需要机器人拾起的物品上。在演示过程中,科学家们还尝试将操控者与机器人分隔在两个不同的房间内,利用脑电波扫描仪,机器人同样可以接受人脑发出的信号指令,并做出各种正确的动作。随心所欲指挥机器人人们买来什么新电器,都要看懂复杂的说明书才能使用,而且有些电器(比如电脑)使用起来还需要不断学习。在不久的将来,人类将完全摆脱这种束缚,实现用大脑控制机器人。并且,人们对机器人的操作将更快速更精确。你脑中想到什么,机器人就会帮你去做。当然,如果你想什么机器人就做什么,那世界会变得很混乱,因为人的思绪很快,很混乱,机器人不可能完成大脑的每一个想法。这需要增加“开启”和“确认”两项功能,我们需要机器人完成我们的想法时我们才开启机器人,机器人接受到任务后会询问你是否真的需要完成,如果你再一想觉得那事没有必要做,机器人就不会去做。另外,也有人会担心机器人会完成人们的坏心思,比如我恨某人,恨得想杀了他,那么我们是否可以借助机器人来杀人呢?我们完全不必担心。未来的法律是会惩罚利用机器人杀人的犯罪分子的,利用机器人杀人等同于现在利用刀枪杀人。而且,接通脑电波的机器人出厂时已经输入了整部法律,“正版”机器人不会执行主人的违法想法。 更多新技术、新产品,尽在科技趋势频道>>
㈤ 大众侃车到千城数智 背后是汽车大数据的野心
2017年11月16日, 大众 侃车发布了主题为"数字生活,智领未来"暨"千城数智2018战略",大众侃车也正式更名为千城数智( 北京 )网络科技有限公司。来自美国硅谷、亚马逊等大数据科学家、中美汽车行业大伽、中美主流媒体和汽车大数据发烧友120多人莅临现场,见证了这一重要时刻。
千城数智2018战略包含品牌战略、企业战略、市场战略、用户战略、服务战略、人才战略和竞争战略,剑指"汽车用户及行业大数据"。
据创始人郭登礼博士介绍,2018年千城数智将在全球建成三大汽车大数据中心,即:以人才为核心的北美西雅图汽车大数据实验室,以分析和处理为目标的重庆大数据中心,以运用和转化为方向的北京大数据营运中心。同时千城数智将围绕全国18个省三四五线城市布局与营运,通过现有品牌市场占用率,用户消费趋势和能力的分析,以精准的数据分析结果引进到产品和营销内容对接用户,链接用户,服务用户,帮助用户解决购车痛点,从而提升和提速用户在消费效率上的转变。
发布会上,千城数智与北美中文传媒集团(AC MG )签订了"千城特卖落户美国"的战略合作协议。据ACMG 总裁 白雪枫透露,协议包括千城特卖落户美国、在西雅图建立汽车大数据实验室等一系列内容。
与会汽车企业嘉宾表示,大众侃车&千城特卖创新的营销模式已经解决了渠道下沉的痛点,今天又发布品牌升级战略,借助互联网、大数据和人工智能能节约营销成本,体验、服务更到位。
品牌升级,汽车大数据独角兽的野心
据介绍,千城数智定位于汽车大数据营销智库,立足国内、瞄准国际,以汽车产业为基,掌握大数据资源,提供泛汽车服务,最终为用户提供智慧汽车生活服务,新的战略目标是汽车大数据独角兽。
千城数智顾问、美国密苏里大学博士、华盛顿大学教授、大数据和人工智能科学家何晓锋说,千城数智已有大规模的基础数据,并将逐渐布局到北美和东盟等国家和地区,加上已在全球大数据及人工智能之都西雅图建立汽车大数据实验室,有望在未来两三年成长为汽车营销大数据的"独角兽"。
营销升级,数据收集和营运的典范
过去两年,大众侃车通过旗下各产品和平台搜集到了大量用户数据。包括:千城特卖的400callceter+10万购车经纪人+每年300场以上的O2O周末车展+全国210家汽车连锁生活体验馆+1900个加盟店(场景营销);和衍生数据,如汽车生活+汽车金融+汽车置换(保险和个人消费贷款)。其中,数据增量最快的是"千城特卖"以三四五线城市为主的2万个购车经纪人,这些经纪人每周都有3—5次获得汽车潜客的机会。
其次,千城数智正在整合和挖掘的数据包括网络+今日头条+滴滴/京东+大众侃车网+千城云媒(7000家)+北美中文网等。"千城特卖"落户美国及东盟等国家和地区,不仅会丰富数据样本,也会有小规模数据增量。
海量大数据有什么用途?据郭登礼博士介绍,这将有助于解决用户在汽车消费中的决策效率和汽车企业的销售转换效率问题;从价格、信息、配置、保险、养护等方面提供数据支持,保证精确信息的投递,提高信息价值;对未来全球品牌在中国市场的发展提供精准数据及数据分析、决策支持服务;对车辆的个性化定制,智能化解决方案提供数据支持和决策基础;为汽车金融服务提供精准客户信息。这正是西雅图汽车大数据实验室要解决的问题,也是将实验室建在全球大数据、人工智能之都的原因,因为那里不缺人才,不缺技术,缺的只是原生数据,而这正是"千城数智"的优势。
成立仅仅两年多的大众侃车公司在给企业提供三四五线城市营销解决方案方面独树一帜,切实解决了渠道下沉难的问题,也受到了消费者的极大认可,并在资本市场获得了两轮融资,这次战略发布预示着在升级转型之后将进入发展快车道。 @2019
㈥ 怎么评价《终极算法》这本书.
无论终极算法是否存在,多明戈斯希望这个大胆的问题能够激发部分读者的好奇,甚至被这个问题吸引成为机器学习的专业研究人员。确实,每一种学科都需要至高的理想驱动向前,就如同物理的大一统理论,当无数杰出的天才为一个终极问题孜孜以求时,就算这个问题本身在这些人的有生之年可能没有答案,但是这个学科一定会因为这些伟大的探索历程取得辉煌的进步。我想,这也许是因为多明戈斯对机器学习的热爱夹带的另一个私货吧。
㈦ 什么样的人工智能击败了职业围棋手
由谷歌英国研究团队开发的计算机系统在围棋比赛中击败了职业棋手。作为一种古老的东方棋类游戏,围棋强调策略和直觉。过去数十年,围棋一直是人工智能专家未能攻克的堡垒。然而,人工智能正在这一领域取得重要突破。
此前,计算机已在其他多种比赛,例如国际象棋、奥赛罗棋和智力竞赛《危险边缘》中胜过了人类对手。然而,围棋是一种具有2500多年历史的古老技艺,其复杂程度远超国际象棋,因此人类高手此前几乎不费吹灰之力就能胜过即使最强的计算机系统。本月早些时候,谷歌以外的人工智能专家已提出这样的问题,即人工智能在围棋领域的突破能否迅速实现。而直到去年,大部分人仍认为,计算机击败职业棋手还需要10年时间。
然而,谷歌已经做到了这一点。法国研究者雷米·库洛姆(Remi Coulom)此前曾开发了全球最强大的人工智能围棋程序。他表示:“这一天的到来比我想象中更快。”
谷歌于2014年收购了自称为“人工智能领域阿波罗项目”的DeepMind。去年10月,DeepMind的研究团队在伦敦办公室里主持了人工智能与人类选手的较量。DeepMind的这一系统名为AlphaGo,而它的对手是欧洲围棋冠军樊麾。在《自然》杂志编辑和英国围棋协会裁判的监督下,AlphaGo在五番棋比赛中取得了5:0的压倒性胜利。《自然》杂志编辑坦古伊·乔阿德(Tanguy Chouard)博士在本周二的媒体电话会议上表示:“无论作为研究者还是编辑,这都是我职业生涯中最令人兴奋的时刻之一。
自然》杂志发表的一篇论文介绍了DeepMind的系统。这一系统利用了多种技术,其中也包括越来越重要的一种人工智能技术,即深度学习。利用海量的人类高手棋谱(总步数约达3000万),DeepMind的研究团队训练AlphaGo自主学习围棋。然而这仅仅只是第一步。从理论上来说,这样的训练最多只能培养出与最优秀人类选手同等棋力的人工智能。而为了击败最优秀的人类选手,研究团队使这一系统自己与自己对弈。这带来了新的数据,而这些数据可被用于训练新的人工智能系统,最终胜过顶尖高手。
DeepMind负责人德米斯·哈萨比斯(Demis Hassabis)表示:“最重要的一点在于,AlphaGo不仅仅是专家系统,遵循人为设定的规则。实际上,这使用了通用的机器学习技术,能自行探索如何在围棋比赛中取胜。”
人工智能的这次胜利并不新鲜。谷歌、Facebook和微软等互联网服务早已利用深度学习技术去识别照片和语音,或是理解自然语言。DeepMind的技术结合了深度学习、增强学习,以及其他方法。关于现实世界机器人如何学习日常任务,并对周围环境做出响应,这指明了未来的方向。哈萨比斯表示:“这非常适合机器人。”
他同时认为,这些方法能加速科学研究,通过在工作中引入人工智能系统,科学家将可以取得更多成果。“这一系统能处理规模更大的数据集,分析得出结构化信息并提供给人类专家,从而提高效率。系统甚至能向人类专家提供方式方法的建议,协助带来突破。”
不过目前,围棋仍是他的关注重点。在关起门来击败一名职业选手之后,哈萨比斯及其团队将目标瞄准了全球顶尖的围棋选手。3月中旬,AlphaGo将在韩国公开挑战李世石。李世石拥有的国际比赛冠军头衔数排名第二,而过去10年中,李世石有着最高的胜率。哈萨比斯认为,李世石就是“围棋界的费德勒”。
比国际象棋更难
2014年初,库洛姆的围棋软件Crazystone在日本的巡回赛中挑战了依田纪基九段,并取得了胜利。不过,这一胜利的成色不足:Crazystone获得了四子的让先。当时,库洛姆预言,在没有让先的情况下,人工智能击败顶尖围棋高手还需要10年时间。
这一挑战的难度在于围棋本身。此前,在合理时间内,任何超级计算机都没有足够的处理能力,去预判每种可能的着法会带来什么样的后续结果。1997年,IBM“深蓝”击败了国际象棋大师卡斯帕罗夫,当时这台超级计算机采用了“暴力计算”的方式。从本质上来看,“深蓝”分析了每一步走法可能出现的各种结果。然而,这样做在围棋比赛中行不通。在国际象棋比赛中,一个回合可能的走法平均为35种。而围棋比赛采用了19x19的棋盘,平均每回合走法有250种。哈萨比斯指出,围棋棋盘上的棋型类型要比宇宙中的原子总数还要多。
利用名为“蒙特卡洛树搜索”的方法,类似Crazystone的系统能完成更多步的预判。而结合其他一些技术,计算机可以完成对多种可能性的必要分析。这样的计算机能击败一些不错的围棋选手,但距离顶尖高手还有很大差距。对真正的高手来说,直觉是很重要的一部分。这些棋手会根据棋盘上棋型来选择如何行动,而不是精确分析每一种着法可能会带来的结果。哈萨比斯本人也是围棋选手,他表示:“良好的棋型看起来就很漂亮。这似乎遵循某种美学。这也是这一游戏数千年来历久不衰的原因。”
不过,在进入2015年之后,一些人工智能专家,包括爱丁堡大学、Facebook和DeepMind的研究人员,开始探索利用深度学习技术去解决围棋的难题。他们设想,深度学习技术能模拟围棋比赛中必要的人类直觉。哈萨比斯表示:“围棋有着许多暗示,模式匹配很重要。深度学习可以做得很好。”
自我增强
深度学习的基础是神经网络。这种由软硬件构成的网络能模拟人脑中的神经元,其运转并非依靠“暴力计算”和人工制定的规则。神经网络会分析大量数据,以从事某项任务的“学习”。例如,如果向神经网络输入足够多的袋熊照片,那么它就能识别出袋熊。如果向神经网络输入足够多的单词发音,那么它就能识别你的语音。如果向神经网络输入足够多的围棋棋谱,那么它就能学会如何下围棋。
在DeepMind、爱丁堡大学和Facebook,研究人员希望,通过“观察”棋盘棋型,神经网络能掌握下围棋的方法。正如Facebook近期在一篇论文中所说,这一技术的运行情况良好。通过深度学习和蒙特卡洛树方法的结合,Facebook的系统已经击败了一些人类选手。
不过,DeepMind在此基础上更进一步。在学习了3000万步人类选手的围棋下法之后,这一神经网络预测人类选手下一步走法的准确率达到57%,远高于之前的44%。随后,哈萨比斯及其团队对这一神经网络进行了小幅调整,使其与自己对弈,这种做法被称作增强学习。在这一过程中,神经网络可以了解,什么样的走法能带来最好的结果。
DeepMind研究员大卫·希维尔(David Silver)表示:“通过在神经网络之间进行数百万局的对弈,AlphaGo学会自己发现新策略,并逐步改进。”
希维尔表示,这使得AlphaGo能胜过其他围棋软件,包括Crazystone。随后,研究人员将结果输入至另一个神经网络。在首先判断对手的下一步行动之后,这一神经网络能利用同样的技巧去预判每一步的结果。这与“深蓝”等较老的系统类似,而不同之处在于AlphaGo能在过程中进行学习,并分析更多数据,不再使用暴力计算的方法去判断所有可能的结果。通过这种方式,AlphaGo不仅能胜过当前的人工智能系统,还能击败人类高手。
专用芯片
与大部分先进的神经网络类似,DeepMind的系统运行在基于GPU(图形处理芯片)的计算机上。GPU最初的设计目的是游戏和其他图像应用的图形渲染,但近年来研究表明,这类芯片也非常适合深度学习技术。哈萨比斯表示,DeepMind的系统在配备多个GPU芯片的单台计算机上有着相当好的表现,但为了挑战樊麾,研究人员搭建了更庞大的计算机网络,其中包括170块GPU卡和1200个标准CPU处理器。这一庞大的计算机网络对AlphaGo进行了训练,并参与了比赛。
哈萨比斯表示,在与李世石的比赛中,AlphaGo将采用同样的硬件配置。目前,他们正在持续改进这一人工智能系统。为了准备与李世石的比赛,他们还需要互联网连接。哈萨比斯表示:“我们正在安装自己的光缆。”
库洛姆和其他一些专家指出,与李世石的比赛将更困难。不过,库洛姆已经下注DeepMind。过去10年中,他一直希望开发出能胜过顶尖围棋高手的系统,他认为,这一系统现在就在这里。他表示:“我正在购买一些GPU。”
未来之路
AlphaGo的重要性不言而喻。这一技术不仅可以应用于机器人和科学研究,也适合其他许多任务,例如类似Siri的移动语音助手以及金融投资决策。深度学习创业公司Skymind创始人克里斯·尼克尔森(Chris Nicholson)表示:“你可以将其用于任何具有对抗性的问题,例如需要用到策略的各种比赛,以及战争和商业交易。”
对一些人来说,这种情况令人担忧,尤其考虑到DeepMind的系统已经有能力自学围棋。AlphaGo的学习素材并不来自人类,而是可以通过自行生成数据来自我指导。近几个月,特斯拉创始人伊隆·马斯克(Elon Musk)等知名人士曾表示,这样的人工智能系统最终将超越人类智力,突破人类的控制。
不过,DeepMind的系统受到了哈萨比斯及其团队的严格控制。AlphaGo被用于最复杂的棋类游戏,但这仍只是一款游戏。实际上,AlphaGo距离真正的人类智慧还有遥远的距离,远远没有达到超级智能的水平。
华盛顿大学专注于人工智能的法学教授、科技政策实验室创始人瑞安·卡洛(Ryan Calo)表示:“这仍是一种高度结构化的情况,并非真正人类水平的理解力。”不过,AlphaGo指明了未来的方向。如果DeepMind的人工智能系统能理解围棋,那么就能理解更多信息。卡洛表示:“宇宙只不过是一场更大的围棋游戏。”
㈧ 《终极算法机器学习和人工智能如何重塑世界》epub下载在线阅读,求百度网盘云资源
《终极算法》([美] 佩德罗·多明戈斯)电子书网盘下载免费在线阅读
资源链接:
链接:https://pan..com/s/1az3Npn6XLJgEnftJYKHEtg
书名:终极算法
作者:[美] 佩德罗·多明戈斯
译者:黄芳萍
豆瓣评分:7.1
出版社:中信出版集团
出版年份:2017-1-1
页数:402
内容简介:
算法已在多大程度上影响我们的生活?
购物网站用算法来为你推荐商品,点评网站用算法来帮你选择餐馆,GPS系统用算法来帮你选择最佳路线,公司用算法来选择求职者……
当机器最终学会如何学习时,将会发生什么?
不同于传统算法,现在悄然主导我们生活的是“能够学习的机器”,它们通过学习我们琐碎的数据,来执行任务;它们甚至在我们还没提出要求,就能完成我们想做的事。
什么是终极算法?
机器学习五大学派,每个学派都有自己的主算法,能帮助人们解决特定的问题。而如果整合所有这些算法的优点,就有可能找到一种“终极算法”,该算法可以获得过去、现在和未来的所有知识,这也必将创造新的人类文明。
你为什么必须了解终极算法?
不论你身处什么行业、做什么工作,了解终极算法都将带给你崭新的科学世界观,预测以后的科技发展,布局未来,占位未来!
作者简介:
佩德罗•多明戈斯(Pedro Domingos)
美国华盛顿大学计算机科学教授,加州大学欧文分校信息与计算机科学博士,在机器学习与数据挖掘方面著有200多部专业著作和数百篇论文。
国际机器学习学会联合创始人,《机器学习》杂志编委会成员,JAIR前副主编。
美国人工智能协会院士(AAAI Fellow,国际人工智能界的最高荣誉),荣获SIGKDD创新大奖(数据科学领域的最高奖项)、斯隆奖(Sloan Fellowship)、美国国家科学基金会成就奖(NSF CAREER Award)、富布赖特奖学金、IBM学院奖以及多个顶级论文奖项。

㈨ 《终极算法机器学习和人工智能如何重塑世界》epub下载在线阅读全文,求百度网盘云资源
《终极算法机器学习和人工智能如何重塑世界》([美]佩德罗·多明戈斯)电子书网盘下载免费在线阅读
链接:https://pan..com/s/1VygoLeNPNozcQ9vOBI9rjg
书名:终极算法机器学习和人工智能如何重塑世界
作者:[美] 佩德罗·多明戈斯
出版社:中信出版集团
副标题:机器学习和人工智能如何重塑世界
原作名:The Master Algorithm: How the Quest for the Ultimate Learning Machine Will Remake Our World
译者:黄芳萍
出版年:2017-1-1
页数:402
内容简介
算法已在多大程度上影响我们的生活购物网站用算法来为你推荐商品,点评网站用算法来帮你选择餐馆,GPS系统用算法来帮你选择最佳路线,公司用算法来选择求职者……当机器最终学会如何学习时,将会发生什么?
作者简介
佩德罗•多明戈斯(Pedro Domingos)美国华盛顿大学计算机科学教授,加州大学欧文分校信息与计算机科学博士,在机器学习与数据挖掘方面著有200多部专业著作和数百篇论文。国际机器学习学会联合创始人,《机器学习》杂志编委会成员,JAIR前副主编。美国人工智能协会院士(AAAI Fellow,国际人工智能界的最高荣誉),荣获SIGKDD创新大奖(数据科学领域的最高奖项)、斯隆奖(Sloan Fellowship)、美国国家科学基金会成就奖(NSF CAREER Award)、富布赖特奖学金、IBM学院奖以及多个顶级论文奖项。

