美國華盛頓大學人工智慧教授
㈠ 把2.5萬工程師變成機器學習專家是怎樣的體驗
谷歌轉型:把2.5萬工程師變成機器學習專家是怎樣的體驗?
卡森·霍爾蓋特(Carson Holgate)正在接受忍者培訓。
但這里的忍者指的並不是武術——她已經有不錯的武術功底。26歲的霍爾蓋特是空手道黑帶二段。現在的培訓重點是演算法。霍爾蓋特幾周前加入這個項目,她希望藉此掌握機器學習方面的技能,這是一種比身體對抗更加強大的技術。作為谷歌Android部門的一名工程師,霍爾蓋特是參加今年忍者學習項目的18名程序員之一。該項目從各個團隊招收有才華的程序員,向他們傳授人工智慧技術,以便提升其產品的智能性——盡管這有可能讓他們開發的軟體更加難以理解。
正在接受機器學習「忍者訓練」的谷歌工程師卡森·霍爾蓋特。正在接受機器學習「忍者訓練」的谷歌工程師卡森·霍爾蓋特。
「該項目的標語是:你想成為一名機器學習忍者嗎?」谷歌內部機器學習產品經理克里斯汀·羅伯森(Christine Robson)說,她負責管理這個項目,「所以我們從谷歌各個部門招收人員,用6個月的時間為他們提供機器學習培訓。讓他們跟著導師學習6個月機器學習,並進行一些項目。他們可以由此入手,從而掌握大量知識。」
霍爾蓋特4年前拿著計算機科學和數學學位來到谷歌,對她來說,這是一次掌握最熱門軟體技術的機會:使用學習演算法和海量數據,教給軟體完成任務的方法。多年以來,機器學習都被視作一個高度專業的領域,僅有少數精英人群能夠掌握這種技術。但這個時代已經結束了,最近的結果表明:由模擬生物大腦工作方式的「神經網路」驅動的機器學習技術是將計算機與人類能力融為一體的正確方式。
在某些情況下,甚至可以藉此打造出超人。谷歌希望在內部擴大這類精英人群的范圍,甚至希望讓機器學習成為一種常規技術。對霍爾蓋特這樣的工程師而言,忍者項目是一次實現自我飛躍的絕佳機會,可以向精英中的精英學習知識。「這些人都在開發不可思議的模型,而且都有博士學位。」她言語間流露出無法掩飾的敬畏之情。由於該項目會將所有學員都稱作「忍者」,所以她開始有些難以接受,但最終還是克服了心理障礙。「我起初很難接受,但還是學著接受了。」她說。
考慮到谷歌員工人數眾多——其總部的6萬員工中約有半數是工程師——所以這個項目的規模其實很小。不過,這個項目卻標志著谷歌內部的認識開始發生變化。盡管谷歌從很早以前就開始使用機器學習技術,而且一直在這一領域積極聘請各類專家,但該公司直到2016年才開始真正痴迷於機器學習技術。谷歌CEO桑達爾·皮查伊(Sundar Pichai)在去年末的財報電話會議上闡述了該公司的想法:「機器學習是一項有顛覆性的核心技術,我們可以藉此重新思考我們做一切事情的方式。我們還會盡力將它應用於所有的產品中,包括搜索、廣告、YouTube或Play。我們還處於發展初期,但你會看到我們以系統化的方式將機器學習應用到所有這些領域之中。」
很顯然,如果谷歌要在旗下的所有產品中融入機器學習技術,就需要精通這項技術的工程師。正如機器學習暢銷書《演算法大師》(The Master Algorithm)的作者佩德羅·多明戈斯(Pedro Domingos)所說:「機器學習是陽光下的一項新生事物,這是一項可以自己發展的技術。」 編寫這樣的系統需要找到合適的數據,選擇合適的演算法,然後為成功營造合適的環境。之後就要給予系統足夠的信任(這對程序員來說是一件很難做到的事情),讓它們自己完成工作。
「通過這種方式思考解決方案的人越多,我們就會變得越好。」谷歌機器演算法項目負責人傑夫·迪恩(Jeff Dean)說。他估計,谷歌目前約有2.5萬工程師,但只有幾千人精通機器學習,佔比大約為10%。他希望最終的比例能接近100%。「如果能讓所有工程師都在一定程度上掌握機器學習技術,那就太好了。」他說。
他認為這個願望能否實現呢?
「我們會盡力嘗試。」他說。
神奇技術
多年以來,約翰·迦南德里(John Gianandrea)一直都是谷歌機器學習的重要推動者,而作為該公司的最新動向,他最近成為了搜索業務主管。但當他2010年加盟該公司時(他是在谷歌收購MetaWeb時隨之一同加入谷歌的,那家公司的龐大資料庫已經以知識圖譜的形式整合到谷歌搜索中),他在機器學習和神經網路方面並沒有太多經驗。
谷歌最權威的計算機科學專家傑夫·迪恩正在製作機器學習方面的工具,領導團隊進行相關工作。谷歌最權威的計算機科學專家傑夫·迪恩正在製作機器學習方面的工具,領導團隊進行相關工作。
但在2011年左右,來自神經信息處理系統(以下簡稱「NIPS」)大會的一條消息令他感到震驚。似乎每年都會有團隊在NIPS上宣布機器學習的最新進展,涉及翻譯、語音識別和視覺系統等諸多領域。一些令人驚訝的事情正在悄然發生。「當我第一次關注時,NIPS的內容十分晦澀難懂。」他說,「但過去3年間,這一領域在學術界和產業界都得到了蓬勃發展,去年的參會人數大約有6000人。」
隨著神經網路演算法的進步,加上摩爾定律帶來的強大計算能力,以及谷歌和Facebook等科技公司挖掘出來的龐大用戶數據,機器學習的新時代就此拉開帷幕。迦南德里也加入其中,他認為這將成為谷歌的核心。與他志同道合的還包括迪恩,他是「谷歌大腦」(Google Brain)的聯合創始人,這個神經網路項目來自谷歌旗下的研究部門Google X(現已更名為X)。
雖然迦南德里否認「機器會殺死我們」這樣的預言,但他的確認為,機器學習系統將成為一項革命性的技術,從醫療診斷到無人駕駛汽車,各行各業都將利用這種技術。雖然機器學習不會取代人類,但它卻會改變人類。
迦南德里以Google Photos為例進行了解釋。這款產品的標志性功能是能夠在圖片中識別出用戶指定的物品,這令人感覺頗為神秘,甚至有些不安。他給我展示一些邊境牧羊犬的圖片。「當有人第一次看到這個場景時,他們會以為發生了與眾不同的事情,因為電腦不僅為你計算出偏好,甚至還推薦你觀看一段視頻。」迦南德里說,「它可以理解畫面中的內容。」 他解釋道,通過專門的學習,電腦便可「知道」邊境牧羊犬的樣子,而且可以識別出不同年齡和毛長的邊境牧羊犬。
人類當然可以做到這一點。但沒有一個人能夠從數百萬張圖片中篩選出來這些照片,同時還能識別出不同的犬種。但機器學習系統就可以做到。如果它學會了一個犬種,便可使用相同的技術識別出另外9999個犬種。「這才是真正新穎的地方。」迦南德里說,「通過這樣一個狹小的領域,你可以看到某些人所謂的超人究竟能達到什麼效果。」
逐步探索
需要強調的是,谷歌早已了解機器學習的概念,該公司的創始人始終堅信人工智慧的前景。機器學習已經整合進谷歌的很多產品,盡管未必採用了最近大熱的神經網路技術(早期的機器學習往往依賴更加直接的統計方法)。
事實上,谷歌10年前就開始通過內部培訓,向該公司的工程師傳授積極學習技術。2005年初,當時負責谷歌搜索業務的彼得·諾維格(Peter Norvig)向科學家大衛·帕布洛·科恩(David Pablo Cohn)提出建議,希望了解谷歌能否採用卡內基梅隆大學組織的相關課程。科恩表示,只有谷歌自己才能教授這種內部課程,因為谷歌的運營規模與其他公司都大不相同(可能只有美國國防部是個例外)。所以他在谷歌總部的43號樓(那裡當時是搜索團隊的總部所在地)訂了一個大房間,每周三在那裡開設兩小時的課程。就連傑夫·迪恩也參加過幾次課程。「那是全世界最好的課程。」科恩說,「作為工程師,他們都比我優秀得多!」
那個課程廣受歡迎,甚至變得一座難求。就連班加羅爾辦事處的員工都會特意等到午夜過後接入遠程教學系統。幾年後,一些谷歌員工把授課演講內容製作成了短片,結束了直播授課的歷史。科恩認為,當時的那個課程算得上是MOOC(大規模開放在線課程)的先驅。接下來幾年,谷歌還針對機器學習培訓展開了其他的嘗試,但組織上並不嚴密,內容上也並不連貫。科恩2013年離開谷歌後,機器學習才突然間成為了至關重要的領域。
在2012年之前,這種認識尚未形成氣候,直到迦南德里決定「吸收大量從事這項工作的人」,並將他們安排到同一棟辦公樓之後。脫胎於該公司的X部門的谷歌大腦也加入進來。「我們吸收了很多團隊,將他們安排到同一棟辦公樓內,還提供了全新的咖啡機。」他說,「有些人之前只是一直在從事他們所謂的感知計算——聲音和語音識別等技術——現在都可以與那些從事語言工作的人展開溝通。」
逐漸地,這些工程師們開發的機器學習技術開始出現在谷歌的熱門產品中。由於視覺和語音識別以及翻譯是機器學習的主要領域,也就難怪這項技術成為谷歌語音搜索、翻譯和Photos等服務的重要組成部分。迪恩表示,隨著他和他的團隊對機器學習的理解逐步深入,他們開始以更具野心的方式探索這項技術。「我們之前或許會在系統的組件中使用機器學習技術,」他說,「現在則會使用這項技術替代整套系統,而不是為每一個組件設計更好的機器學習模式。」迪恩表示,如果現在讓他重新編寫谷歌的基礎架構,其中的很多內容都不再是預先編好的代碼,而是後期學習而來的。迪恩更為人所知的身份是Bit Table和MapRece等革命性系統的聯合創造者。
谷歌大腦聯合創始人格雷格·考拉多正在和多個團隊協作,將人工智慧轉化成為自己的軟體。谷歌大腦聯合創始人格雷格·考拉多正在和多個團隊協作,將人工智慧轉化成為自己的軟體。
機器學習還能夠實現一些原本無法想像的產品功能。2015年11月推出的Gmail自動回復便是其中之。這項功能源自谷歌大腦項目聯合創始人格雷格·考拉多(Greg Corrado)與Gmail工程師巴林特·米克洛斯(Bálint Miklós)之間的一次對話。考拉多之前曾經與Gmail團隊合作使用機器學習演算法探測垃圾信息,歸類郵件內容,但米克洛斯提出了一些更激進的建議。能否利用機器學習技術自動生成回復郵件,省去移動用戶在狹小的鍵盤上輸入文字的繁瑣過程。「我大吃一驚,因為這個建議太瘋狂了。」考拉多說,「我後來想,藉助我們一直以來都在研究的預測性神經網路技術,或許的確可能實現這種功能。一旦我們意識到這是一個機會的時候,就必須去嘗試一下。」
為了提高成功概率,谷歌讓考拉多和他的團隊與Gmail部門展開了密切合作。這種派遣機器學習專家進駐產品部門的做法如今已經越來越普遍。「機器學習既是科學又是藝術。」考拉多說,「這就像烹飪——沒錯,烹飪過程發生了化學反應,但對於真正對烹飪感興趣的人來說,必須要學習如何搭配手中的食材。」
傳統的人工智慧技術在理解語言時,需要將語音規則嵌入系統,但在這個項目中,系統可以利用現代化的機器學習技術,藉助足夠的數據像兒童一樣自學。「我的語言能力並不是從語言學家那裡學來的,而是通過聽別人說話學來的。」考拉多說。但真正令智能回復變得切實可行的,是它的成功很容易定義——他們的目的不是創造一個妖艷的虛擬斯嘉麗·約翰遜(Scarlett Johansson),而是希望它能回復真正的電子郵件。「這項服務的成功標志是,系統可以生成一個對用戶有用的備選回復,以便用戶能夠真正使用這些內容。」他說。因此,只需要知道用戶是否點擊了系統推薦的回復內容,便可對其進行訓練。
但當該團隊開始測試智能回復時,用戶卻注意到了一些怪異的事情:它經常會推薦一些不合時宜的曖昧語言。「其中一個比較失敗的情況是:只要系統感覺困惑,它就會說『我愛你』。」考拉多說,「這並不是軟體漏洞,問題出在我們讓它做的事情上。」 這個程序已經了解了人類行為的一些微妙之處:「如果你感到擔憂,那麼說一句『我愛你』是一種很好的防禦策略。」 考拉多幫助該團隊壓制了系統的熱情。
去年11月發布的智能回復取得了巨大成功——Gmail Inbox應用的用戶現在可以直接從系統提供的三條備選內容中選擇一條進行回復。由於系統提供的回復內容非常切題,用戶經常感到驚訝。在通過該應用發送的回復信息中,有十分之一都是由機器學習系統生成的。「這個項目能夠成功還是令我感到有些驚訝。」考拉多笑著說。
類似於智能推薦這樣的例子還有很多,它們都充分說明機器學習系統在谷歌業務中發揮的作用。或許最終的拐點是當機器學習成為搜索的一個必不可少的組成部分時——作為谷歌的旗艦產品,搜索幾乎為該公司貢獻了所有營收。多年以來,由於搜索引擎對谷歌過於重要,所以始終沒有融入機器學習演算法。「由於搜索在公司內部占據的份額巨大,高級管理者深度參與其中,所以很多人都懷疑我們無法真正取得進展。」迦南德里說。
其中部分阻力源自文化因素——必須要讓那些有極強控制欲的程序員適應帶有禪宗韻味的機器學習模式。長期掌管谷歌搜索業務的阿密特·辛格(Amit Singhal)曾是傳奇計算機科學家傑拉德·薩爾頓(Gerald Salton)的助手。薩爾頓在文檔檢索方面的開創性工作啟迪辛格幫助謝爾蓋·布林(Sergey Brin)和拉里·佩奇(Larry Page)把研究生時期編寫的代碼,擴展成了可以適應當今網路時代的程序。(這使得他成為了「檢索派」的一員。)
他從20世紀的方法中梳理出了令人驚訝的結果,但如果要將機器學習系統整合到關系谷歌命脈的復雜系統中,他卻持懷疑態度。「進入谷歌的前兩年,我負責搜索質量,試圖用機器學習來改進排名。」大衛·帕布洛·科恩說,「結果發現阿米特的團隊是全世界最優秀的,我們把阿里特腦海中的所有內容都變成了硬編碼,以此實現進步。已經找不到比他更好的方法了。」
到2014年初,谷歌的機器學習大師們認為需要改變現狀。「我們與排名團隊展開了一系列討論。」迪恩說,「我們認為至少應該嘗試一下,看看能不能有一些收獲。」 他的團隊所設想的那個實驗最終成為了搜索的核心:文件排名與搜索請求的匹配程度有多高(需要以用戶的點擊為衡量標准)。「我們跟他們說,可以用神經網路計算額外的分數,看看到底有沒有用。」
答案是:確實有用。這套系統如今已經成為谷歌搜索的一部分,被稱作RankBrain。它於2015年4月上線。谷歌還是像以往一樣對如何改進搜索諱莫如深(究竟是與長尾理論有關?還是更好地解讀了模糊不清的搜索請求?),但迪恩表示,RankBrain「融入到每一個搜索請求中」,雖然未必會影響所有的排名,但的確對很多搜索請求的排名都產生了影響。另外,實際的影響幅度也很大。在谷歌計算排名時所使用的數百個信號中(這些信號可能包括用戶所在的地理位置,或者頁面標題是否與搜索請求匹配),RankBrain現在的用途排名第三。
「我們成功利用機器學習改進了搜索結果,這對公司來說意義重大。」迦南德里說,「這引發了很多人的關注。」 華盛頓大學教授佩德羅·多明戈斯則給出了另外一種說法:「檢索派與機器學習派始終都存在斗爭。機器學習最終贏得了勝利。」
內部培訓
谷歌面臨的新挑戰是如何讓所有工程師都熟悉機器學習。還有很多公司也都秉承著相同的目標,其中最引人關注的當屬Facebook,該公司與谷歌一樣著迷於機器學習和深度學習。這一領域的畢業生變得非常搶手,而谷歌正在努力保持對畢業生的吸引力:學術圈多年以來都流傳著一個玩笑:即使不需要頂尖學生,谷歌也會招聘他們,避免人才被競爭對手搶走。(這個玩笑的錯誤之處在於,谷歌的確需要這些人才。)「我的學生無一例外都得到了谷歌的錄用通知。」多明戈斯說。目前看來,競爭的激烈程度有增無減:就在上周,谷歌宣布將在蘇黎世開設一個新的機器學習實驗室,有很多工作崗位有待填補。
但由於學術項目尚未培養大量機器學習專家,為員工提供在職培訓面成為了必要措施。但這卻並非易事,尤其是對於谷歌這樣的公司而言。這里有很多世界頂尖工程師,他們一生都在研究傳統的編程方式。機器學習卻需要截然不同的思維模式,精通編碼的工程師之所以能有如今的成就,往往是因為他們希望完全控制一套編碼系統。機器學習還需要掌握一些數學和統計學知識,但是很多程序員卻對此不屑一顧的,即便是那些能夠寫出超長代碼的超級黑客也不例外。
克里斯汀·羅伯森的職責是在機器學習方面孵化谷歌內外的人員。克里斯汀·羅伯森的職責是在機器學習方面孵化谷歌內外的人員。
這還需要一定程度的耐心。「機器學習模型不是靜態代碼——你需要不斷為其提供數據。」羅伯森說,「我們一直在不停地更新模型,而且還要不斷學習,增加更多數據,調整預測方式。它就像是一個有生命的東西,這是一種截然不同的開發模式。」
「這是一個使用不同的演算法進行實驗的學科,需要挑選那些真正適合使用場景的訓練數據。」迦南德里說。盡管他也是新的搜索業務主管,但卻仍然把在谷歌內部傳播機器學習理念作為自己工作的一部分。「計算機科學那一部分不會消失,但需要更加關注數學和統計學,而對數十萬行代碼的關注度則需要相應地降低。」
至於谷歌所擔心的障礙,完全可以通過明智的在職培訓來解決。「歸根結底,這些模型中使用的數學原理並不那麼復雜。」迪恩說,「谷歌聘用的多數軟體工程師都可以掌握。」
為了進一步幫助不斷擴容的機器學習專家團隊,谷歌開發了一系列強大的工具,幫助他們選擇合適的演算法訓練模型,加快培訓和提煉過程。其中最強大的是TensorFlow,它可以加速神經網路的構建過程。TensorFlow源自谷歌大腦項目,由迪恩和他的同事拉加特·芒格(Rajat Monga)共同發明。它能把構建系統過程中涉及的晦澀難懂的細節變成標准化的內容——尤其是在谷歌2015年11月開始將其開放給公眾後,這種做法的效果更加得以顯現。
盡管谷歌煞費苦心地將這種行為描述為一種無私的舉動,但該公司也承認,如果新一代程序員都能熟悉該公司內部的機器學習工具,那對谷歌未來的招聘活動將會起到莫大的幫助。(質疑者甚至指出,谷歌的TensorFlow開源項目是為了追趕Facebook,後者已經在2015年6月公布了早期機器學習系統的深度學習模塊Torch。)不過,TensorFlow的功能以及谷歌的開源模式很快受到了程序員的歡迎。迦南德里表示,當谷歌首次提供TensorFlow課程時,共有7.5萬人報名參加。
但谷歌仍為自己的程序員保留了很多好東西。該公司在內部擁有一套更加優秀的機器學習工具——Tensor Processing Unit(以下簡稱「TPU」)。他們雖然使用這項創新已經多年時間,但直到最近才對外宣布。這是一種針對機器學習程序優化的晶元,就像GPU是專門針對圖形處理優化的晶元一樣。該公司的龐大數據中心裡使用了數以千計的TPU(具體有多少恐怕只有上帝和佩奇才知道)。通過賦予神經網路這種超級計算能力,TPU為谷歌帶來了巨大優勢。「如果沒有它,我們就無法實現RankBrain。」迪恩說。
但由於谷歌最需要的還是設計還提煉這些系統的人才,他們也在不斷嘗試各種方式來為工程師提供機器學習方面的培訓。這些培訓的規模各異,其中也包括為期兩天的速成班。谷歌希望這只是初步嘗試,工程師隨後還會尋找更多資源來深入學習。「已經有數千人報名參加下一次課程。」迪恩說。
該公司還在通過其他一些措施,為外部人才提供機器學習培訓。今年初春,谷歌啟動了Brain Residency項目,利用谷歌大腦項目為有潛力的外部人才提供了為期一年的集訓。「我們稱之為你的深度學習職業生涯的開端。」羅伯森說,他負責協助管理這個項目。盡管這27名來自不同學科的機器學習學員中,可能有一些會留在谷歌,但他表示,該公司的目的是讓他們自行發展,利用自己掌握的先進知識在世界各地傳播谷歌的機器學習技術。
前景廣闊
當今時代,機器學習正在逐步走上中心舞台,而谷歌則希望以人工智慧公司的身份繼續占據主導。所以,從某種意義上講,卡森·霍爾蓋特在忍者項目中學到的知識正是這一計劃的核心所在。
她的課程最初是一個為期4周的新兵訓練營,由谷歌最先進的人工智慧項目產品負責人提供指導,教給他們如何將機器學習融入項目中。「我們把忍者帶進會議室,格雷格·考拉多站在白板前解釋LSTM(長短期記憶,一種可以打造強大神經網路的技術)。他做著誇張的手勢,講述這種系統的工作方式、利用何種數學原理、如何應用於實際。」羅伯森說,「在最初的4個星期里,我們幾乎用到了我們的所有技術和所有工具,為的是給他們帶來切身體會。」
霍爾蓋特從新兵訓練營畢業了,她現在正在使用機器學習工具開發一款Android通訊功能,幫助谷歌員工彼此交流。她正在調整超參數,清理輸入數據,去掉停止詞。但她已經不可能回頭,因為她知道人工智慧技術就是谷歌的現在和未來,甚至可能是所有技術和所有東西的未來。
「機器學習時代已經來臨,」她說,「前景無比廣闊。」
㈡ 喬治華盛頓大學計算機專業人工智慧方向研究生怎麼樣畢業後在美國找工作容易嗎
喬治華盛頓大學工程與應用科學學院(School of Engineering and Applied Science)成立於1884年10月1日,當時的名稱是Corcoran科學學院。在1962年,學院從哥倫比亞學院獨立出來。它是第一個在工程領域接受女性學位申請人的學院,同時也是全美授予女性工程學博士學位最多的學院。火箭筒是於1942年在學院中發明的。
學院自建立以來,一直強調「要引領科技的發展」的原則。在最新2015年USNEWS工程學院排名中喬治華盛頓大學位居全美第90位。
學院下設5個科系及將近20個研究生學位項目,所有系都提供涵蓋學士、碩士和博士的學術學位及職業學位和專業認證。
• 土木和環境工程系(Department of Civil and Environmental Engineering)
• 計算機科學系(Department of Computer Science)
• 電氣與計算機工程系(Department of Electrical and Computer Engineering)
• 工程管理和系統工程系(Department of Engineering Management and Systems Engineering)
• 機械和航空航天工程系(Department of Mechanical and Aerospace Engineering)
• 生物醫學工程系(Department of Biomedical Engineering)
學院的戰略重點為生物醫學工程,信息科技和通訊以及安全可靠性 運輸。由於學院地處「北弗吉尼亞科技走廊」地帶,同時也是美國最密集的科技產業帶之一,學生可以接觸到從世界級的科學家到前沿科技的決策者這樣的技術變革者,以及像國家科學基金會、美國航空航天署太空飛行中心、海軍科研實驗室、國會圖書館這樣的支持性組織。
在校生可出席或參加當地的「研究和發展展覽會」,參加「美國科學工程節」活動,共同慶祝科學和工程方面的新進展。畢業生有機會獲得在LG電子公司、美國宇航局、波音公司、微軟公司等世界知名企業的就職機會。學校還會安排學生進入微軟、Hyundai公司、3M公司實習。
㈢ 「人工智慧」,「大數據」+教育如何驅動教育的未來
近日,由論答公司主辦的教育大數據研討會在北京舉行,討論會主題為「大數據+教育,有哪些可能性?」。本次研討會主要關注數據在教育領域的應用,具體包括自適應學習、學習數據分析和教育數據挖掘。來自賓夕法尼亞大學、人民大學、華中師范大學的專家和企業界代表,共同探討了教育大數據和自適應學習領域的技術趨勢和產業機會
Ryan Baker是國際教育數據挖掘協會(International Ecational Data Mining Society)的創始人、《教育數據挖掘》雜志(Journal Ecational Data Mining)主編,在各類期刊和會議發表了260餘篇學術論文,先後主持了美國科學基金會(National Science Foundation)、蓋茨基金會(Gates Foundation)等研究基金的多項重大項目,累計獲得研究經費超過1600萬美元。
他也在哥倫比亞大學教育學院和愛丁堡大學同時擔任教職,他在Coursera和edX上開設的「Big Data in Ecation(教育大數據)」課程,有來自100多個國家和地區的學生注冊。
研討會現場,Ryan Baker通過遠程視頻,分享了他對教育大數據的體驗和應用。據他介紹,目前在教育大數據領域主要有四大研究組織,分別研究人工智慧與教育、教育數據挖掘、學習數據分析和大規模學習。
Ryan Baker表示,在教育領域廣泛應用大數據的時代正在到來。教育數據挖掘有很多的應用方向,包括:預測學生是會輟學,還是會成功完成學業;自動檢測學生的學習投入程度、情感、學習策略,以更好地達到個性化;給教師和其他相關人員提供更好的報告;教育科學的基礎研究和發現。
他認為,個性化教育至少要做到三件事情:
1、確定學生的有關數據;
2、了解對於學生的學習來說什麼是真正重要的;
3、有針對性地為學生提供合適的教學。
而通過教育數據挖掘,我們可以推斷很多事情:
學生的元認知和求助。比如,這個學生有多自信?當他需要幫助時,有沒有在尋求幫助?他有沒有在給自己解釋問題,有沒有思考這個答案是正確的還是錯誤的?最重要的,當他面臨挑戰時,能否堅持下去?
沒有投入學習的行為。比如,「玩弄」系統,為了找到正確的答案,有的學生會試各種不同的答案,從「1」試到「38」。粗心,本身會做,但是不用心,最後給出的答案是錯的。有些孩子會做非常難以解釋的行為,比如不用方程符號,而是畫了一個笑臉。
學生情感。Baker的研究團隊和其他研究團隊,已經創造了研究模型,可以根據數據推斷,學生是否感到厭倦、沮喪、困惑、好奇、興奮、快樂,是否投入,等等。
長期的學習結果。比如,學生能夠記住剛才他學的東西嗎?學生准備好學習下一個主題、下一個知識沒有?中學生能上大學嗎?他會從大學畢業還是輟學?
Ryan Baker表示,要獲得這樣的推斷,只需要學生與系統交互的數據,不需要學生戴上頭盔檢測器。目前,這些模型已經開始大規模應用於自適應學習,應用於幾十萬的美國學生。Ryan Baker列舉了一些自適應學習系統的案例。
Knewton
通過系統決定學生下一個要學習的問題是什麼,已在全球的多個領域多個學科中運用。
ALEKS-ALEKS
用的是先行知識結構和知識點模型,來選擇最適合學生的學習材料。比如,一個學生在學習上出現了問題,系統能夠檢測出來,是以前學的知識點出了問題,然後讓學生回到以前的知識點上去學習。ALEKS系統應用於美國高中、大學的數學、科學學科。
Cognitive Tutor
系統能自動檢測學生的知識,直到學生掌握為止。比如,系統不會讓學生學習下一步的知識,直到他展示出他已經學好了他現在正在學習的知識。系統能夠給學校提供數據報告,學校根據報告能夠更好地讓學生投入到學習中去。每年大約被50萬的美國初高中生用於數學學習。
論答
論答公司的系統與ALEKS的系統有些類似,也是用先行結構和知識點模型,選擇合適的學習材料。同時也是自動檢測學生的知識狀態直到學生掌握為止。應用領域目前包括數學和英語,完全針對中國學生開發。
Reasoning Mind
用各種自動檢測的模型來檢測老師的教學是否有效。通過數據生成報告給每個地區的教學管理員,讓他們找到方法幫助老師提高教學。主要是用於美國的小學數學。
Duolingo
自動檢測學生記憶,來決定什麼時候回顧已經學過的知識。在全世界范圍內應用於外語詞彙的學習。
其他的像Civitas,Course Signals,Zogotech都是地區供應商,運用風險預測模型提供行動信息預測。它們會對學生做出預測,可能學不好、會失敗,把報告提供給老師。已在世界范圍內的大學應用。
Ryan Baker指出,在這些系統中,有足夠的證據證明,至少以下兩個系統是非常好的。
1、胡祥恩教授在美國做了大量實證研究,證明ALEKS系統對於幫助學生學習是有效的。他的研究證明,ALEKS系統對於不同人群的學生是同樣有效的;特別值得提出的是,ALEKS可以幫助少數人群群體提高學習成績。
2、Ryan Baker本人領導的研究團隊與論答公司合作的研究表明,學生通過論答系統學習,比通過傳統的在線學習系統學習,效果更好。他們在中國3個不同的地區做的3次實證研究,都證明了論答系統的有效性。
Ryan Baker分析了教育大數據演算法模型的潛在發展方向。他認為,這些模型的長期潛力是,通過學生的知識和學習模型來確認,學生什麼時候需要更多的支持:
首先是「mastery learning」,學生在掌握一個知識前,不會讓他去學習下一個知識。當學生需要支持的時候,自動介入;同時告訴老師和父母,這個學生什麼時候需要支持。
通過學習投入程度模型判斷,學生什麼時候開始變得厭倦、沮喪了,並調整學習活動,讓厭倦的學生不再厭倦,讓沮喪的學生的學習變得更容易一些。
學習投入程度模型還可以檢測,在線學習中,什麼樣的學習活動,能讓學生更容易地投入進去,並最終發現,什麼樣的學習活動對學生更好、對什麼樣的學生更好。
這樣的模型也能告訴老師和父母,學生什麼時候開始變得不再投入學習了。
還可以運用學習模型確認,學生什麼時候沒有真正學會,需要更多支持。
最後,Ryan Baker指出,下一步的目標是優化之前已經驗證的經驗和方法,然後把它們運用到系統中,最終讓中國和世界上的數十億學生受益。
討論:「因材施教」的千年理想該如何照進現實?
王楓博士,論答公司(Learnta Inc.)創始人兼CEO
胡飛芳博士,美國喬治華盛頓大學(George Washington University)統計學終身教授,中國人民大學統計與大數據研究院的教授
胡祥恩博士,美國孟菲斯大學(University of Memphis)心理系、計算機科學系、計算機工程系終身教授,華中師范大學心理學院院長
馬鎮筠博士,論答公司聯合創始人兼首席數據科學家
辛濤博士,北京師范大學中國基礎教育質量監測協同創新中心常務副主任、博士生導師,兼任國家督學、教育部基礎教育課程教材專家工作委員會委員、中國教育學會學術委員會委員。
技術發展到今天,「因材施教」如何實現?
王楓:因材施教,我首先到的是,每位學生學習的內容都不一樣。如果有新的技術或者系統,系統應該像一個好老師一樣,不會頭疼醫頭腳疼醫腳。比如說,一元二次方程做錯了,好老師不會簡單說一元二次方程做錯了,你繼續再做十道一元二次方程的題目,這其實是很差的老師,他沒有真正去全面評判學生,到底是哪些掌握好、哪些掌握不好。
一個好的老師可能會說,我全面地看了你整個學習,可能你的問題不是出在一元二次方程上面,老師看了你做的題目,一元一次方程沒有掌握好、因式分解也沒有掌握好,你繼續做一元二次方程是浪費時間。這就是從系統角度來說,系統做到了根據每個學生最基礎的先行知識點的結構,給你提供最適合你當前學習的知識點,題目也好、視頻也好、還有其他各種各樣的學習內容。
胡飛芳:因材施教是我們教育的理想狀態。孔子很早提出因材施教,在他當時的歷史環境裡面,因材施教可能更多是個體性的,因為那時學生少、老師也少,因材施教相對比較容易做到。
隨著歷史的發展,我們有更多的人需要教育時,我們做的一件事情是什麼呢?就是做了一個標准化。標准化做的是什麼?課堂教育。課堂教育從某種意義上來講是標准化。現在這個歷史階段,教育大數據可能真正要做到的就是因材施教,自適應學習本身想做的也是這個。
胡祥恩:因材施教事實上在學習理論里有兩個:一個是outerloop「學什麼」,一個是innerloop「怎麼學」。用技術來細化因材施教是教育產業走向成熟的一個標志。但是這個路非常非常難,因為「怎麼學」那個層次非常非常難。
馬鎮筠:「因材」代表認識到學生的個體化差異,「施教」指進行差異化教學,這是根本思想。但如果考慮到時代背景,孔夫子時代專注的是學生的職業發展方向,也就是說,把適合當政治家的培養成政治家,把適合當學者的培養成學者。現在再提因材施教,我們其實能做得更多、更精細化。
比如,「因材」,對「材」的分類不僅是職業方向,還會考慮到學生的學習狀態、學習目標、潛在能力、興趣偏好等。而且,傳統意義上的因材施教考慮的是學生個體間的差異,沒有重視學生本身狀態是在發生變化的,學生在不斷學習,狀態甚至興趣各方面都可能發生變化。
但這些是自適應學習能夠做到,甚至比傳統的因材施教做得更好的地方。再說到「施教」,現在我們能做的幾件事,包括學習路徑推薦,給不同的學生匹配他最合適的學習內容,這種非常精細化的層面,我們已經有了一定的技術積累。
怎麼判斷一個產品做到了真正的自適應?
馬鎮筠:大多數產品的學習過程可以分為測、學、練,可以從這三個環節去看這個產品做到什麼程度。
測,各種學習機構都有測評。但是國內只有論答團隊第一個做出來能夠在幾十道題內,精準判斷你一百個知識點,哪21個沒掌握,哪79個掌握了。市場上大部分競品,只會告訴你,知識點掌握率或者分數,79分或者知識掌握率達到79%;或者一些其他維度的總結,比如邏輯思維能力比較強、閱讀的磨煉技巧比較好、學習動力哪方面稀缺。他們做了降維,本來很復雜的學習狀態這樣說出來,相對比較容易實現。但如果要做到具體告訴你,哪些知識點掌握、哪些知識點沒掌握,這個難度就高很多了。
關於學習路徑推薦的話,很多題庫類的軟體,知識點學完之後,會給一些題目推薦,但真正實現路徑推薦的很少很少。路徑推薦也是很核心的,有20個知識點沒掌握,先學哪個知識點,後學哪個知識點,學習順序是非常關鍵的,必須遵循循序漸進的原則,哪些知識點是前提知識點,哪些知識點是後續知識點,隨機給你知識點去學習的話不能起到最好效果。真正到了練或學的環節,推薦什麼樣的視頻,先推視頻還是先推文字講義,推簡單題、中等難度題還是復雜題目,都需要根據學生實際情況來決定。
剛才只是舉了幾個例子,具體涉及到背後的演算法、整個系統跟學習內容的結合以及整個教學流程的實現,中間很多環節必須要打通,形成一個閉環,才能對最終的結果負責。
辛濤:我的研究領域是教育和心理學的測量和評價。我個人的學術觀察,基本上在現代這領域是兩個類型。一個是心理測量領域,有一套成熟的方法,包括早期的IRT(Item Response Theory)和現在的ADT。另外一個是人工智慧檢測。心理測量系統,是一小群人在做;人工智慧化是大的方向,現在是顯學,給大家提供了明顯的可能性。重要的是,那些背後的演算法,能夠在企業里真正實現出來。現在可能很多演算法已經在那兒了,大體上路徑是通的。
自適應學習基本上是把學習和評價聯動起來了。因為,要自適應學習,必須有一個系統隨時看到學生學到什麼程度,這個完全是評價。但是,評價完了之後有一個新的呈現。這一塊現在已經有一些很成熟的一些東西了,但不是一時半時可以說得特別具體的。
我做教育的測量和心理測量,人工智慧那塊我不熟。但是,從教育測量角度來說,在自適應學習和新技術結合之前,很大一塊還是自適應考試,CAT(computer adaptive test)。系列化產生一個CAT變成了一個自適應學習的過程。總的來說,使用最簡單、最機械化的方法,連續的CAT實際上是可以破解一個學習過程的。
測評本身經歷了好幾個階段,通常用三個應用介詞表示。
accessment to learning and teaching;
現在國家倡導的,accessment for learning and teaching,測評要對學習和教學有幫助;
跟信息化結合,accessment as learning and teaching,它是學習提供的完全融合的一個環節。
王楓:什麼樣的自適應學習系統才是真正的高級自適應學習系統?在中國的落地到底是怎麼樣才能真正落地?我在馬博士的基礎上想補充一點。
自適應系統如果一定要分級,也可以簡單分一下。一種最基礎的系統是基於規則的,比如說埋點。一個學生做10道一元二次方程題目,我預先埋好了,你做錯了,立馬給你推五道一元一次方程題目、五道因式分解題目。這個是埋點埋好了,這是規則,預先由老師或公式設置好了。
但這個規則有用性是非常有限的,因為每個學生不一樣,A學生是因為一元一次方程不會,B學生可能是因式分解不會,C學生可能連小學的乘法快速運算都不會,這個沒法預先直接埋點准備好。
所以自適應系統真正到了更高級一點的話,一定是真正通過大數據、根據演算法模型來分析學生的學習數據,匹配下一步應該學什麼。
在中國,自適應學習有效應用於教學有三個前提條件。做到這三點,自適應學習在中國的教育裡面前途無限。
好的產品。必須要有針對中國本土化的自適應學習產品,把它開發出來。像ALEKS系統的確演算法不錯,但裡面連一套國內的高考題都沒有,家長不會讓小孩子用這樣的系統,因為直接影響應試目標。真正本土化開發的話,沒有一成不變的演算法,世界上最好演算法就是沒有開發出來的。教育非常復雜,每個學科不一樣。比如數學後台有強大的關系,先行後續關系;英語沒達到數學這么強的相關性,但演算法是一樣可以應用的。
好的學生、家長、老師。有了好的產品,首先學生應該真正投入進去學習。像Ryan Baker教授講的,學生如果隨便學一下,再好的系統也沒用。第二,家長得督促孩子學習。第三,老師非常重要。老師應該做有價值的事情,比如給學生做個性化的輔導答疑,給學生針對性的講解,組織學習活動小組,鼓勵學生發揮創造能力,領導能力的培養。
學校以點帶面。學生大部分時間都在學校裡面學習。如果學校里最基本的、有效的在線教學產品都不應用的話,其實是有問題的。但是改變絕對不是簡單的行政命令可以解決的。一個好的產品,一定是從點到面,逐步推廣。自適應學習,更適合有明確目的的學習,像應試教育這塊可以做得更好。所以學校可以應用進去。
胡祥恩:我覺得大家做自適應也好、因材施教也好,比較好的例子大家可以看一看。教育這個領域有多大,自適應概念就該有多寬。所以說,實驗室裡面有很多小的做得非常非常好的東西,只是沒有到市場上面去,有很多非常非常巧妙的演算法、一些東西。你會發現很多歐洲的、美國的實驗室做的system,我每次看了都有種,自己是坐井觀天的感覺。
怎麼看待人工智慧在教育中的應用?
胡飛芳:AlphaGo跟master,谷歌做了一個非常好的廣告,人工智慧在某些方面可以做得非常好。但是,我現在給你們講另外一個谷歌自己不會去說的例子,但這也是事實。2008年、2009年的時候,谷歌推出一個免費產品,用各種搜集到的數據,預測美國的流感發展趨勢。開始時很成功,預測跟實際發生的情況很相似。但到2015年,他自動撤回去了,不再提供預測。因為在2012跟2013年預測的時候,預測結果跟實際情況相差非常遠。
這說明像這種不確定性的問題,人工智慧還有非常大的局限性。一旦有不確定的數據,就有噪音。數據量很大時,大數據可能產生大噪音。怎樣使噪音下降?2015年一個哈佛教授的研究團隊在谷歌的基礎上,用谷歌的數據去做同樣的預測。他用了什麼呢?就是用了模型,實際上模型在很多時候降噪是很有用的,用模型去預測,而不完全是人工智慧的方式去預測。結果,他做出來的預測基本都比較准。
人工智慧相對比較成功的,是比較確定的問題,所謂的確定是不管有多少種可能性,還是一個確定的東西。而流感很多時候是完全不確定的因素。
教育其實很多時候也是不確定的。同樣一個人,現在讓他回答這個問題,他可能思路清楚地回答出來;過了一個小時後,即使是同樣類型的問題,按道理他應該回答出來,結果他回答不出來。這是說,實際上有很多因素在干擾的時候,人工智慧的功能是不是會減少一點。把模型跟人工智慧加在一起,會彌補人工智慧在某些方面的弱點,這樣會更好。
怎樣促進商界和學界的交流,更好地把學界已經有的一些成果,運用到市場上來?
胡祥恩:教育產業應該是一個最大的產業,教育產業事實上是一個知識產業鏈。到目前為止,很多人認為自己要做一整套系統而在美國汽車業,最賺錢的是供應商,是做輪胎、做玻璃的。一旦標准化之後,一個人如果螺絲釘生產得最好,他就能夠養活幾家人、幾代人。
到目前為止,美國推的就是教育標准化,教育內容的標准化、教育技術的標准化。比如說97年的時候,就說怎麼樣把內容標准化,你做的東西我可以用。我只是做整個教育知識產業鏈裡面一個小塊,做得很好。教育整個的產業鏈,有可能發揮特別特別技巧的那些小的公司,就能夠在這個產業鏈裡面生存、可以做得很好。第一個是要標准化,第二個要理解整個教育是一個產業鏈。
㈣ 美國科學家研製出如何用腦電波來控制機器人
戴上一頂共有32個獨立的電極與大腦頭皮接觸的帽子,通過接受人腦思維產生的腦電波,機器人可完成一系列動作指令,包括撿拾物品及左右移動等。 隨著人工智慧技術的飛速發展,機器人的使用正變得越來越頻繁,讓人類逐漸從體力勞動中解放出來,美國科學家正試圖讓機器人來完成我們心中的想法。美國華盛頓大學教授拉傑什·瑞奧展示了他們最新研製成功的腦電波控制機器人。演示者戴上一頂特製的帽子,這頂帽子上共有32個獨立的電極與大腦頭皮接觸。通過接受人腦思維產生的腦電波,這台機器人可以完成一系列動作指令,包括撿拾物品以及左右移動等。靈感來自電腦研究用腦電波控制機器人的想法來自人類對相關電腦的研究。此前,一些科學家已經開發出可以用腦電波控制的電腦。研究人員藉助於植入大腦運動皮層的特殊裝置,幫助一名四肢癱瘓的病人用大腦操縱電腦完成某些動作。這項研究由美國馬薩諸塞綜合醫院的利·霍赫貝格和布朗大學的約翰·多諾霍共同領導。試驗對象是3年前因脊髓損傷而四肢癱瘓、現年25歲的馬修·內格爾。研究人員把特殊的電腦晶元植入內格爾的大腦運動皮層,使他能用腦電波查看電子郵件,操控電視,移動輔助機械臂。植入內格爾大腦運動皮層的晶元有4平方毫米,上面有100個電極。內格爾想著他要完成的動作時,100個電極感測器開始記錄大腦活動,把這些信號傳遞給電腦,通過電腦解碼和處理後最終轉化為運動指令。患者用思維完成任務如果人腦能控制電腦,控制起機器人來就順理成章了。科學家們只需要通過可進行掃描大腦皮層的感應電極,便可接收並解讀患者腦部發出的信號。機器人通常都是按照事先設計好的程序執行任務,而這種新型機器人則完全可根據人們的想法迅速地自行制定新的行動程序。通過接受人腦思維產生的腦電波,機器人可以完成一系列動作指令,包括撿拾物品並把它們拿到另一目標桌子上,機器人還可以左右移動。研究人員把實驗用的桌子和物品擺放在機器人前面,機器人通過計算機視覺系統找到桌子的位置,辨認桌子上的物品。發現物品畫面被傳送到人腦-計算機界面,操控者戴上一頂特製的電極帽控制機器人,這頂帽子上共有32個獨立的電極與大腦頭皮接觸。操控者把注意力集中在需要機器人拾起的物品上。在演示過程中,科學家們還嘗試將操控者與機器人分隔在兩個不同的房間內,利用腦電波掃描儀,機器人同樣可以接受人腦發出的信號指令,並做出各種正確的動作。隨心所欲指揮機器人人們買來什麼新電器,都要看懂復雜的說明書才能使用,而且有些電器(比如電腦)使用起來還需要不斷學習。在不久的將來,人類將完全擺脫這種束縛,實現用大腦控制機器人。並且,人們對機器人的操作將更快速更精確。你腦中想到什麼,機器人就會幫你去做。當然,如果你想什麼機器人就做什麼,那世界會變得很混亂,因為人的思緒很快,很混亂,機器人不可能完成大腦的每一個想法。這需要增加「開啟」和「確認」兩項功能,我們需要機器人完成我們的想法時我們才開啟機器人,機器人接受到任務後會詢問你是否真的需要完成,如果你再一想覺得那事沒有必要做,機器人就不會去做。另外,也有人會擔心機器人會完成人們的壞心思,比如我恨某人,恨得想殺了他,那麼我們是否可以藉助機器人來殺人呢?我們完全不必擔心。未來的法律是會懲罰利用機器人殺人的犯罪分子的,利用機器人殺人等同於現在利用刀槍殺人。而且,接通腦電波的機器人出廠時已經輸入了整部法律,「正版」機器人不會執行主人的違法想法。 更多新技術、新產品,盡在科技趨勢頻道>>
㈤ 大眾侃車到千城數智 背後是汽車大數據的野心
2017年11月16日, 大眾 侃車發布了主題為"數字生活,智領未來"暨"千城數智2018戰略",大眾侃車也正式更名為千城數智( 北京 )網路科技有限公司。來自美國矽谷、亞馬遜等大數據科學家、中美汽車行業大伽、中美主流媒體和汽車大數據發燒友120多人蒞臨現場,見證了這一重要時刻。
千城數智2018戰略包含品牌戰略、企業戰略、市場戰略、用戶戰略、服務戰略、人才戰略和競爭戰略,劍指"汽車用戶及行業大數據"。
據創始人郭登禮博士介紹,2018年千城數智將在全球建成三大汽車大數據中心,即:以人才為核心的北美西雅圖汽車大數據實驗室,以分析和處理為目標的重慶大數據中心,以運用和轉化為方向的北京大數據營運中心。同時千城數智將圍繞全國18個省三四五線城市布局與營運,通過現有品牌市場佔用率,用戶消費趨勢和能力的分析,以精準的數據分析結果引進到產品和營銷內容對接用戶,鏈接用戶,服務用戶,幫助用戶解決購車痛點,從而提升和提速用戶在消費效率上的轉變。
發布會上,千城數智與北美中文傳媒集團(AC MG )簽訂了"千城特賣落戶美國"的戰略合作協議。據ACMG 總裁 白雪楓透露,協議包括千城特賣落戶美國、在西雅圖建立汽車大數據實驗室等一系列內容。
與會汽車企業嘉賓表示,大眾侃車&千城特賣創新的營銷模式已經解決了渠道下沉的痛點,今天又發布品牌升級戰略,藉助互聯網、大數據和人工智慧能節約營銷成本,體驗、服務更到位。
品牌升級,汽車大數據獨角獸的野心
據介紹,千城數智定位於汽車大數據營銷智庫,立足國內、瞄準國際,以汽車產業為基,掌握大數據資源,提供泛汽車服務,最終為用戶提供智慧汽車生活服務,新的戰略目標是汽車大數據獨角獸。
千城數智顧問、美國密蘇里大學博士、華盛頓大學教授、大數據和人工智慧科學家何曉鋒說,千城數智已有大規模的基礎數據,並將逐漸布局到北美和東盟等國家和地區,加上已在全球大數據及人工智慧之都西雅圖建立汽車大數據實驗室,有望在未來兩三年成長為汽車營銷大數據的"獨角獸"。
營銷升級,數據收集和營運的典範
過去兩年,大眾侃車通過旗下各產品和平台搜集到了大量用戶數據。包括:千城特賣的400callceter+10萬購車經紀人+每年300場以上的O2O周末車展+全國210家汽車連鎖生活體驗館+1900個加盟店(場景營銷);和衍生數據,如汽車生活+汽車金融+汽車置換(保險和個人消費貸款)。其中,數據增量最快的是"千城特賣"以三四五線城市為主的2萬個購車經紀人,這些經紀人每周都有3—5次獲得汽車潛客的機會。
其次,千城數智正在整合和挖掘的數據包括網路+今日頭條+滴滴/京東+大眾侃車網+千城雲媒(7000家)+北美中文網等。"千城特賣"落戶美國及東盟等國家和地區,不僅會豐富數據樣本,也會有小規模數據增量。
海量大數據有什麼用途?據郭登禮博士介紹,這將有助於解決用戶在汽車消費中的決策效率和汽車企業的銷售轉換效率問題;從價格、信息、配置、保險、養護等方面提供數據支持,保證精確信息的投遞,提高信息價值;對未來全球品牌在中國市場的發展提供精準數據及數據分析、決策支持服務;對車輛的個性化定製,智能化解決方案提供數據支持和決策基礎;為汽車金融服務提供精準客戶信息。這正是西雅圖汽車大數據實驗室要解決的問題,也是將實驗室建在全球大數據、人工智慧之都的原因,因為那裡不缺人才,不缺技術,缺的只是原生數據,而這正是"千城數智"的優勢。
成立僅僅兩年多的大眾侃車公司在給企業提供三四五線城市營銷解決方案方面獨樹一幟,切實解決了渠道下沉難的問題,也受到了消費者的極大認可,並在資本市場獲得了兩輪融資,這次戰略發布預示著在升級轉型之後將進入發展快車道。 @2019
㈥ 怎麼評價《終極演算法》這本書.
無論終極演算法是否存在,多明戈斯希望這個大膽的問題能夠激發部分讀者的好奇,甚至被這個問題吸引成為機器學習的專業研究人員。確實,每一種學科都需要至高的理想驅動向前,就如同物理的大一統理論,當無數傑出的天才為一個終極問題孜孜以求時,就算這個問題本身在這些人的有生之年可能沒有答案,但是這個學科一定會因為這些偉大的探索歷程取得輝煌的進步。我想,這也許是因為多明戈斯對機器學習的熱愛夾帶的另一個私貨吧。
㈦ 什麼樣的人工智慧擊敗了職業圍棋手
由谷歌英國研究團隊開發的計算機系統在圍棋比賽中擊敗了職業棋手。作為一種古老的東方棋類游戲,圍棋強調策略和直覺。過去數十年,圍棋一直是人工智慧專家未能攻克的堡壘。然而,人工智慧正在這一領域取得重要突破。
此前,計算機已在其他多種比賽,例如國際象棋、奧賽羅棋和智力競賽《危險邊緣》中勝過了人類對手。然而,圍棋是一種具有2500多年歷史的古老技藝,其復雜程度遠超國際象棋,因此人類高手此前幾乎不費吹灰之力就能勝過即使最強的計算機系統。本月早些時候,谷歌以外的人工智慧專家已提出這樣的問題,即人工智慧在圍棋領域的突破能否迅速實現。而直到去年,大部分人仍認為,計算機擊敗職業棋手還需要10年時間。
然而,谷歌已經做到了這一點。法國研究者雷米·庫洛姆(Remi Coulom)此前曾開發了全球最強大的人工智慧圍棋程序。他表示:「這一天的到來比我想像中更快。」
谷歌於2014年收購了自稱為「人工智慧領域阿波羅項目」的DeepMind。去年10月,DeepMind的研究團隊在倫敦辦公室里主持了人工智慧與人類選手的較量。DeepMind的這一系統名為AlphaGo,而它的對手是歐洲圍棋冠軍樊麾。在《自然》雜志編輯和英國圍棋協會裁判的監督下,AlphaGo在五番棋比賽中取得了5:0的壓倒性勝利。《自然》雜志編輯坦古伊·喬阿德(Tanguy Chouard)博士在本周二的媒體電話會議上表示:「無論作為研究者還是編輯,這都是我職業生涯中最令人興奮的時刻之一。
自然》雜志發表的一篇論文介紹了DeepMind的系統。這一系統利用了多種技術,其中也包括越來越重要的一種人工智慧技術,即深度學習。利用海量的人類高手棋譜(總步數約達3000萬),DeepMind的研究團隊訓練AlphaGo自主學習圍棋。然而這僅僅只是第一步。從理論上來說,這樣的訓練最多隻能培養出與最優秀人類選手同等棋力的人工智慧。而為了擊敗最優秀的人類選手,研究團隊使這一系統自己與自己對弈。這帶來了新的數據,而這些數據可被用於訓練新的人工智慧系統,最終勝過頂尖高手。
DeepMind負責人德米斯·哈薩比斯(Demis Hassabis)表示:「最重要的一點在於,AlphaGo不僅僅是專家系統,遵循人為設定的規則。實際上,這使用了通用的機器學習技術,能自行探索如何在圍棋比賽中取勝。」
人工智慧的這次勝利並不新鮮。谷歌、Facebook和微軟等互聯網服務早已利用深度學習技術去識別照片和語音,或是理解自然語言。DeepMind的技術結合了深度學習、增強學習,以及其他方法。關於現實世界機器人如何學習日常任務,並對周圍環境做出響應,這指明了未來的方向。哈薩比斯表示:「這非常適合機器人。」
他同時認為,這些方法能加速科學研究,通過在工作中引入人工智慧系統,科學家將可以取得更多成果。「這一系統能處理規模更大的數據集,分析得出結構化信息並提供給人類專家,從而提高效率。系統甚至能向人類專家提供方式方法的建議,協助帶來突破。」
不過目前,圍棋仍是他的關注重點。在關起門來擊敗一名職業選手之後,哈薩比斯及其團隊將目標瞄準了全球頂尖的圍棋選手。3月中旬,AlphaGo將在韓國公開挑戰李世石。李世石擁有的國際比賽冠軍頭銜數排名第二,而過去10年中,李世石有著最高的勝率。哈薩比斯認為,李世石就是「圍棋界的費德勒」。
比國際象棋更難
2014年初,庫洛姆的圍棋軟體Crazystone在日本的巡迴賽中挑戰了依田紀基九段,並取得了勝利。不過,這一勝利的成色不足:Crazystone獲得了四子的讓先。當時,庫洛姆預言,在沒有讓先的情況下,人工智慧擊敗頂尖圍棋高手還需要10年時間。
這一挑戰的難度在於圍棋本身。此前,在合理時間內,任何超級計算機都沒有足夠的處理能力,去預判每種可能的著法會帶來什麼樣的後續結果。1997年,IBM「深藍」擊敗了國際象棋大師卡斯帕羅夫,當時這台超級計算機採用了「暴力計算」的方式。從本質上來看,「深藍」分析了每一步走法可能出現的各種結果。然而,這樣做在圍棋比賽中行不通。在國際象棋比賽中,一個回合可能的走法平均為35種。而圍棋比賽採用了19x19的棋盤,平均每回合走法有250種。哈薩比斯指出,圍棋棋盤上的棋型類型要比宇宙中的原子總數還要多。
利用名為「蒙特卡洛樹搜索」的方法,類似Crazystone的系統能完成更多步的預判。而結合其他一些技術,計算機可以完成對多種可能性的必要分析。這樣的計算機能擊敗一些不錯的圍棋選手,但距離頂尖高手還有很大差距。對真正的高手來說,直覺是很重要的一部分。這些棋手會根據棋盤上棋型來選擇如何行動,而不是精確分析每一種著法可能會帶來的結果。哈薩比斯本人也是圍棋選手,他表示:「良好的棋型看起來就很漂亮。這似乎遵循某種美學。這也是這一游戲數千年來歷久不衰的原因。」
不過,在進入2015年之後,一些人工智慧專家,包括愛丁堡大學、Facebook和DeepMind的研究人員,開始探索利用深度學習技術去解決圍棋的難題。他們設想,深度學習技術能模擬圍棋比賽中必要的人類直覺。哈薩比斯表示:「圍棋有著許多暗示,模式匹配很重要。深度學習可以做得很好。」
自我增強
深度學習的基礎是神經網路。這種由軟硬體構成的網路能模擬人腦中的神經元,其運轉並非依靠「暴力計算」和人工制定的規則。神經網路會分析大量數據,以從事某項任務的「學習」。例如,如果向神經網路輸入足夠多的袋熊照片,那麼它就能識別出袋熊。如果向神經網路輸入足夠多的單詞發音,那麼它就能識別你的語音。如果向神經網路輸入足夠多的圍棋棋譜,那麼它就能學會如何下圍棋。
在DeepMind、愛丁堡大學和Facebook,研究人員希望,通過「觀察」棋盤棋型,神經網路能掌握下圍棋的方法。正如Facebook近期在一篇論文中所說,這一技術的運行情況良好。通過深度學習和蒙特卡洛樹方法的結合,Facebook的系統已經擊敗了一些人類選手。
不過,DeepMind在此基礎上更進一步。在學習了3000萬步人類選手的圍棋下法之後,這一神經網路預測人類選手下一步走法的准確率達到57%,遠高於之前的44%。隨後,哈薩比斯及其團隊對這一神經網路進行了小幅調整,使其與自己對弈,這種做法被稱作增強學習。在這一過程中,神經網路可以了解,什麼樣的走法能帶來最好的結果。
DeepMind研究員大衛·希維爾(David Silver)表示:「通過在神經網路之間進行數百萬局的對弈,AlphaGo學會自己發現新策略,並逐步改進。」
希維爾表示,這使得AlphaGo能勝過其他圍棋軟體,包括Crazystone。隨後,研究人員將結果輸入至另一個神經網路。在首先判斷對手的下一步行動之後,這一神經網路能利用同樣的技巧去預判每一步的結果。這與「深藍」等較老的系統類似,而不同之處在於AlphaGo能在過程中進行學習,並分析更多數據,不再使用暴力計算的方法去判斷所有可能的結果。通過這種方式,AlphaGo不僅能勝過當前的人工智慧系統,還能擊敗人類高手。
專用晶元
與大部分先進的神經網路類似,DeepMind的系統運行在基於GPU(圖形處理晶元)的計算機上。GPU最初的設計目的是游戲和其他圖像應用的圖形渲染,但近年來研究表明,這類晶元也非常適合深度學習技術。哈薩比斯表示,DeepMind的系統在配備多個GPU晶元的單台計算機上有著相當好的表現,但為了挑戰樊麾,研究人員搭建了更龐大的計算機網路,其中包括170塊GPU卡和1200個標准CPU處理器。這一龐大的計算機網路對AlphaGo進行了訓練,並參與了比賽。
哈薩比斯表示,在與李世石的比賽中,AlphaGo將採用同樣的硬體配置。目前,他們正在持續改進這一人工智慧系統。為了准備與李世石的比賽,他們還需要互聯網連接。哈薩比斯表示:「我們正在安裝自己的光纜。」
庫洛姆和其他一些專家指出,與李世石的比賽將更困難。不過,庫洛姆已經下注DeepMind。過去10年中,他一直希望開發出能勝過頂尖圍棋高手的系統,他認為,這一系統現在就在這里。他表示:「我正在購買一些GPU。」
未來之路
AlphaGo的重要性不言而喻。這一技術不僅可以應用於機器人和科學研究,也適合其他許多任務,例如類似Siri的移動語音助手以及金融投資決策。深度學習創業公司Skymind創始人克里斯·尼克爾森(Chris Nicholson)表示:「你可以將其用於任何具有對抗性的問題,例如需要用到策略的各種比賽,以及戰爭和商業交易。」
對一些人來說,這種情況令人擔憂,尤其考慮到DeepMind的系統已經有能力自學圍棋。AlphaGo的學習素材並不來自人類,而是可以通過自行生成數據來自我指導。近幾個月,特斯拉創始人伊隆·馬斯克(Elon Musk)等知名人士曾表示,這樣的人工智慧系統最終將超越人類智力,突破人類的控制。
不過,DeepMind的系統受到了哈薩比斯及其團隊的嚴格控制。AlphaGo被用於最復雜的棋類游戲,但這仍只是一款游戲。實際上,AlphaGo距離真正的人類智慧還有遙遠的距離,遠遠沒有達到超級智能的水平。
華盛頓大學專注於人工智慧的法學教授、科技政策實驗室創始人瑞安·卡洛(Ryan Calo)表示:「這仍是一種高度結構化的情況,並非真正人類水平的理解力。」不過,AlphaGo指明了未來的方向。如果DeepMind的人工智慧系統能理解圍棋,那麼就能理解更多信息。卡洛表示:「宇宙只不過是一場更大的圍棋游戲。」
㈧ 《終極演算法機器學習和人工智慧如何重塑世界》epub下載在線閱讀,求百度網盤雲資源
《終極演算法》([美] 佩德羅·多明戈斯)電子書網盤下載免費在線閱讀
資源鏈接:
鏈接:https://pan..com/s/1az3Npn6XLJgEnftJYKHEtg
書名:終極演算法
作者:[美] 佩德羅·多明戈斯
譯者:黃芳萍
豆瓣評分:7.1
出版社:中信出版集團
出版年份:2017-1-1
頁數:402
內容簡介:
演算法已在多大程度上影響我們的生活?
購物網站用演算法來為你推薦商品,點評網站用演算法來幫你選擇餐館,GPS系統用演算法來幫你選擇最佳路線,公司用演算法來選擇求職者……
當機器最終學會如何學習時,將會發生什麼?
不同於傳統演算法,現在悄然主導我們生活的是「能夠學習的機器」,它們通過學習我們瑣碎的數據,來執行任務;它們甚至在我們還沒提出要求,就能完成我們想做的事。
什麼是終極演算法?
機器學習五大學派,每個學派都有自己的主演算法,能幫助人們解決特定的問題。而如果整合所有這些演算法的優點,就有可能找到一種「終極演算法」,該演算法可以獲得過去、現在和未來的所有知識,這也必將創造新的人類文明。
你為什麼必須了解終極演算法?
不論你身處什麼行業、做什麼工作,了解終極演算法都將帶給你嶄新的科學世界觀,預測以後的科技發展,布局未來,佔位未來!
作者簡介:
佩德羅•多明戈斯(Pedro Domingos)
美國華盛頓大學計算機科學教授,加州大學歐文分校信息與計算機科學博士,在機器學習與數據挖掘方面著有200多部專業著作和數百篇論文。
國際機器學習學會聯合創始人,《機器學習》雜志編委會成員,JAIR前副主編。
美國人工智慧協會院士(AAAI Fellow,國際人工智慧界的最高榮譽),榮獲SIGKDD創新大獎(數據科學領域的最高獎項)、斯隆獎(Sloan Fellowship)、美國國家科學基金會成就獎(NSF CAREER Award)、富布賴特獎學金、IBM學院獎以及多個頂級論文獎項。

㈨ 《終極演算法機器學習和人工智慧如何重塑世界》epub下載在線閱讀全文,求百度網盤雲資源
《終極演算法機器學習和人工智慧如何重塑世界》([美]佩德羅·多明戈斯)電子書網盤下載免費在線閱讀
鏈接:https://pan..com/s/1VygoLeNPNozcQ9vOBI9rjg
書名:終極演算法機器學習和人工智慧如何重塑世界
作者:[美] 佩德羅·多明戈斯
出版社:中信出版集團
副標題:機器學習和人工智慧如何重塑世界
原作名:The Master Algorithm: How the Quest for the Ultimate Learning Machine Will Remake Our World
譯者:黃芳萍
出版年:2017-1-1
頁數:402
內容簡介
演算法已在多大程度上影響我們的生活購物網站用演算法來為你推薦商品,點評網站用演算法來幫你選擇餐館,GPS系統用演算法來幫你選擇最佳路線,公司用演算法來選擇求職者……當機器最終學會如何學習時,將會發生什麼?
作者簡介
佩德羅•多明戈斯(Pedro Domingos)美國華盛頓大學計算機科學教授,加州大學歐文分校信息與計算機科學博士,在機器學習與數據挖掘方面著有200多部專業著作和數百篇論文。國際機器學習學會聯合創始人,《機器學習》雜志編委會成員,JAIR前副主編。美國人工智慧協會院士(AAAI Fellow,國際人工智慧界的最高榮譽),榮獲SIGKDD創新大獎(數據科學領域的最高獎項)、斯隆獎(Sloan Fellowship)、美國國家科學基金會成就獎(NSF CAREER Award)、富布賴特獎學金、IBM學院獎以及多個頂級論文獎項。

