吳軍談機器智能:創(chuàng)新和創(chuàng)業(yè)的下一個浪潮

2014/11/21 09:16      吳軍

圣克拉拉會議中心(Santa Clara Convention Center)位于硅谷中心地帶,2014年11月14日,在一片“硅谷藍”的映襯下,“The New Billions”——中美創(chuàng)業(yè)新貴硅谷峰會暨2014創(chuàng)業(yè)邦年會在此舉辦。豐元創(chuàng)投合伙人、前騰訊副總裁、谷歌搜索專家吳軍發(fā)表演講,他從技術角度講解未來發(fā)展趨勢。在他看來,機器將能解決很多智能問題。未來機器會接管很多原來人做的事情。尤其是對于中產階級,比如律師、醫(yī)生這樣的行業(yè)領域,今后將會成為一個“很悲催”的世界,因為“機器在拿掉他們。”他說,這個領域市場會變成2%而不是98%賺錢。

以下為現(xiàn)場實錄:

吳軍:我們今天講一些具體一點的Technology Intelligence “機器智能”。我不用人工智能這個詞,因為人工智能是一個很窄的詞,而且實際上它很多年前已經走到了死胡同。

Machine Intelligence是一個現(xiàn)在正在發(fā)生的、在過去也發(fā)生、在將來也會產生非常大的結果的科技趨勢或者技術。先看什么是Machine Intelligence。我們一般理解的機器人,比如電影,亞洲和美國有個差別,美國的機器人都比較有力量,比如鋼鐵俠、變形金剛;而亞洲的稍微人性化一點,最典型的是阿童木,所以我一說機器人大家可能想到的是這樣的形象。不管中國的還是美國,這里有兩個實際的機器人,一個小圓盤子,可能很多在美國生活人家庭用過這個iRobot公司做的一個能自動掃地的機器人,就是像這個掃起來很輕而易舉。另外一個是美國發(fā)射到火星上的Curiosity “好奇者”火星探測器,是一個核動力的裝置。但是這個機器人既不是變形金剛、阿童木,也不完全是iRobot或者好奇號,因為我們知道人在進化的過程中,最后和我們的近親大概100多種靈長類差別在哪兒?不是我們的手和腳,我們的手和腳不一定比大猩猩或者黑猩猩更發(fā)達,而是腦子,所以這機器人最重要的是這個。

那什么叫機器有智能?我們現(xiàn)在要講這個問題,五十年代的時候,計算機的老祖宗阿蘭•圖靈給出這么一個定義——這是今天大家被認可的,定義的非常巧妙——他就是說如果我們在這個屏幕后面,這是兩個屏幕,一個屏幕后面放一個計算機或者一個機器,另外一個屏幕后面放一個人,然后我問他一個問題,比如說天為什么是藍色的?然后讓他們回答,如果你判斷不出來哪一個是機器回答哪一個是人回答的,那么我就說這個機器有智能。這種測試方法應該是公平的,我想大家也會接受。

這是五十年代的事,后來五十年代末大家就開始搞所謂人工智能。這個人工智能呢,過去最早想人是怎么做這個智能的事情?用機器模仿人,基本上是這樣一個想法,那么具體的細節(jié)就不講了,我們這如果有很多學計算機的話,會知道這個細節(jié)。最后無非學過人工智能化,就是怎么摘個香蕉、計劃一下這么一個Planing。這條今天在各個大學,美國各個大學包括中國大學里頭,雖然會教這個課,但是不會教專門研究這個事,因為也拿不著錢,也沒有產生什么特別的結果。

到了六十年代末了,其實大家意識到讓機器模仿人好多事情是做不到的,那么接下來這時候,最早發(fā)現(xiàn)這個問題的是一個非常有名的科學家叫Wesley,他68年的時候得了圖靈獎,他66年的時候提出一個問題,他就說這么兩句話,就是說“The pen was in the box ”和“The box was in the pen”,第一句話好理解,鋼筆在盒子里,第二句話怎么理解?為什么說盒子在鋼筆里?也就是第二句話不好理解了。在英語里Pen實際上還有一個意思,就是小孩玩兒的圍欄,那么這就好理解了,就是把盒子放在圍欄里頭。那從人工智能的角度或者從智能的角度來講,這個就有問題,這個“pen”,我怎么知道是一個圍欄。在任何的上下文中,你講一篇文章看不到這一點,而且你看不到這個圍欄比這個盒子大,這件事不知道,你要知道這件事你需要什么?你需要World knowledge對世界的知識,這就是為什么用傳統(tǒng)的方式做機器智能做不下去,就是說我們人類能理解這些事,因為我有一個世界知識,這兒有一個叫做臺階,我走下去我不摔跤,但你一個Robot這個就走不好,它摔下去就起不來了,就趴在火星上,就起不來了,那么這個很大程度上是世界的知識。

然后七十年代,就是這兩個人(ppt)。這是2000年的時候,我參加ICAS一個會,他給的一個Talk,題目就叫From Watergate to Whitewater,所以我把這個兩個人放在這了,為什么呢?因為在產生 Watergate水門事件的這一年,尼克松這樣很悲催,他們在IBM開始了通過數據驅動的方法,或者統(tǒng)計的方法來解決智能問題的最早嘗試,就是在語音識別上,這是他們起源于1972年。然后到他給TALK的時候是2000年,再過去了將近三十年,這里頭有一個巨大的進步,也就是說這三十年整個人慢慢開始認識到,機器來實現(xiàn)智能不是來模仿人的辦法而是要計算,機器實現(xiàn)智能是通過計算來實現(xiàn)。這是第一,第二需要有data。這是在從尼克松到Wesley這28年之間,科學家們認識到這一點,很遺憾的是在做機器學習或者計算機領域以外,很多人包括好萊塢他們拍一個電視的時候,講這個東西的時候,還一直像大家傳達一個非常錯誤的概念,就是一個人工智能的概念。你跟沒有這個經驗的人談這個,你發(fā)現(xiàn)你是沒法談的,因為他還在想計算機是否像人似的突然它能夠有creative thinking,然后它突然有了意識。計算機實現(xiàn)技術智能就是要靠計算,那么當時最早實現(xiàn)的是兩個計算機解決智能問題,一個語音識別,我畫的一個語音波形的圖一個人說話,還有一個是機器翻譯,就是你們今天用谷歌,今天你們用的Google voice或者Google translation,都用的很好。機器翻譯我旁邊畫一塊石頭這石頭叫rosetta,你們去買機器翻譯的軟件,大部分好多名字都叫rosetta,至于為什么叫rosetta呢?我可以自己做一個廣告,可以去讀我的新的書《文明之光》里面會講為什么是叫做rosetta。

好了,現(xiàn)在這些東西大家都知道,都是用的,就是說機器能夠解決很多人智能的問題,那么再難一點的問題,這是一直過去沒解決的,就是說你計算機,我們回到阿蘭•圖靈的這個假設,你到底能不能回答問題,這個在兩年前這個事還做不到,到兩年前呢,我們開始在google里頭來做這個事,那時候我離開騰訊,回google就來做這件事,我們大概有一個跨國的team,剛才那個熊總和趙總都講中國國際化,其實你看google做事就知道,中國國際化差的還非常非常遠,當時我那個team來自于四個地方,除了舊金山以外,有紐約的,以色列和蘇黎士的,這些科學家和工程師大家一起來做這個?;舜蟾艃赡甓鄷r間,到我離開以前,這件事我們做完了?;旧线@是機器給的,答案,你現(xiàn)在大概看不出來這是機器回答的問題還是人產生的答案,“為什么天是藍”它給的一個解釋,因為光會散射,然后藍光和紅光的透射率是不一樣的,最后紅光梢下來了,藍光留到天上了,大概是這樣子,這是這么一個,另外一個類似的問題就是說為什么夏天比冬天冷,這個回答問題是這樣,在學術界一般把所有的結論體叫做WH(word sentence)這個句子,就是說……因為它第一個詞都是W或者H,就是How和H,怎么怎么做什么事,然后問你什么時間,什么地方,什么人物,WHO、When、Where、Why和what都是W,真正比較難回答的是WHY為什么的問題和How的答案是怎么做的問題,至于那個一些事實,你查一查寫一些模式匹配都能找到,比如說以習近平哪天生的,奧巴馬哪天當總統(tǒng)的,這都能找到。所以我們真正專注就是說能否回答這個問題。

這些事做完了,從阿蘭•圖靈的論點來講,計算機有智能了,那么再接下來說這個是怎么做的?首先呢要說這跟傳統(tǒng)的人工智能沒有半毛錢的關系,這個實際上我們得益于兩個東西,第一個就是計算機速度的提升,因為靠大量的計算。我給了這么一張圖,這是叫摩爾定律,隨著時間的推移,橫軸是時間,縱軸是半導體芯片里面的transister的數量,你可以看到,就是說這個縱軸不是一個線性的,是一個指數的,所以它是一個指數增長,靠的是這個。我們假設說一開始計算機比較笨,但是它能算,如果你有好的數學模型,能夠把智能問題變成數學問題,你可以想象人的智能的提高如果比水平的好一點是緩緩的一個往上走的一個很滿的趨勢,計算機是explancial的往上走,那它在某一點一定會交上,然后接下來計算機就會走的比人快的多。從此以后,人就比較悲催了,所以現(xiàn)在基本上到了turning piont,這是第一個,就是靠著是計算機速度大。第二個是靠數據。為什么能夠回答這些問題?因為構成這些問題答案的pieces現(xiàn)在在互聯(lián)網上找的到,如果回到十年前也做不到這么一點,這個計算機并不會推理,但它并不需要推理,它只要會算就行,然后有足夠多的數據,所以我現(xiàn)在已經講了兩點了。就是摩爾定律不用說了,就是半導體人干的事,跟大家可能也沒什么關系,過去四十年,我們世界的IT發(fā)展,基本上是被摩爾定律所控制的,你信也好,不信也好,它就是在起作用,你要信了它,你就趕上了四十年代IT發(fā)展的浪潮,接下來呢,至少二十年往后看,這個世界將是被數據控制的,也是一樣,你信它也好,不信它也好,就是這樣,你信了它,你就有下一個機會,你不信它,你可能就錯過了。

那么再接下來就要講一個,就是說計算機有了這些數據,你怎么來算好呢?那里頭就google提出一個深度的學習,說起來很好聽叫Google brain,我本來想畫一個腦子的圖,后來想會誤導大家,我就把它里頭真實的圖畫出來,其實這個是一個人工神經網絡,這個人工神經網絡和幾十年前的沒有太大差別,為什么Google選了這樣一個作為機器學習的工具?因為在過去的幾十年里,很多機器學習的算法也好,工具也好,它不斷的在改進,比如說你用這個Basin Network貝司網絡,這些東西他們都不愛看,唯有這個人工神經網絡,基本算法不變。不變的好處在于說我搭一個平臺,我可以不用天天在里頭變那些實線,我可以穩(wěn)定的運行很多東西,至于這里頭的是怎么實現(xiàn)的Google這個東西,因為對數學稍微有一點有興趣的,一個是對大數據有興趣的,一個對深度學習的,我在新的這本書《數學之偉》第二冊里頭也講,專門兩章來講這個。

講完了到底現(xiàn)在比較正確的機器智能的道路是怎么走的,那么我們看看結果。這里頭有兩個車(ppt),一個是Ggoogle自動駕駛汽車,剛才我講了,當計算機的計算速度和它的power到了一定點的時候,它跟人開始要分化,它就要開始比人能干了,所以在大概十幾年前,大家已經意識到這點的時候,大家就在想很可能將來有一天,計算機要接管我們本來屬于人該干的事,那么這件事都被它take走了,我們人還能干哪些事呢,可能會干什么?兩個經濟學家來討論這個事,我要沒記錯是MIT Sloan商學院,然后他們想來想去,這是2004年的事,說有一件事可能計算機干不了,就是開車,因為為什么呢?兩個原因,因為路況太復雜了,這個東西要做同時做出好多判斷,這是第一個。第二個就是當時美國的美聯(lián)政府資助的一些研究項目,然后后來大家把自己研制的自動駕駛汽車拿到沒有人的路上跑一跑,實際上類似沙漠這種地方跑一跑,當時2004年的時候,跑第一名的我要沒記錯的話,開到十三邁左右的時候就死掉了,大概是二十公里就死掉了,剩下的車還不如它,當時開的速度是每小時五邁,大概我們人走路是每小時三英里,五英里比我們人走路要快一點,比自行車要慢很多,就是這樣,所以04年其他車有的撞的不象樣了,所以當時大家就想這個可能是機器取代不了人的地方,因為它好像不完全是計算問題。但是呢,實際上這種問題,它最后也變成了一個計算和數據的問題,所以到2010年,根據《紐約時報》的報道,紐約時報報導說Google的無人駕駛車當時已經跑了十幾萬英里在美國的高速公路和當地一些地方,沒有出過一次事故,十幾萬英里已經快趕上我們人半輩子的開的車了,在內地和城市。當然也出了一次事故,不是它撞人,是后面的人撞它。所以這個你可以看到,我們以前很多想象不到的事情,你現(xiàn)在機器在幫你接管,第一個Google最早的原型是用的Toyota的這個車,后來是自己造的車,沒有方向了,你如果能夠仔細看的話,我不知道這個圖片清楚不清楚,里面是沒有方向盤,沒有油門,沒有剎車,只有一個開和關,但是后來根據加裝的要求加了一個緊急制動。

好了,那就是說這個無人汽車是一種,你叫機器人也好,叫智能的機器也好,那講我們自己最近投的兩個公司。其實Google收購了一個公司Nest,你可以認為是智能家具的一部分,其實按我標準來衡量,它其實是某一種機器人的一個觸手,或者是一個眼睛,真正的現(xiàn)在我們談的最重要的機器人是在data center區(qū)域中心背后的這些十萬臺甚至更多的服務器,以及上面非常聰明的算法,我剛才已經顯示了,比如說深度學習這些算法,以及大量的數據。那么讓我們投了兩個,第一個很小的一個鼓出來一個是一個智能的澆水的一個機器人,就是在你們家可以把你們院子里面澆一點,看看哪兒比較干就多澆點水,那比較濕就少澆一點水,這個是這樣一個joblet,在《時代周刊》上也在里頭做了一個介紹,這里頭他有時候能省掉家里99%的水,因為你大部分的時候很多地方是不需要澆水的。后來它賣出去以后,很多人拿它做了別的事,不完全是澆水,比如說洗窗戶和洗車,因為它可以編程它的高度、角度以及走到哪兒的位置等等,有人發(fā)現(xiàn)它在干這個。上面一個無人機,現(xiàn)在是一個比較Hot Talking,這也是我們在z-park投了兩家公司,這個無人機叫Skytech現(xiàn)在這個估值已經高的不得了了,大概五億美元,我們投的時候還很小,APPLE的這些公司都在用它,它倒不是制造智能機,無人機它是本身一套完整的智能的系統(tǒng),就是說它的所有的操作全是相當于自動,就是相當于有機器人后面幫他在做,比如說電池沒了換電池,然后把存儲卡拿下來換存儲卡,這些輸出給將來的用戶,所有這些事全是自動來做,就是每天你只要給它派任務就行了,剩下的事你不用管了,這是一類,就是我們說Machine Intelligence更重要的我想講的,實際上我們將來真正做的比較可怕的是Intelligence,是在數據中心后的一萬臺服務器,或者說一百萬臺服務器。

我剛才講了,說人比靈長類的動物優(yōu)勢的地方在于腦子,實際上我們把我們現(xiàn)在的想法開拓一點,就是說ROBOT機器人這個東西,它不光是一個你看的見、摸得著的這么一個不管是人形的也好,車狀的也好,還有盤式的也好,這樣的東西,機器人我們說機器智能,它可能是在我們墻背后一大堆的服務器,至于它伸出那些觸手是什么樣,可能是次要的,這是我將的,未來的趨勢會帶來我們社會一個什么變化,會改變我們這個社會。

(ppt)這是郭臺銘的富士康的工廠,看一看,這是裝的蘋果的生產線,我看到都覺得很震驚,這個廠房簡直大的不得了,左邊這個好吧,然后下面是一些很悲催的女工,就是我們叫做賣血汗錢,我跟你講未來的日子,這些人可能更悲摧,因為你想賣血汗都沒有地方去賣血汗了,上面是他們搞的機器人,郭臺銘說要20萬個機器人,那么我就是說你可以看到這個Machine Intelligence這對社會的一個沖擊,這不是我講的一個浪潮,也可以說我這個人聰明,我不會去生產線,這跟我沒關,我也不賣血汗錢,那好再看一個例子。(ppt)這是美國一個放射科醫(yī)生,非常陽光的一個女性,是放射科醫(yī)生。在美國生長的人大概知道,就是說這是一個???,你拿到這個放射科的工作的話,在此以前你得受些苦,就是說你先要上四年大學,然后你再上四年醫(yī)學院,中間你沒有間斷,很有運氣,完了以后你做四年的實習醫(yī)生,然后再去做兩年fellow??频膶嵙?,這時候你的那些高中同學們早就結婚生子,孩子都老大了,你可能還是單身一個人,等等那些人事業(yè)上已經升成了一個經理或者主管了,這時候你去告他我最近剛拿到一個工作的OFFER,讓他給我一份工作,不過年薪是50萬美元,這就是今天美國放射科醫(yī)生的生活,那么接下來是什么?

(ppt)這也是一個放射科醫(yī)生,但它是一個機器人,剛才講了,機器人不一定要使用手和腳還有輪子,可能是一個數據中心后的一萬臺服務器,也可能是很智能的機器,他檢測癌癥這個準確性,比我們看這個片子,比我們放射科醫(yī)生看的還好,而且我們人看片子的結果準確與否,可能會今天的心情有關系,比如今天早上吃了警察的一個罰單,今天一天可能都不太高興,機器沒有這個問題。所以你可以想,未來是這樣一個世界。再講一個例子,你發(fā)現(xiàn)大家在硅谷買房子的人有幾類人,就是說比如說辦公司發(fā)財的,比較早去了Google、Facebook的,或者你在某一個公司升遷特別快的基本上就是這幾類人,當時30%的錢都是來自于中國大陸,還有一類人就是我們說的professional,比如說醫(yī)生、律師是很掙錢的。

我這給出幾和數字。第一個數字,一百個million一個億。這是媒體上披露出來的Goole和Warlm、Pulm打官司花掉的律師費。第二個Number是什么?第二個是蘋果和三星打官司,最后有些官司是調解了停下來了。判完了以后蘋果說我太虧了,你三星幫我出一部分律師費,這是它要求三星幫它付的律師費十六個million,這個官司呢,總的花了錢,被認為是幾個億,多少億不知道,是X這樣的。第三個Number就是十萬美元,這是他花一萬美元買了一個軟件,這個軟件幫它掃描兩百萬份各種各樣的文件,因為打官司文件很多,然后他十萬塊錢打完了這個官司,所以你看這個差別,我就接著想說,我們這很多律師你可以收費一小時1000美元,這些人可能慢慢他們的工作在丟失。放射科醫(yī)生還有律師是我們過去收入最好的。這個在丟失,那么今后是一個什么樣的世界,你承認也好,不承認也好,你是否相信republic或democracy都沒關系,這是一個事實,這是Occupy Wall Street(占領華爾街運動)。所以你看這個樣子很悲摧的,他們反對,反對什么?反對華爾街,華爾街是誰?沒有目的的,為什么?美國的問題不是華爾街的問題,是manystreet是(01:31:46)的問題,這些人在今后他可能變得更悲催,政府可以給他救濟,可以給他錢,讓他吃的更飽,但他的未來是灰暗的,因為Machine在不斷的剝奪他們的工作,你承認也好,不承認也好,未來是制造data center背后那些Machine的那2%的人,在通過Machine在控制我們的世界,你可以不承認這一點,你是一個慈善家,是一個社會學家,你可以不承認這一點,這是科技的一個事實。你可以制定很多政策來保證他們的福利,但是我想講在座的這些人你們是加入98%還是2%,自己想,這是美國的薪水的變化,不是說我們科技發(fā)展,我們錢越掙越多,像熊總和趙總講都發(fā)財了,不是這樣的。

(ppt)你可以看到美國的薪水是一個往下的趨勢,奧巴馬的政策使得我們失業(yè)率下來了,但是平均工資沒有上去,為什么?因為它找回來都是more income的工作。而Machine接管的是那些我們過去認為白領的需要人類智慧的工作,那么最后一張圖綠色的線是硅谷的房價,漲的很快,為什么能長那么快?這是自然增長每年地方長那么快,當然中國來了30%的那些錢很重要,那一點,那個底下紅色的積累出來,那是在這兒的明星公司,Google、Apple、Facebook他們累積起來的財富,但他們員工人很少。這個當年GM是世界上最大的公司的時候,在六十年代的時候,是雇了幾十萬上百萬的人,是一個世界范圍內八十萬的員工,今天市值最大的公司Apple多少人?八萬人,加全球的最多不能超過十萬人,估值比它大,也就是總的價值的比它大,也就是說這么多錢不是八十萬人分,是十萬人在分,所以這就是為什么這有些人能買的起的房子的原因,就是要么join這98%,要么join這2%,不管政治家口號是什么樣?科技和經濟的發(fā)展,機器的結果就是這樣的。

那么,接下來講這個投資。Machine Intelligence是我們一個焦點,而說起來我是否投資、做VC就一定好了,不一定,因為一半的VC是賠錢的,我們現(xiàn)在大概做到是估值的兩倍多,已經大概80%的這些VC了,那怎么能夠成為2%的人,而不是這98%的人,那這就是留給大家的問題。

趨勢就在這兒,這是不可逆轉的,Machine會TAKE人的好多工作,那么你只有現(xiàn)在來講變成這2%的人而不是98%,好謝謝大家。

相關閱讀