極客愛上“刷臉”:投資人怎么看?

2014/03/31 13:52     

追捕目標(biāo)的特工逆行在人群中,目之所及,每位旅客的個(gè)人信息,不斷被他的隱形眼鏡識(shí)別和顯示——電影《碟中諜4》中經(jīng)典的一幕,讓人印象深刻。

MH370迷航的第一周,當(dāng)乘客持假護(hù)照登機(jī)的消息傳出時(shí),滿懷猜疑的人們希望電影場景里的迅捷反應(yīng),能夠出現(xiàn)在真實(shí)的身份認(rèn)證中:從機(jī)場錄像上及時(shí)辨認(rèn)出乘客的臉部信息,再實(shí)時(shí)地從云端的人臉數(shù)據(jù)庫內(nèi)調(diào)取匹配的那一個(gè)。

現(xiàn)實(shí)中,馬航尋人的速度無法與電影相提并論。而在此時(shí),對(duì)人臉識(shí)別的關(guān)注,已悄然催長了漢王科技(002362)、佳都科技(600728)等數(shù)只相關(guān)概念的個(gè)股。人臉識(shí)別技術(shù)被寄望為安檢加碼,提高機(jī)場、車站等公共場所的安全防范水準(zhǔn)。

這項(xiàng)誕生良久的技術(shù),隨著互聯(lián)網(wǎng)化的加深,早已不再是一項(xiàng)孤立存在的技術(shù),而是幾大步驟上下協(xié)同的“流水線作業(yè)”:第一步是人臉檢測,通俗地說,就是確定位置,找到人臉“在哪里”;第二部為關(guān)鍵點(diǎn)檢測,找準(zhǔn)五官做進(jìn)一步分析;第三步才是基于大規(guī)模數(shù)據(jù)的人臉識(shí)別。

通過設(shè)備傳遞,人臉識(shí)別技術(shù)將過去不能被設(shè)備理解的圖片信息,逐漸變成可以被機(jī)器理解分析的結(jié)構(gòu)化數(shù)據(jù),從而大大提高機(jī)器對(duì)人的了解,為人提供更準(zhǔn)確的推薦、提高各種信息服務(wù)的有效性能。

針對(duì)這場“三部曲”,國際上分別有一套公認(rèn)的評(píng)測體系,即人臉檢測FDDB評(píng)測、人臉關(guān)鍵點(diǎn)定位300-W評(píng)測和人臉識(shí)別LFW評(píng)測。

過去六個(gè)月的時(shí)間里,誕生于清華校園的創(chuàng)業(yè)團(tuán)隊(duì)Face++(北京曠視科技有限公司)接連拿下了這三項(xiàng)檢測的世界第一。3月19日、20日,LFW評(píng)測集上,F(xiàn)ace++與facebook先后宣布獲得97.27%和97.25%的性能,F(xiàn)ace++以0.02%的優(yōu)勢暫時(shí)領(lǐng)先。

但Face++聯(lián)合創(chuàng)始人唐文斌回應(yīng)21世紀(jì)經(jīng)濟(jì)報(bào)道記者,“大家對(duì)人臉識(shí)別的預(yù)期到了大學(xué)生的水平,而我們所做的其實(shí)只達(dá)到了初中生的階段。”在投資者的關(guān)注和期待下,這項(xiàng)技術(shù)的成熟度和商業(yè)化前景卻尚待觀察。

極客重返技術(shù)路

“之所以創(chuàng)業(yè),一方面看自己擅長什么,一方面看什么有價(jià)值。我們學(xué)習(xí)的都與機(jī)器學(xué)習(xí)和視覺強(qiáng)相關(guān),對(duì)這一塊比較有把握。”清華大學(xué)計(jì)算機(jī)系2006級(jí)、2007級(jí)的本科生中,唐文斌專攻圖像搜索,印奇擅于視覺識(shí)別,楊沐則在數(shù)據(jù)挖掘方面見長。

2011年,拿到人生中第一臺(tái)iPhone的唐文斌,琢磨著能不能通過自拍的前置攝像頭,做些有創(chuàng)意的產(chǎn)品。恰逢體感游戲機(jī)風(fēng)靡之際,唐文斌約住在樓上宿舍的印奇,用視覺技術(shù)方面的積累一起做開發(fā)。“一開始沒想創(chuàng)業(yè),做更多好玩的東西,順便賺點(diǎn)錢”,抱著這兩條原始簡單的想法,他們開始了第一波創(chuàng)造實(shí)踐。

最后的成品是一款名叫《烏鴉來了》(Crows Coming)的體感游戲,玩家通過搖晃頭部控制游戲里的稻草人,攔截從天而降偷食莊稼的烏鴉。這款小游戲一度沖上App Store排行榜的前五名,盡管在91助手上下載量表現(xiàn)不俗,但全部獲利僅有270多美元。

面對(duì)沒有成功變現(xiàn)的幾十萬下載量,他們打算重返技術(shù)之路。但轉(zhuǎn)軌的深層原因在于興趣本身:手游不是唐文斌和印奇的真正樂趣所在,“自己不是用戶的話,玩這個(gè)是很危險(xiǎn)的;團(tuán)隊(duì)的基因在技術(shù),把技術(shù)做到最好才有成就感”。

而更為本質(zhì)地說來,這幾位青年人都篤信,把機(jī)器變得更加智能一定是大趨勢所在。“讓機(jī)器聽懂語音、看懂視頻,這點(diǎn)不會(huì)錯(cuò),至于我們會(huì)成為先驅(qū)還是先烈就要再看了”印奇說,“而在視覺信息里,人臉信息是最有信息量的。”2011年,當(dāng)謝爾蓋·布林佩戴著Google Glass出現(xiàn)在谷歌I/O大會(huì)上時(shí),他們看到新的機(jī)會(huì)正在展開。

就在Face++團(tuán)隊(duì)的年輕人踟躕的6月,另一硅谷巨頭Facebook宣布收購來自以色列的人臉識(shí)別技術(shù)公司Face.com,把它的核心技術(shù)團(tuán)隊(duì)悉數(shù)搬到硅谷,并很快關(guān)閉了應(yīng)用開放接口(API)。

Face.com入口的關(guān)閉正是Face++的機(jī)會(huì),兩家公司技術(shù)原理類似,當(dāng)前者被納入巨頭的懷抱,后者選擇開放服務(wù),在云端面向開發(fā)者提供技術(shù)服務(wù),不失為一種差異化的選擇。

創(chuàng)造者遇見投資人

當(dāng)Face++的團(tuán)隊(duì)還在做手機(jī)小游戲時(shí),與清華園一街之隔的聯(lián)想之星已經(jīng)“盯上”了這支連曠視科技公司都尚未創(chuàng)立的學(xué)生團(tuán)隊(duì)。

對(duì)于定位在早期天使的聯(lián)想之星來說,與清華等高校的系統(tǒng)接觸,發(fā)掘技術(shù)領(lǐng)先的項(xiàng)目,是投資遵循的基本路徑之一。而云時(shí)代的人臉識(shí)別恰是聯(lián)想之星投資副總裁劉維的重點(diǎn)關(guān)注領(lǐng)域。

劉維曾這樣表述看好的理由:“一個(gè)聽上去很傳統(tǒng)的領(lǐng)域,隨著移動(dòng)設(shè)備、云端計(jì)算能力的普及和識(shí)別算法的大突破,開始真正進(jìn)入了臨爆點(diǎn)。過不了幾年,人臉登錄、人臉?biāo)阉鞫紝⒊蔀楝F(xiàn)實(shí),屆時(shí)人臉將是最自然、信息量最大的入口,手機(jī)也好,新一代的眼鏡、智能家庭、智能城市也好,有廣闊的應(yīng)用場景。”

然而,人臉識(shí)別的有效性遠(yuǎn)遠(yuǎn)比不上它在電影中神乎其技的表現(xiàn)。唐文斌對(duì)21世紀(jì)經(jīng)濟(jì)報(bào)道記者打了一個(gè)比方,“大家對(duì)人臉識(shí)別的預(yù)期到了大學(xué)生的水平,而我們所做的其實(shí)只達(dá)到了初中生的階段”。

這項(xiàng)遠(yuǎn)不成熟的前沿技術(shù),讓Google、Facebook為代表的世界級(jí)團(tuán)隊(duì)競相在其間一較高下。不過,選擇中國學(xué)生領(lǐng)銜的Face++也因此有了更加充分的理由:“在偏向算法的領(lǐng)域,中國人有自己的優(yōu)勢,這也算投資跑道的一種。”劉維表示。與Face++同期,他還主導(dǎo)了對(duì)語音識(shí)別公司思必馳的投資。

通過唐文斌的一位學(xué)長介紹,劉維接近了Face++團(tuán)隊(duì)。除行業(yè)跑道和技術(shù)優(yōu)勢之外,聯(lián)想之星的投資決策還有其他理由。劉維告訴21世紀(jì)經(jīng)濟(jì)報(bào)道記者,唐文斌的組織能力也是一大“加分項(xiàng)”:不僅自己拿到過信息學(xué)奧林匹克的金牌,在正式創(chuàng)業(yè)前還擔(dān)任著國家信息學(xué)奧林匹克集訓(xùn)隊(duì)總教練職務(wù)。而他所率領(lǐng)的Face++團(tuán)隊(duì)里,有20名全職員工和20位來自清華的實(shí)習(xí)生相互協(xié)作,他們當(dāng)中的七人曾經(jīng)拿到過國際金牌。

在聯(lián)想之星的50多個(gè)已投項(xiàng)目中,280萬人民幣注資的Face++無疑是最具天使色彩的。天使投資后,李開復(fù)和創(chuàng)新工場以數(shù)百萬美元接力了曠視科技的A輪融資。

 人臉識(shí)別下一站?

“你一直主張做平臺(tái),這是一個(gè)致命的問題,你為中國的開發(fā)者服務(wù),中國的開發(fā)者又是最窮的。”在2012年黑馬大賽總決賽的賽場,奇虎360總裁周鴻祎曾向唐文斌拋出三個(gè)問題,這是其中之一。

被聯(lián)想之星和李開復(fù)支持的“不賺錢平臺(tái)”卻正好構(gòu)成了Face++的一道“護(hù)城河”。被印奇稱作“類人腦神經(jīng)元算法”的深度學(xué)習(xí)算法是Face++與全球同行們比拼的核心戰(zhàn)場。而這一戰(zhàn)場的門檻,遠(yuǎn)不是有著人臉識(shí)別概念的傳統(tǒng)公司能夠輕易逾越的--在它背后,結(jié)構(gòu)化大數(shù)據(jù)、龐大系統(tǒng)支持、與具體領(lǐng)域相關(guān)的算法,三者缺一不可。

從2011年9月上線至今,F(xiàn)aceplusplus.com平臺(tái)已經(jīng)吸納了2萬多開發(fā)者,這些享受免費(fèi)服務(wù)的開發(fā)者每天為平臺(tái)提供200多萬張圖片。在保護(hù)隱私、不作商用的前提下,F(xiàn)ace++借用這些圖片及其標(biāo)注信息進(jìn)行算法學(xué)習(xí),

基于上述數(shù)據(jù)和技術(shù)的積累,在更加顯性的層面,F(xiàn)ace++也開始嘗試一些應(yīng)用的制作。為世紀(jì)佳緣設(shè)計(jì)的人臉識(shí)別場景中,用戶可根據(jù)自己對(duì)另一半長相的需求,從網(wǎng)站的數(shù)據(jù)庫中搜索相似外貌的用戶。這個(gè)應(yīng)用未來可以擴(kuò)展向其他社交網(wǎng)絡(luò),甚至通用搜索引擎的數(shù)據(jù)庫。

此外,F(xiàn)ace++與360搜索達(dá)成了合作。一種試水階段的圖片搜索應(yīng)用,能為360搜索的用戶提供類似“美女搜索”之類的簡單服務(wù)。

憑借這類針對(duì)B端的技術(shù)服務(wù),F(xiàn)ace++團(tuán)隊(duì)已開始有營收,在去年11月初離開創(chuàng)新工場的工位,搬到走出了小米等一批創(chuàng)業(yè)公司的銀谷大廈自立門戶。

在接待21世紀(jì)經(jīng)濟(jì)報(bào)道記者探訪的午后,印奇和唐文斌趕往一場與某互聯(lián)網(wǎng)巨頭的會(huì)談。隨著技術(shù)的迭代突破,F(xiàn)ace++逐漸成為更多互聯(lián)網(wǎng)公司的業(yè)務(wù)合作甚至潛在并購對(duì)象。

“一個(gè)公司走到現(xiàn)在這個(gè)時(shí)點(diǎn),有一定的成績,也是危險(xiǎn)的時(shí)刻,”對(duì)于Face++面臨的現(xiàn)實(shí)誘惑,劉維不無審慎地對(duì)21世紀(jì)經(jīng)濟(jì)報(bào)道記者說道,“我們總是討論技術(shù)如何產(chǎn)業(yè)化,但Face++恰恰相反;短期內(nèi)能獲得流量、賺到錢,卻會(huì)分散應(yīng)付核心技術(shù)的經(jīng)歷,喪失掉未來更大的商業(yè)前景。這不是我們想要的。”

“我們現(xiàn)在做技術(shù)服務(wù),但未來一定不是賣技術(shù)的公司。”唐文斌確定地說。他眼中的人臉識(shí)別技術(shù),指向高度互聯(lián)網(wǎng)化的運(yùn)用場景,并能夠解決人臉識(shí)別的核心需求——非配合式的身份認(rèn)證系統(tǒng)。“如果不了解核心需求,只是做一些非常小的產(chǎn)品,實(shí)現(xiàn)不了核心的價(jià)值。”在他看來,公司的當(dāng)務(wù)之急,仍是技術(shù)性能的提升。

而顯然,要在中關(guān)村內(nèi)述說一個(gè)硅谷式的“大故事”,這家初創(chuàng)公司在穩(wěn)住技術(shù)團(tuán)隊(duì)的同時(shí),還需要與風(fēng)險(xiǎn)投資的更多交合。

相關(guān)閱讀