前盛大高管的創(chuàng)業(yè)冒險:云知聲創(chuàng)始人從幕后走向臺前

2013/12/20 12:43      王玉龍

前盛大高管的創(chuàng)業(yè)冒險:云知聲創(chuàng)始人從幕后走向臺前

語音識別領域的明星創(chuàng)業(yè)公司云知聲正在經(jīng)歷一場隱秘的高層架構(gòu)調(diào)整。

騰訊科技獨家獲悉,云知聲CEO梁家恩不再擔任CEO一職,轉(zhuǎn)而專注負責技術(shù)領域。公司CEO由黃偉擔任,正式上任已一周有余。

云知聲的官方網(wǎng)站側(cè)面印證了該消息的真實性。云知聲在公司內(nèi)部的新聞稿通報,云知聲榮獲中國最具投資價值企業(yè)50強的稱號,云知聲CEO黃偉出席了本次大會并領獎,新聞稿并配了黃偉領獎的照片。

在外界看來,這似乎是空降兵式的調(diào)整。在語音識別業(yè)內(nèi)的知情者看來,則是語音識別產(chǎn)業(yè)核心人物的回歸。

“黃偉終于回歸了,終于從幕后走向了前臺”。一位語音識別的業(yè)內(nèi)人士這樣感慨。

黃偉是誰?作為語音識別領域的領軍人物,他先就職于摩托羅拉和盛大創(chuàng)新院,建立了盛大創(chuàng)新院語音分院,后隨著盛大整體戰(zhàn)略的調(diào)整,他于2012年離職選擇創(chuàng)業(yè)。

對于黃偉創(chuàng)業(yè)的說法不一。盛大創(chuàng)新院員工表示,黃偉是盛大創(chuàng)新院高管中最早離開創(chuàng)新院的,他去創(chuàng)辦了云知聲。但在此前,云知聲官方否認黃偉在這個團隊中。

今年10月,云知聲確認完成啟明創(chuàng)投的A輪融資,金額達1億人民幣,此時,云知聲公司成立剛過500天。云知聲的迅速躥紅也引起了業(yè)內(nèi)人士對它的關注,也牽出了黃偉與云知聲的聯(lián)系:“黃偉不是明面上的公司創(chuàng)始人,更多的是和云知聲私下里的關系。雖然沒有確切的證據(jù)表明兩者的關系,但實際上千絲萬縷,兩者走的非常近。”一位知情人士透露。

騰訊科技獲悉,此次黃偉正式擔任CEO,與其從盛大離職后的競業(yè)禁止協(xié)議解禁有關。“云知聲這一年的飛速成長,與黃偉的幕后操盤緊密相關。”上述人士表示。

對此安排,有知情人士透露,黃偉對資本方等較為熟悉,更容易掌控全局。梁家恩是典型的技術(shù)型人才,專注技術(shù)更為適合。“在盛大創(chuàng)新院時黃偉是梁家恩的領導,創(chuàng)業(yè)后先由梁家恩擔任CEO,黃偉在幕后。條件許可后,黃偉再走到前臺,這很順利成章。”

作為創(chuàng)業(yè)公司,云知聲一年的成長有目共睹。“在語音識別領域,百度已經(jīng)做了一年多,云知聲也做了一年多,但是云知聲的識別技術(shù)比如識別的準確度已經(jīng)比百度高出一大截。”一位語音識別的從業(yè)人士這樣評價,“在語音識別的創(chuàng)業(yè)公司中,云知聲是做的最好的。”

梁家恩把創(chuàng)業(yè)的階段性成功歸因于強大的核心技術(shù)團隊和平臺技術(shù)團隊,能夠在一年時間里,實現(xiàn)上市公司需要3-5年才能構(gòu)建的語音識別服務平臺。“一年來,語音識別錯誤率下降60%,識別速度提高3倍以上。”云知聲CEO梁家恩對騰訊科技表示。

在這個節(jié)點上,在語音識別領域的大爆發(fā)的前夜,復盤云知聲一年的黑馬式崛起,頗有一番意味。

語音識別產(chǎn)業(yè)大爆發(fā)

“所有手機制造商都在投資語音、拓展語音技術(shù)領域的投資,打造更優(yōu)雅的設計并 將其深入集成到手機中。”美國最大的語音識別技術(shù)公司Nuance高級副總裁邁克爾•湯普森這樣說。

在推出Siri應用兩年后,今年蘋果在麻省理工大學 (MIT)附近組建神秘辦公室,用以做Siri 語音識別技術(shù)的研發(fā)。微軟正在研發(fā)代號為“Cortana”自有語音個人助手軟件,并計劃在下一個Windows Phone平臺大升級中推出,以抗衡Google Now及Siri。至此,蘋果、谷歌、微軟、英特爾等國際巨頭均重金投入語音識別技術(shù)。

在中國市場上,語音識別技術(shù)公司也有幾大派別較力:

第一派來自互聯(lián)網(wǎng)巨頭在語音識別技術(shù)上的布局,比如騰訊、百度、搜狗等圍繞自己的產(chǎn)品生態(tài)系統(tǒng)做語音技術(shù),用來為產(chǎn)品服務。微信的語音對講應用已經(jīng)成為人們?nèi)粘B?lián)絡的必備。360也有意進軍語音識別領域,曾傳出與科大訊飛談合作事宜,但至今未有明確信息。

第二派來自專業(yè)的語音語義識別公司在移動互聯(lián)網(wǎng)上的延伸。比如科大訊飛去年專門成立移動互聯(lián)網(wǎng)事業(yè)部做移動應用,美國的Nuance在上海也設立辦事處拓展以多語種語音識別應用為主的中國市場。

第三派來自于新興的創(chuàng)業(yè)公司,如云知聲、思必馳等,具有互聯(lián)網(wǎng)公司的基因,長 勢兇猛。還有一派專做部分語音語義技術(shù)的應用,比如擅長語義解析的蟲洞(獲微軟首期云加速器項目支持)、智能360(周鴻祎做天使投資),以及做微信語音 生活搜索的出門問問(前谷歌語音識別技術(shù)員工李志飛創(chuàng)辦),他們自己做語音語義識別應用的一部分,另一部分技術(shù)會借助科大訊飛等廠商的技術(shù)來完成。

剛剛過去的幾個月,基于語音識別技術(shù)的角力進入前所未有的白熱化階段。 9月7日,創(chuàng)業(yè)公司思必馳宣布重新定義人機交互體驗的方向,高調(diào)推出基于語音識別和語義理解的人機對話。9月中旬,老牌語音技術(shù)公司科大訊飛宣布自主研發(fā)的離線語音聽寫引擎將于9月下旬正式發(fā)布,將應用于“訊飛輸入法”等產(chǎn)品。10月19日,云知聲在確認融資消息的同時,也發(fā)布了離線語音聽寫技術(shù),并發(fā)布了語義云。今年10月28日,科大訊飛語音云發(fā)布三周年,訊飛語音輸入法用戶超過1億。

黃偉的故事

在這輪語音識別技術(shù)熱潮中,有個身影本該成領頭羊但卻落寞四散缺席,那就是盛大。

與科大訊飛相比,盛大當年的語音識別技術(shù)并不弱。曾經(jīng)領導盛大的語音識別團隊的核心人物是黃偉。同劉慶峰一樣,黃偉畢業(yè)于中國科學技術(shù)大學,2004年加入摩托羅拉中國研究中心(MCRC)擔任資深研究員。在摩托羅拉工作期間,他帶隊開發(fā)出世界上首個手機聲紋認證系統(tǒng),并完成多項語音交互產(chǎn)品研發(fā)。但在金融危機期間,摩托將整個語音識別團隊出售給Nuance。

黃偉拒絕被Nuance收編,于2009年7月加入盛大網(wǎng)絡旗下的創(chuàng)新院,2010年10月創(chuàng)建了語音分院,力圖將語音識別技術(shù)與盛大旗下的互動娛樂系統(tǒng)相結(jié)合,延展到用戶端。

2010年,盛大語音團隊在美國國家標準技術(shù)署(NIST)舉辦的聲紋識別評測(SRE)大賽中,力壓麻省理工、斯坦福研究中心、IBM等眾多名校、名企,在在9個單項任務中獲得5個單項第一,整體綜合指標第一。

梁家恩畢業(yè)于中國科學技術(shù)大學,隨后進入中科院自動化所工作,2011年加入 盛大創(chuàng)新院,在盛大語音分院工作,擔任高級研究員一職。不過,隨著2012年盛大創(chuàng)新院的戰(zhàn)略調(diào)整,語音團隊從創(chuàng)新院剝離到盛大掌門科技,由陳大年掌管。語音團隊的成員開始各尋出路。

盛大語音團隊的幾個人選擇了創(chuàng)業(yè),同樣做語音識別,定名為“云知聲”。但云知聲更傾向于強調(diào)自己的技術(shù)積累來自于中科院自動化所,而非之前曾工作過的盛大。

黃偉在其中的角色耐人尋味。

2012年夏天,盛大創(chuàng)新院離職員工QQ群里,傳來了黃偉創(chuàng)辦云知聲的消息。一位前盛大創(chuàng)新院員工表示,“黃偉是盛大創(chuàng)新院高管中最早離開創(chuàng)新院的,他去創(chuàng)辦了云知聲。”

但云知聲官方否認黃偉在云知聲團隊中。

來自云知聲的官方消息顯示,公司創(chuàng)始人有兩位,一位是梁家恩,擔任公司CEO,另一位是康恒,擔任公司CTO,負責平臺業(yè)務部。

對于黃偉與公司的關系,騰訊科技曾向云知聲市場負責人求證此事。該負責人表示,“黃偉和我們公司沒有什么關系。”但他也表示,黃偉和梁家恩是師兄弟關系,也會指導云知聲的業(yè)務。

云知聲的內(nèi)部人士透露,黃偉離開盛大研究院后創(chuàng)辦了移動互聯(lián)網(wǎng)應用音樂雷達,和云知聲團隊在同一座大廈辦公。網(wǎng)站信息顯示,兩家公司都在北京海淀區(qū)財智國際大廈C座,云知聲在15層,音樂雷達在19層。

音樂雷達的一家合作伙伴的負責人證實黃偉是音樂雷達的創(chuàng)始人之一,并和黃偉談過音樂方面的合作。對于外界對黃偉和云知聲之間關系的猜疑,他表示,“不出面創(chuàng)立公司,但可能通過代持的方式運營公司,這在圈里也比較正常。”

互聯(lián)網(wǎng)的節(jié)奏

對云知聲而言,過去一年來,以快取勝、唯快不破的節(jié)奏在語音識別領域快速擴張業(yè)務,打造知名度。在與其他公司的語音技術(shù)解決方案不相上下的情況下,云知聲采取先搶占市場后再優(yōu)化的策略。

去年11月,云知聲和搜狗語音助手達成合作,今年3月,和錘子科技達成合作,5月和樂視TV達成合作,8月又和inwatch、易信達成合作。云知聲和科大訊飛比肩一道出現(xiàn)在在小米、聯(lián)想、智能360語音助手等很多合作伙伴的語音識別方案中。

梁家恩透露,從和搜狗團隊見面到第一個產(chǎn)品模型出來只花了兩個星期,而這個時間可能其他公司連商務條款還談不下來。樂視電視的合作也類似,從第一次和樂視團隊接觸到內(nèi)部系統(tǒng)跑通到在發(fā)布會上發(fā)布只用了1個月的時間。

還有一個合作客戶——錘子科技。CEO羅永浩出了名的挑剔。今年,錘子ROM發(fā)布會前一周,老羅在抱怨語音識別方案遲遲未出,當晚云知聲公司CTO已經(jīng)將產(chǎn)品集成和錘子科技團隊進行對接。最終,云知聲和科大訊飛同時入圍錘子ROM的語音解決方案。

與之前的課題研究迥然不同,梁家恩發(fā)現(xiàn),創(chuàng)業(yè)一年來,團隊一直糾結(jié)技術(shù)層面的東西,他認為和實際業(yè)務結(jié)合更關鍵,也更重要。“做成也是技術(shù)好,做失敗也是技術(shù)好”。

自去年發(fā)布語音識別公有云以來,平臺上已經(jīng)有1000個開發(fā)者加入。通過該開放平臺,“可以把門檻降得足夠低,開發(fā)者無需懂具體的語音語義技術(shù),只需要調(diào)用云知聲的服務,就可做應用創(chuàng)新。”

在開放平臺背后,隱藏著云知聲的商業(yè)模式邏輯:通過語音語義平臺將各家的App聯(lián)通,用戶數(shù)據(jù)也會集中到平臺上,將各個環(huán)節(jié)貫通從而實現(xiàn)廣告等商業(yè)價值。

梁家恩把它比擬為一種類似Google adsense的模式,雖然每家的量很小,但是通過聚合可以產(chǎn)生商業(yè)利益,各個參與方可以分成。

互聯(lián)網(wǎng)的創(chuàng)業(yè)節(jié)奏讓云知聲嘗到了甜頭,接下來也有風險和挑戰(zhàn)。

一個是來自平臺化的風險。“騰訊、百度做語音識別都是圍繞自己的主營來設計,在生態(tài)系統(tǒng)內(nèi)來做,也會進行開放平臺的建設。”上述語音識別的從業(yè)人士認為,相比較其他已經(jīng)有穩(wěn)定商業(yè)模式的公司涉足語音識別應用而言,初創(chuàng)公司做平臺的風險更大。

對云知聲而言,另一個隱憂是尚未有核心的移動互聯(lián)網(wǎng)產(chǎn)品。目前來看,云知聲嘗試做語音輸入法插件,但主要業(yè)務是從語音識別解決方案切入,走技術(shù)驅(qū)動路線。“創(chuàng)業(yè)公司必須有自己的產(chǎn)品和服務,沒有產(chǎn)品,很難承載用戶數(shù)據(jù),商業(yè)利益挖掘更難。”

相關閱讀