當(dāng)前位置:首頁>一起惠資訊>ET大腦>文章列表
ET大腦
最近我們一直在探討這樣一個問題:為什么AI飛速發(fā)展,普通人還是覺得距離AI非常遙遠(yuǎn)?實(shí)際上,推而廣之這可能不單單是媒體和技術(shù)愛好者的疑問。上升到更大的國家與社會經(jīng)濟(jì)層面,對真實(shí)可用、能快速見到實(shí)效的AI需求已經(jīng)十分迫切。從“新一代人工智能”政策出臺,到國家AI創(chuàng)新開放平臺公布首批名單,再到近期工信部發(fā)布三年規(guī)劃,可以看到政策層面一直在將AI向?qū)嵱没a(chǎn)業(yè)化、融合化方向推進(jìn)。換言之,如何讓浮在實(shí)驗(yàn)室與測試數(shù)據(jù)中的AI技術(shù),走到現(xiàn)實(shí)世界和我們的生活當(dāng)中,顯然已經(jīng)足夠急迫了。今天很多媒體都報道了,在剛剛結(jié)束的2017云棲大會·北京峰會上,阿里云發(fā)布了堪稱迄今為止最全面的阿里AI版圖。但在阿里復(fù)雜的AI業(yè)務(wù)、產(chǎn)品和合作生態(tài)背后,也許我們能夠發(fā)現(xiàn)一個關(guān)鍵詞:產(chǎn)業(yè)AI。產(chǎn)業(yè)AI到底和其他AI有什么不同?讓阿里舉重兵投入的道理何在?在一片技術(shù)喧囂和話語迷霧里,AI走進(jìn)我們的生活時究竟會是什么樣子?今天我們或許可以從一些小故事里,來回答這些問題。什么才是產(chǎn)業(yè)AI?開始故事之前,我們要先回答這樣一個問題,雖然這個問題看起來像….廢話….但是沒辦法,真相往往跟我們的想象或多或少有點(diǎn)不同。顧名思義,產(chǎn)業(yè)AI當(dāng)然是在具體的一個個產(chǎn)業(yè)里發(fā)揮作用的AI技術(shù)和產(chǎn)品咯。也就是我們經(jīng)常說的AI賦能傳統(tǒng)行業(yè)。但有點(diǎn)不同的是,我們在討論AI賦能行業(yè),或者所謂“AI+”的時候,往往設(shè)想的是以AI為主體,來實(shí)現(xiàn)某個領(lǐng)域的固有功能。比如一些AI+教育平臺,就是用AI的語音交互和NLP能力,來實(shí)現(xiàn)遠(yuǎn)程教育功能。在這種情況下,我們思考的是用AI替代,而不是用AI結(jié)合。它能改善一些情況,卻無法真正提高這個產(chǎn)業(yè)本身的效率,降低原始成本,更不能融合在整個產(chǎn)業(yè)線之中。所以真正的產(chǎn)業(yè)AI,必須是能夠與傳統(tǒng)產(chǎn)業(yè)無縫結(jié)合,推助這個產(chǎn)業(yè)核心部類向前發(fā)展的。這也是阿里云從ET大腦到產(chǎn)業(yè)AI布局的根本訴求。尤其需要注意的是,深度的產(chǎn)業(yè)AI必然指向復(fù)雜的行業(yè)限制和真實(shí)需求,往往比簡單的AI替代論復(fù)雜很多。比如說想讓AI來計(jì)算機(jī)場的停機(jī)坪使用情況,提高停機(jī)坪的使用效率。聽起來蠻簡單的一件事,但是一名真正的機(jī)場調(diào)度員,卻需要考慮航班號、機(jī)型、國際國內(nèi)分類、近機(jī)位優(yōu)先原則、機(jī)上狀況、航空公司情況、機(jī)場建設(shè)狀況、流量狀況、延誤航班對下序航班的影響、天氣狀況等等十幾個因素才能決定飛機(jī)停泊的機(jī)位。假如AI系統(tǒng)只算了其中一兩個,漏算了某些因素,豈不是耽誤了大事?所以說,產(chǎn)業(yè)的需求往往比我們一般想象中復(fù)雜太多,綜合來看,AI想解決產(chǎn)業(yè)問題,必須具備四個方面的基礎(chǔ)能力:1.多維感知能力:真實(shí)世界中,數(shù)據(jù)和信息常常是從幾個方向混雜過來。假如AI只能聽、只能看,或者只能連接數(shù)據(jù)庫,那么它就會變成盲人摸象型AI。只能用來炫耀某種能力,卻無法真正投入使用。2.全局洞察模式:能感知之外還要能分析和歸納,就像上面說的運(yùn)算停機(jī)坪。AI必須綜合各方面信息和實(shí)時變化的數(shù)據(jù)流,隨時做出統(tǒng)領(lǐng)全局的最優(yōu)解。這就是我們所說人類的大局觀。沒有大局觀的人不能勝任管理,沒有大局觀的AI也是一樣。3.人機(jī)協(xié)同體驗(yàn):想做產(chǎn)業(yè)AI,必須承認(rèn)的一點(diǎn)是今天的AI絕不可能,也不希望徹底取代人類。必須是人機(jī)協(xié)同的工作模式,但是人機(jī)如何協(xié)同,如何在縮減人的工作時間,提高人的工作效率之外,不會浪費(fèi)大量學(xué)習(xí)成本和適應(yīng)成本,也是關(guān)鍵問題。4.持續(xù)進(jìn)化能力:日新月異的工作,必須讓人不斷去適應(yīng)和學(xué)習(xí)新的工作方式,對于AI也是一樣,如果產(chǎn)業(yè)AI不能進(jìn)化,那么工作需求一旦變更AI就變成廢鐵一塊,那確實(shí)不要也罷。為了解決這四個很讓人撓頭的問題,阿里云的解決方案是構(gòu)建了目前為止世界上最大的綜合智能體:ET大腦。在阿里強(qiáng)大的計(jì)算能力、數(shù)據(jù)優(yōu)勢加持下,ET大腦可以適應(yīng)各個行業(yè)的感知、洞察、進(jìn)化需要,滿足不同的智能運(yùn)算需求。這背后隱藏著這樣一個現(xiàn)狀:必須有算力、數(shù)據(jù)、算法三者的有效結(jié)合,才能有AI在復(fù)雜場景里展開與原始產(chǎn)業(yè)體系合作的可能性,才能達(dá)成所謂的場景。阿里云能最快布局產(chǎn)業(yè)AI,可能原因也在于此。但是這可能還不夠,產(chǎn)業(yè)AI之路,絕不是單純的技術(shù)能力可以搞定的。到底該如何打造產(chǎn)業(yè)AI?如果你身處一個比較傳統(tǒng)的行業(yè),不妨想想,假如為你安排一位超級智能的AI助手,你的第一反應(yīng)是什么?很興奮?那么第二反應(yīng)呢?大概是感覺學(xué)起來很麻煩,不知道到底好用不好用,擔(dān)心成本和收益不相符,等等等等。這是沒有辦法的,人在面對新事物時的先驗(yàn)反射永遠(yuǎn)都是排斥和懷疑。尤其是AI這種先天具有科幻色彩的技術(shù)與產(chǎn)品。所以說,實(shí)驗(yàn)室和PPT上的AI是相對容易的,但產(chǎn)業(yè)AI卻要更復(fù)雜。其復(fù)雜程度很多時候不在于單純的技術(shù)挑戰(zhàn),而在于需要復(fù)雜且長期的企業(yè)合作、談判溝通和對細(xì)節(jié)的苛求??傊?,都是苦差事和累差事。這幾天與阿里云的專家們溝通,聽了不少故事。從這些故事中,可以把阿里打造產(chǎn)業(yè)AI的秘密歸納為三個方面:一、深入場景的具體需求當(dāng)中。很多AI技術(shù)走進(jìn)現(xiàn)實(shí)時,往往會太重AI太輕現(xiàn)實(shí),這樣做的直接結(jié)果是完全低估了產(chǎn)業(yè)化進(jìn)程的難度。比如阿里云在打造ET工業(yè)大腦的時候,面對的都是已經(jīng)二三十年的老機(jī)器。這些機(jī)器怎么AI?怎么能夠不給企業(yè)成本壓力,如何讓老工廠的工人懂得使用?可能都是科學(xué)家一般不會思考的問題,卻真實(shí)阻擋了工廠的AI化。而阿里云的解決方案蠻簡單粗暴的:直接派工程師在車間蹲守,一臺臺機(jī)器去琢磨和收集數(shù)據(jù),貌似這在科技企業(yè)中是第一份。據(jù)說第一個試點(diǎn)企業(yè)最開始也是拒絕嘗試工業(yè)大腦的,于是阿里云決定免費(fèi)安裝。結(jié)果很快給企業(yè)節(jié)省了幾千萬的成本,然后企業(yè)主動要求付費(fèi)……可以想見,不深入場景和產(chǎn)業(yè)的AI是很難真正進(jìn)駐產(chǎn)業(yè)化的,而這對AI企業(yè)的團(tuán)隊(duì)和執(zhí)行力要求其實(shí)遠(yuǎn)超想象。二、以行業(yè)從業(yè)者為核心思考問題。我們時長忽視的一個問題,是AI技術(shù)有時候并不能討人喜歡??此朴械览淼募夹g(shù)解決方案,在真實(shí)產(chǎn)業(yè)場景里其實(shí)是無效的。比如阿里云的AI語音解決方案與法院場景的合作。一般我們理解法院使用語音交互,無非就是對庭審進(jìn)行記錄,代替書記員的工作。但事實(shí)上卻不是這么回事,直接將庭審對話轉(zhuǎn)換成文字,夾雜了大量的口語內(nèi)容,根本是無效記錄,反而加大了書記員工作的難度。阿里云智能語音提供的解決方案,是通過AI智能理解文本、抽取邏輯將庭審記錄簡化,這才能真正幫到書記員。所以說,真正的產(chǎn)業(yè)AI必須以從業(yè)者為核心去思考問題,這需要對產(chǎn)業(yè)深度的理解,以及關(guān)鍵領(lǐng)域的產(chǎn)業(yè)深度合作。比如剛剛發(fā)布的最新ET航空大腦。這個“新大腦”將在首都機(jī)場開工。為首都機(jī)場300個停機(jī)位,每天迎來送往1700架次航班提供智能決策和運(yùn)算。上文已經(jīng)說過了這個運(yùn)算的難度,但ET航空大腦50秒時間就可以排完整個任務(wù),并且全程可視化,受到工作人員的監(jiān)督和調(diào)整。三、運(yùn)用一切辦法解決問題。最后一種產(chǎn)業(yè)化中必須面對的問題,是真實(shí)問題往往比實(shí)驗(yàn)與測試中復(fù)雜很多。必須要突破技術(shù)領(lǐng)域的限制,也不能等待技術(shù)成熟,而是選擇運(yùn)用一切辦法解決問題。比如阿里云即將在上海推出的首個AI地鐵售票機(jī),就可以讓用戶用語音交互的方式買地鐵票。但在地鐵這么嘈雜的環(huán)境里,語音識別實(shí)在過于復(fù)雜。阿里云最終的解決方案,是加強(qiáng)收音陣列硬件的同時,用機(jī)器視覺技術(shù)識別人臉和嘴唇,讓售票機(jī)聽到兼看到買票者,才能最終解決問題。這三條途徑,歸根結(jié)底是巨大的產(chǎn)業(yè)合作任務(wù)和工程化工作量。在具備技術(shù)基礎(chǔ)的同時,還要求執(zhí)行企業(yè)有強(qiáng)大的溝通能力、工程化能力和個案攻堅(jiān)能力。這是一條不好走的路,但是總歸要有人走。一個發(fā)現(xiàn):產(chǎn)業(yè)化路途中的AI新戰(zhàn)場通過ET大腦的中樞系統(tǒng)匯聚點(diǎn),以及背后算力、算法、數(shù)據(jù)上的積累,阿里迄今為止發(fā)布了城市、工業(yè)、零售、金融、汽車、家庭等六個場景的“產(chǎn)業(yè)AI”方案。這些能力、產(chǎn)品和解決方案,會阿里云為出口進(jìn)入于各行各業(yè)。從ET大腦的原點(diǎn)到今天的生態(tài)版圖,阿里的“現(xiàn)實(shí)主義AI”,也在AI場景爭奪戰(zhàn)中保持了自己很多層面的優(yōu)勢。比如:1.全面的場景,持續(xù)進(jìn)化能力與良性合作習(xí)慣。從工業(yè)、交通,到環(huán)境、航空,ET大腦的布局逐漸向全景化、垂直化雙向發(fā)展。帶來的結(jié)果很可能是覆蓋了經(jīng)濟(jì)民生關(guān)鍵感知端口的AI系統(tǒng),可以運(yùn)用這些場景能力通向整體進(jìn)化。而良好的產(chǎn)業(yè)合作步伐,則給升級能力帶來了進(jìn)一步出口。場景、技術(shù)和合作,正在形成阿里AI的遞增三角關(guān)系。2.可復(fù)制,甚至生態(tài)復(fù)制的AI解決方案。從航空大腦的案例中不難看出,ET大腦的解決方案和能力基礎(chǔ)是具備高度復(fù)制化的。當(dāng)一個領(lǐng)域需要復(fù)雜的運(yùn)算,多種感知數(shù)據(jù)的結(jié)合,并且人工效率始終很低,那么就可以自發(fā)引入ET大腦。這種領(lǐng)域在生活中相當(dāng)多見。當(dāng)ET大腦的產(chǎn)業(yè)AI解決方案復(fù)制到某個量級時,生態(tài)性、泛在化的產(chǎn)業(yè)AI自發(fā)衍生或許將會出現(xiàn)。3.關(guān)鍵領(lǐng)域的直接價值。工業(yè)、醫(yī)療到交通航空,阿里的產(chǎn)業(yè)AI系統(tǒng)在不斷提高覆蓋面的同時,更為各個關(guān)鍵領(lǐng)域帶來了直接的效率提升和成本縮減。由高速的產(chǎn)業(yè)合作效率與直觀的價值體現(xiàn),阿里AI會在同類企業(yè)的競爭中獲得先發(fā)優(yōu)勢。當(dāng)產(chǎn)業(yè)AI在國家和社會需求的推動下,必然成為下一幕競爭焦點(diǎn)的時候,依靠這些領(lǐng)域的優(yōu)勢,阿里AI也許會在新戰(zhàn)場有所收獲。當(dāng)然,最重要的是,讓AI能用,有用,普通人樂于去用,是這個技術(shù)不會變成另一個泡沫的根本保障。
一起惠2017-12-21 09:37:32320 次