溫馨提示×

您好,登錄后才能下訂單哦!

密碼登錄×
登錄注冊(cè)×
其他方式登錄
點(diǎn)擊 登錄注冊(cè) 即表示同意《億速云用戶服務(wù)條款》

“尋找賈維斯”簡(jiǎn)史

發(fā)布時(shí)間:2020-08-10 15:05:45 來(lái)源:ITPUB博客 閱讀:169 作者:naojiti 欄目:互聯(lián)網(wǎng)科技

可能人人都希望自己有個(gè)“賈維斯”。

雖然已經(jīng)退出漫威電影很多年,但是我們還是能夠記起那個(gè)鋼鐵俠戰(zhàn)衣里無(wú)所不能的AI助手。獨(dú)特的幽默、優(yōu)雅的語(yǔ)調(diào),以及非??孔V的人設(shè),讓無(wú)數(shù)科幻迷對(duì)這個(gè)看不見(jiàn)聽(tīng)得到的角色產(chǎn)生了無(wú)盡好感。

對(duì)賈維斯的迷戀有多瘋狂呢?我見(jiàn)過(guò)賈維斯版本的電腦桌面程序,賈維斯模樣的手機(jī)UI,以及以賈維斯命名的AI算法。設(shè)計(jì)師和極客們,迄今為止想了無(wú)數(shù)辦法來(lái)“復(fù)活”屬于自己的賈維斯。

“尋找賈維斯”簡(jiǎn)史

然而畫(huà)面越來(lái)越逼真的賈維斯界面,顯然無(wú)法得到它的精髓:像朋友一樣的溝通與陪伴。

假如說(shuō)有某種技術(shù)希望能夠在“本質(zhì)”上尋找賈維斯,那么一定非語(yǔ)音助手莫屬。

由于身處一個(gè)科技爆炸的年代,日常生活中我們可能不太留心某種技術(shù)的發(fā)展。但是如果一旦停下來(lái)回頭看看,會(huì)驚奇地發(fā)現(xiàn)一門(mén)技術(shù)原來(lái)經(jīng)歷了相當(dāng)驚人的變化。比如說(shuō)手機(jī)中的語(yǔ)音助手,已經(jīng)成為了日常生活的一部分。而如果回首一下它的歷史,說(shuō)不定會(huì)大吃一驚:原來(lái)用語(yǔ)音助手復(fù)活賈維斯,并不是說(shuō)著玩玩的?;乜催@些年語(yǔ)音助手的成長(zhǎng),會(huì)發(fā)現(xiàn)在人性化交互、應(yīng)用能力拓展,以及功能集成上,語(yǔ)音助手的體驗(yàn)確實(shí)在一步步逼近“賈維斯”這個(gè)終極目標(biāo)。

最近好像流行寫(xiě)各種簡(jiǎn)史,那不妨讓咱們今天來(lái)講一段,關(guān)于“尋找賈維斯”的簡(jiǎn)史。不難發(fā)現(xiàn),語(yǔ)音助手的進(jìn)化軌道,其實(shí)已經(jīng)非常清晰明確。

語(yǔ)音助手初長(zhǎng)成

大家都知道,最早的語(yǔ)音助手是蘋(píng)果推出的Siri。

想當(dāng)年,在大家都沒(méi)跟手機(jī)說(shuō)過(guò)話的時(shí)候,Siri真的可謂是叱咤江湖。《生活大爆炸》里甚至有一集,專門(mén)安排拉杰什和Siri談了回戀愛(ài)。

然而要承認(rèn)的是,技術(shù)必然有其階段性。就像老爺車(chē)雖然經(jīng)典,但是肯定無(wú)法開(kāi)上21世紀(jì)的高速路。初始階段的Siri,在今天來(lái)體驗(yàn)其實(shí)是很初級(jí)的。

語(yǔ)音助手這件事,之所以得到了蘋(píng)果的大規(guī)模投入,其實(shí)主要是云計(jì)算系統(tǒng)的功勞。其實(shí)更早時(shí)候,語(yǔ)音助手的雛形已經(jīng)出現(xiàn)。只是當(dāng)時(shí)云計(jì)算體系沒(méi)有鋪開(kāi),只能把若干語(yǔ)音指令存儲(chǔ)在手機(jī)中,這導(dǎo)致用戶的問(wèn)答模板過(guò)分單調(diào)。

“尋找賈維斯”簡(jiǎn)史

而從Siri開(kāi)始,語(yǔ)音助手完成了云端部署。這樣可以在云端存儲(chǔ)大量的對(duì)應(yīng)模板,并且實(shí)時(shí)更新,從而讓語(yǔ)音服務(wù)成為可能。

這時(shí)候的Siri雖然知道的多了,但是智商卻十分堪憂。由于當(dāng)時(shí)的語(yǔ)音助手完全是模板化的,換句話說(shuō)你必須準(zhǔn)確說(shuō)出了問(wèn)題,并且被Siri準(zhǔn)確識(shí)別了,才能給你找出對(duì)應(yīng)的答案。

然而套路終歸是套路。那個(gè)時(shí)候,應(yīng)用Siri的體驗(yàn)大概是這樣的:

Siri,幫我給xx打電話

好的,已經(jīng)撥打

Siri,幫我打個(gè)電話,我要聯(lián)系xx

對(duì)不起,Siri沒(méi)有聽(tīng)懂……

總之就是,模板不能錯(cuò)一點(diǎn)點(diǎn),否則就是推到重來(lái)。好在,這種語(yǔ)音助手完全比拼模板數(shù)量的時(shí)代,很快就過(guò)去了——因?yàn)锳I來(lái)了。

AI來(lái)了之后

早期語(yǔ)音助手的最大缺點(diǎn),在于問(wèn)答只能模板化。用戶實(shí)際上不是在跟語(yǔ)音助手聊天,只是把遙控器換成了語(yǔ)音操作而已。這在某種程度反而是增加了用戶的交互成本,同時(shí)也讓用戶心中對(duì)于“語(yǔ)音助手”這個(gè)概念的智能化期待大打折扣。

好在AI來(lái)了。

隨著深度學(xué)習(xí)的復(fù)興,以神經(jīng)網(wǎng)絡(luò)處理語(yǔ)音任務(wù)逐漸成為主流。隨著AI加入,語(yǔ)音助手開(kāi)始呈現(xiàn)語(yǔ)義理解、多輪對(duì)話,聲音合成等能力,并且在這幾條軌道上不斷發(fā)展。于是我們看到了語(yǔ)音助手的聽(tīng)力越來(lái)越敏捷,很多情況能夠和用戶像正常聊天一樣說(shuō)下去。甚至方言、兒童音等問(wèn)題都得到了一定程度的解決。

這個(gè)時(shí)期的語(yǔ)音助手,最具特色的代表應(yīng)該是谷歌語(yǔ)音助手Google Assistant和微軟小冰。前者去年曾經(jīng)創(chuàng)造過(guò)模仿真人打電話而不露餡的“壯舉“,而后者也常年活躍于聊天界,以不被發(fā)現(xiàn)是AI而著稱。

“尋找賈維斯”簡(jiǎn)史

這個(gè)時(shí)候的語(yǔ)音助手體驗(yàn),已經(jīng)有了比較明顯的升級(jí)。比如用戶說(shuō)我想打個(gè)電話/幫我打個(gè)電話/幫我查一下某人的號(hào)碼,然后打電話,語(yǔ)音助手基本都能明白。

而且在深度學(xué)習(xí)的幫助下,語(yǔ)音助手還能記住用戶的聊天習(xí)慣,時(shí)不常還能跟用戶逗個(gè)悶子,聊天時(shí)立個(gè)人設(shè)。

然而這并不是終點(diǎn)。隨著AI語(yǔ)音助手的普及,尤其是在手機(jī)中的廣泛應(yīng)用,用戶發(fā)現(xiàn)它能干的事情還是太少了。基本就停留在打電話、發(fā)短信、整理日程表等幾種。然而這幾種在今天已經(jīng)是名副其實(shí)的邊緣應(yīng)用。

只能聊而沒(méi)啥用的語(yǔ)音助手,就好像賈維斯只能陪著托尼瞎聊天,卻無(wú)法啟動(dòng)鋼鐵俠戰(zhàn)衣——這顯然是嚴(yán)重影響票房的。

在移動(dòng)AI覺(jué)醒的這兩年,隨著終端AI處理能力越發(fā)強(qiáng)大,事情開(kāi)始有了更多發(fā)展。

折疊出人性化交互

在語(yǔ)音助手的進(jìn)化上,有兩件事決定了今天的故事走向。一個(gè)是客觀上來(lái)說(shuō),無(wú)論是端側(cè)還是云側(cè)的AI處理能力都在變強(qiáng)。許多之前無(wú)法觸發(fā)的AI應(yīng)用開(kāi)始變?yōu)楝F(xiàn)實(shí),這些能力就像鋼鐵俠的裝甲和武器,讓語(yǔ)音助手有更多可以操縱的空間。

更明顯的改變來(lái)自于消費(fèi)者和廠商,對(duì)語(yǔ)音助手這件事發(fā)生了主觀上的升級(jí)。過(guò)去語(yǔ)音助手作為一個(gè)“嘗鮮品“,主要能力是顯露自己多么智能強(qiáng)大。而在今天,已經(jīng)習(xí)慣語(yǔ)音交互的用戶需要的是”以我為主”,讓語(yǔ)音助手提供服務(wù),而不是炫技。

眾所周知,我們?cè)谑謾C(jī)中的主要服務(wù),是基于APP產(chǎn)生的。那么語(yǔ)音助手的下一步也就是要融合到APP當(dāng)中,把服務(wù)抽象出來(lái),帶給用戶方便。比如三星的Bixby最先嘗試了打穿APP的方案。

這主客觀兩個(gè)條件結(jié)合,構(gòu)成了今天語(yǔ)音助手的主要升級(jí)方案:折疊交互,融合應(yīng)用,體現(xiàn)人性化。

在這條路上已經(jīng)有了不少參賽者,而目前能夠看到將語(yǔ)音助手這件事推到新高度的,是剛剛更新的EMUI9.1。

“尋找賈維斯”簡(jiǎn)史

小藝這個(gè)名字,對(duì)于華為用戶來(lái)說(shuō)并不陌生。而EMUI 9.1版本的小藝經(jīng)歷了一個(gè)跨度非常大的升級(jí)。從整個(gè)語(yǔ)音助手發(fā)展歷史的角度看,這些升級(jí)也可能十分重要。咱們還是基于幾個(gè)場(chǎng)景的變化,來(lái)研究一下小藝剛剛帶來(lái)了什么。

1、能聽(tīng)能說(shuō),也要能看

語(yǔ)音助手這東西,大家已經(jīng)默認(rèn)其能力就是聽(tīng)和說(shuō)。然而實(shí)際上,一個(gè)真正的“助手“還需要一個(gè)基本的能力,那就是“察言觀色”。

之所以語(yǔ)音助手一直缺乏“看”這個(gè)層面的能力,原因很大程度在于大部分手機(jī)還無(wú)法承載復(fù)雜的AI視覺(jué)計(jì)算。這個(gè)領(lǐng)域華為這兩年一騎當(dāng)先,自然也就孕育出讓語(yǔ)音助手走向聽(tīng)說(shuō)看全能的基礎(chǔ)。

在EMUI9.1版本中,小藝開(kāi)啟了多模態(tài)融合交互。之前,用戶想用手機(jī)識(shí)別花草、汽車(chē)之類的,需要點(diǎn)開(kāi)攝像頭或者專用APP。這個(gè)流程其實(shí)有點(diǎn)繁瑣,而且很多一閃而逝的風(fēng)景可能就要錯(cuò)過(guò)。

而新的小藝,則可以讓用戶長(zhǎng)按電源1秒就喚醒它,直接對(duì)手機(jī)說(shuō)“這是什么”,語(yǔ)音助手就會(huì)自動(dòng)識(shí)別花草、汽車(chē)等等。這個(gè)能力更有用的地方是識(shí)別食物卡路里,可以直接語(yǔ)音問(wèn)手機(jī)“我吃這個(gè)會(huì)不會(huì)胖”,然后小藝就會(huì)自動(dòng)開(kāi)啟卡路里識(shí)別,報(bào)出食物的卡路里數(shù)量。小藝還會(huì)根據(jù)識(shí)物的卡路里級(jí)別,建議你少吃還是放心吃。估計(jì)也就是小藝才如此友善,同樣的問(wèn)題問(wèn)朋友,他們大概會(huì)說(shuō)“你吃空氣也會(huì)胖”。

看的目標(biāo)不僅是基于攝像頭,同樣也可以看到手機(jī)里的圖片。小藝的視覺(jué)結(jié)合,另一個(gè)玩法是用語(yǔ)音搜圖。比如用戶可以說(shuō)“找到我女朋友去年的照片”,手機(jī)就會(huì)在圖庫(kù)眾多的圖片中找到你想要的。

2、穿透APP來(lái)服務(wù)你

我們今天的生活,就是在無(wú)數(shù)APP中穿梭。同時(shí)也要承認(rèn),很多功能其實(shí)隱藏在APP深處,想要完成是有點(diǎn)麻煩的。

舉個(gè)例子,在你口渴難耐時(shí),想要去自動(dòng)售貨機(jī)買(mǎi)瓶水。一頓操作終于選到了合適的飲料,這時(shí)提示你要掃碼付款,然后此時(shí)要先經(jīng)歷找到支付寶,打開(kāi)支付寶,點(diǎn)擊掃碼——這個(gè)過(guò)程中每一秒都是煎熬。

而在EMUI9.1的升級(jí)中,小藝加入了更多用語(yǔ)音解鎖APP場(chǎng)景的功能。比如上面這些操作,現(xiàn)在可以直接對(duì)手機(jī)說(shuō)“掃碼”,一句話喚醒。這個(gè)技能適用于各種著急買(mǎi)東西的場(chǎng)景,其中滋味大家不妨自己體會(huì)。

另一個(gè)很有代表性的場(chǎng)景是在微信里?,F(xiàn)在微信語(yǔ)音似乎已經(jīng)完全取代了電話,但是在茫茫然一片的微信里,想找到合適的人其實(shí)還挺難。要經(jīng)歷點(diǎn)開(kāi)搜索,打字,完成搜索點(diǎn)入對(duì)話框,發(fā)起語(yǔ)音,一共四個(gè)步驟。而小藝則可以直接說(shuō)一句“給微信里的某人打電話”來(lái)一步完成。

此外,不同應(yīng)用中觸發(fā)小藝,據(jù)說(shuō)還有不同驚喜。

“尋找賈維斯”簡(jiǎn)史

3、可學(xué)習(xí)和可定義

小藝的另一個(gè)升級(jí)點(diǎn),在于學(xué)習(xí)用戶語(yǔ)音習(xí)慣和使用習(xí)慣的能力得到了加強(qiáng),同時(shí)開(kāi)啟了自定義組合技能的新模式。

比如我們周五下班坐進(jìn)車(chē)?yán)?,這時(shí)候其實(shí)是有很多事先要用手機(jī)完成的。比如說(shuō),打開(kāi)導(dǎo)航確認(rèn)目的地,放首《今天是個(gè)好日子》聽(tīng)聽(tīng),給哥們發(fā)微信約去看球,給老婆發(fā)短信說(shuō)今天要加班不回家吃飯了……這種做法并不值得提倡。

可以看到的是,這一波操作雖然心情愉快,但是未免復(fù)雜了點(diǎn)。手速慢的人分分鐘就會(huì)被晚高峰給追上。而在新版的小藝中,用戶可以自定義這些操作,整合成同一個(gè)語(yǔ)音命令。比如說(shuō)對(duì)小藝大吼“勞資下班了!”小藝就會(huì)自動(dòng)進(jìn)行用戶設(shè)定的上述操作,又簡(jiǎn)單又解氣。

從小藝的故事可以看到的是,手機(jī)語(yǔ)音助手走到今天,已經(jīng)不僅僅是一個(gè)語(yǔ)音軟件本身的智能程度問(wèn)題,而是整部手機(jī)的能力,都要通過(guò)語(yǔ)音助手來(lái)集成和調(diào)動(dòng)。把多種能力、多個(gè)應(yīng)用,多個(gè)交互進(jìn)行折疊,最終折疊出的才是更省時(shí)省力,更符合用戶期待的自然交互。

而從語(yǔ)音助手誕生時(shí)的套模板,再到AI的入場(chǎng),隨后發(fā)展到手機(jī)軟硬一體化的智能折疊時(shí)代,語(yǔ)音助手的變遷史中,似乎可以總結(jié)出一個(gè)公式。

語(yǔ)音助手的“賈維斯公式”

到底怎么才能做出大家心目中的賈維斯?通過(guò)手機(jī)和語(yǔ)音助手的不斷耦合,我們可以發(fā)現(xiàn)這樣幾件事是先覺(jué)條件:

1、不斷升級(jí)的AI綜合體

從谷歌、微軟、亞馬遜激烈競(jìng)爭(zhēng)的語(yǔ)音助手,到國(guó)內(nèi)的智能音箱熱潮、手機(jī)語(yǔ)音助手不斷升級(jí),而AI能力始終是這個(gè)故事的“主線劇情”。

而隨著步入移動(dòng)AI時(shí)代,語(yǔ)音助手現(xiàn)在的任務(wù),從整合AI技術(shù),開(kāi)始發(fā)展到了整合AI應(yīng)用、AI能力和AI技術(shù)的三合一模式。

回望華為手機(jī)開(kāi)啟AI進(jìn)化的這兩年,從EMUI在8.0時(shí)期開(kāi)始,諸多智慧能力開(kāi)始顯現(xiàn)。到 9.0時(shí)代,開(kāi)始加強(qiáng)視覺(jué)AI應(yīng)用,并且對(duì)AI能力進(jìn)行整合。而到9.1當(dāng)中,語(yǔ)音助手開(kāi)始整合更多AI應(yīng)用??梢钥闯?,AI的從無(wú)到有,從弱到強(qiáng),從分散到整合,是手機(jī)助手進(jìn)化的主線。

“尋找賈維斯”簡(jiǎn)史

2、軟硬件不分彼此

在手機(jī)當(dāng)中,一款軟件的能力總歸有限,只有與應(yīng)用、內(nèi)容和硬件層面更好結(jié)合,才能真正讓用戶獲得智能的體驗(yàn)和實(shí)際的應(yīng)用價(jià)值。

這就好比只會(huì)逗悶子的賈維斯并不招人喜歡,天文地理無(wú)所不知,還能操縱鋼鐵俠戰(zhàn)衣的才是“真·賈維斯”。語(yǔ)音助手之所以今天的領(lǐng)軍者變成華為和EMUI,很大程度在于華為手機(jī)這幾年在軟硬件一體化能力上的積極探索,一定程度打破了舊有手機(jī)模式的藩籬。

當(dāng)語(yǔ)音助手可以調(diào)動(dòng)智慧視覺(jué)和各種應(yīng)用,其價(jià)值就好像你的朋友突然由員工升級(jí)成了老總……

3、基于人性,去折疊每一個(gè)交互

要注意的是,語(yǔ)音助手始終伴隨著一條炫技之路:由于AI帶來(lái)的技術(shù)非常充沛,開(kāi)發(fā)者很容易把語(yǔ)音交互搞得復(fù)雜無(wú)比。雖然初心是讓消費(fèi)者感受到技術(shù)爆發(fā)的魅力,但實(shí)際應(yīng)用中消費(fèi)者往往不勝其擾,只能敬而遠(yuǎn)之。

所以在語(yǔ)音助手的進(jìn)化中,需要基于人性化的產(chǎn)品思考,基于用戶感受去折疊和省略交互。只要技術(shù)復(fù)雜同時(shí)交互簡(jiǎn)單,語(yǔ)音助手才有親和力可言。

至此,不難發(fā)現(xiàn),這條尋找賈維斯之路,似乎可以被總結(jié)成這樣的公式:智能技術(shù)更復(fù)雜,產(chǎn)品融合度更強(qiáng),交互更人性=語(yǔ)音助手更像賈維斯。

并且我們有理由相信,所有尋找終歸能夠抵達(dá)終點(diǎn)。

向AI問(wèn)一下細(xì)節(jié)

免責(zé)聲明:本站發(fā)布的內(nèi)容(圖片、視頻和文字)以原創(chuàng)、轉(zhuǎn)載和分享為主,文章觀點(diǎn)不代表本網(wǎng)站立場(chǎng),如果涉及侵權(quán)請(qǐng)聯(lián)系站長(zhǎng)郵箱:is@yisu.com進(jìn)行舉報(bào),并提供相關(guān)證據(jù),一經(jīng)查實(shí),將立刻刪除涉嫌侵權(quán)內(nèi)容。

AI