應(yīng)用

技術(shù)

物聯(lián)網(wǎng)世界 >> 物聯(lián)網(wǎng)新聞 >> 物聯(lián)網(wǎng)熱點新聞
企業(yè)注冊個人注冊登錄

讓人跟車多聊兩句,有多重要?

2018-09-17 14:55 億歐

導(dǎo)讀:技術(shù)、車企合作、綜合生態(tài),人車交互產(chǎn)業(yè)或許正在跑著一場鐵人三項。但在無人駕駛真正到來之前的相當(dāng)長一段時間中,車載語音交互都會是汽車場景技術(shù)與體驗進(jìn)化的主旋律。在語言的迷宮下,人和車以另一種方式相遇了。

  “BAT抵達(dá)車聯(lián)網(wǎng)”,是最近引發(fā)無數(shù)媒體關(guān)注的一個“風(fēng)口話題”。

  在熱鬧的討論中,我們知道了這個火熱的賽道上有BAT等科技巨頭,還有傳統(tǒng)車企,造車新貴,以及解決方案提供商,一時間風(fēng)起云涌好不熱鬧。

  但如果我們從頭琢磨一下,可能會發(fā)現(xiàn)今天對車聯(lián)網(wǎng)的討論,多少有點“失焦”:所謂車聯(lián)網(wǎng)這個賽道,究竟在爭奪什么?而BAT進(jìn)場與不進(jìn)場,到底有什么區(qū)別?各家科技巨頭與車企在車聯(lián)網(wǎng)領(lǐng)域的進(jìn)度各有什么不同?

  這些問題的答案,很可能藏在一個很多司機(jī)今天還并不重視的角落里:人車對話。

  人和車聊天這事兒,真的有這么重要嗎?

  咱們先來思考這么一個問題:給車連上網(wǎng),到底干嘛用?

  聲音是不可代替的交互:車聯(lián)網(wǎng)賽道的真正軸心

  我們知道,所謂的車聯(lián)網(wǎng),是泛指通過汽車端的信號傳輸裝置,接受網(wǎng)絡(luò)信息與服務(wù)的技術(shù)解決方案。包括車輛遠(yuǎn)程控制、遠(yuǎn)程安全、駕駛場景下的網(wǎng)絡(luò)服務(wù)等多個領(lǐng)域——也就是所謂的讓車變成一個終端。

  而今天熱絡(luò)的車聯(lián)網(wǎng)產(chǎn)業(yè),普遍關(guān)注的是兩個問題:

  1、改善駕駛效率與體驗。比如用戶可以基于互聯(lián)網(wǎng)技術(shù)控制汽車、輔助駕駛等等。

  2、獲得駕駛外的增值服務(wù)。比如用戶通過車載網(wǎng)絡(luò)獲得的導(dǎo)航、內(nèi)容、天氣、支付服務(wù)等等。

  那么重點來了,這兩種服務(wù)到底要怎么賦予駕駛者呢?

  都集成到手機(jī)上…開車玩手機(jī)好像不對?放在車載屏幕上,讓用戶觸屏控制?哪有人那么閑沒事停車觸屏一下再開?而且既然都停車了,那干脆玩手機(jī)好不好?

  所以有種說法,叫做車上最沒用的設(shè)備就是屏幕??梢哉f,在車聯(lián)網(wǎng)的商業(yè)想象中,讓用戶放棄方向盤來獲得網(wǎng)絡(luò)服務(wù),是一種反人性的設(shè)計。那么網(wǎng)絡(luò)服務(wù)、駕駛服務(wù)怎么才能無縫對接給駕駛者呢?答案只可能是人車語音交互。

  讓駕駛者通過語音來控制一部分不方便控制的車載設(shè)備,再通過語音交互來獲得外接互聯(lián)網(wǎng)服務(wù),是車聯(lián)網(wǎng)場景中唯一成立的交互模式??梢钥吹?,在初期試水之后,無論是車廠還是科技企業(yè),都將矛頭對準(zhǔn)了人車對話交互這一塊“車聯(lián)網(wǎng)樞紐”。

  而在車載語音交互的成長過程中,科技巨頭陸續(xù)進(jìn)場與獨(dú)角獸崛起,就變成了一個合乎技術(shù)邏輯的事情。

  車載語音交互不長的歷史上,已經(jīng)涌現(xiàn)出了以下幾種“江湖流派”,讓“語言交互戰(zhàn)”成為了車聯(lián)網(wǎng)戰(zhàn)場上貨真價實的戰(zhàn)略高地

  安卓改裝流:國產(chǎn)車的常規(guī)套路

  最早認(rèn)識到語音交互價值的,當(dāng)然是汽車企業(yè)本身。而最早布局車聯(lián)網(wǎng)系統(tǒng)的,也是一批以自主品牌車廠為主的車企,他們普遍通過改裝原生安卓的方式來搭建自己的“車載UI”。

  而在這套交互邏輯里,也涌現(xiàn)出了原生版本的車載語音交互。

  這種 “原生態(tài)”語音交互系統(tǒng),一般由車企自己開發(fā),實際技術(shù)供應(yīng)商往往是長三角、珠三角的小工廠,因此沒什么技術(shù)研發(fā)成本。一般來說形式是一個安卓系統(tǒng)改裝的操作平臺,然后用戶可以在車載系統(tǒng)上安裝各種各樣的APP,形似一個安裝在車上的安卓平板。然后用戶可以使用某些APP中的語音控制,來控制FM、地圖等應(yīng)用。

  吉利吉客、比亞迪Dili nk等系統(tǒng)算是這個流派中相對成熟的。這類車企自制系統(tǒng),優(yōu)點是成本低廉,可以某種程度上作為營銷噱頭。

  但缺點也十分明顯:由于必須進(jìn)入APP內(nèi)部的語音交互,所以用戶說什么其實與車無關(guān),只是控制APP而已。而且往往交互邏輯中有大量需要觸屏操作的地方,用戶在行駛中必須經(jīng)常觸屏,對交通安全也是個隱患。

  總體而言,改裝安卓流派并不被看好。所以,有AI技術(shù)撐腰的科技巨頭們來了。

  車載音箱流:科技公司進(jìn)場人車交互的開端

  今天更多主流車企,開始注意到了車內(nèi)語音交互能夠帶給駕駛者諸多便利,甚至可以說是車載顯示器唯一合理的解決方案,于是主流車企+車載語音技術(shù)開始熱絡(luò)了起來。而科技巨頭以自己的語音技術(shù)優(yōu)勢,切入車聯(lián)網(wǎng)領(lǐng)域,就變成了順理成章的情況。

  國內(nèi)的Apollo小度車載系統(tǒng),國外亞馬遜的Alexa,都可以作為車企的語音交互解決方案來進(jìn)行合作。

  比如說,今年早些時候,寶馬已經(jīng)宣布將與亞馬遜的Alexa合作,在新出車型中搭載車載語音助手。駕駛者可以與語音助手直接對話,查詢地點、選擇想要收聽的內(nèi)容,以及相應(yīng)的綜合服務(wù)。而用戶可以選擇是否需要搭載Alexa。

  這種模式,從技術(shù)邏輯上來看,可以被理解為在整車完成后,把語音助手集成在車載交互中,嵌入到車輛的網(wǎng)絡(luò)交互設(shè)備里。說白了,有點像在汽車中安裝一個智能音箱,只是在交互形態(tài)和使用目的上與家用音箱不同。

  還有一種科技企業(yè)的進(jìn)場方式,是向車企的車聯(lián)網(wǎng)項目輸送技術(shù)。比如東風(fēng)風(fēng)神與百度DuerOS、博泰共同打造過Windli nk 3.0。百度在其中扮演AI語音技術(shù)輸出商的角色。

  目前,國外的亞馬遜、微軟,國內(nèi)的科大訊飛、百度DuerOS,都有相應(yīng)的車載交互體系,已經(jīng)被搭載到很多車輛當(dāng)中。

  這種嵌入式的車載音箱流,優(yōu)點是基本以成熟的AI語音交互系統(tǒng)作為底本,能夠產(chǎn)生不錯的對話體驗。無論是方言識別、自然語言處理還是對用戶的數(shù)據(jù)學(xué)習(xí),都比原生態(tài)版本強(qiáng)出一大截。

  相應(yīng)的問題是,這類系統(tǒng)由于大多是后裝或準(zhǔn)后裝模式,無法與汽車建立底層的機(jī)械聯(lián)系,所以能夠帶給用戶的操作比較有局限性。說白了,這更像是車企為由需要用戶準(zhǔn)備了一份錦上添花的禮包。

  但如果語音交互向走的更遠(yuǎn),車企與科技企業(yè)似乎必須走的更近才行。

  整車前裝流:巨頭醞釀中的下一個故事

  在讀者相對更熟悉的無人駕駛領(lǐng)域,我們已經(jīng)可以得出這樣一個結(jié)論:拋開車廠玩科技,基本是條死胡同。

  在人車交互領(lǐng)域同樣如此,假如離開了車企的制造基礎(chǔ),那么科技企業(yè)帶來的感知智能交互技術(shù),就像是在車內(nèi)擺放了一盆可有可無的裝飾。

  只有科技企業(yè)與車企更緊密合作,將人機(jī)交互的可控范圍加大,車聯(lián)網(wǎng)技術(shù)才可能帶來真正的駕駛升級體驗。這或許也意味著,車載網(wǎng)絡(luò)交互系統(tǒng),必須有后裝改為前裝:讓AI語音系統(tǒng)可以進(jìn)入汽車的機(jī)械系統(tǒng)里,甚至盡量靠近控制中樞。

  換言之,語音交互能夠部分取代車輛駕駛控制,在科技企業(yè)看來才是王道。

  這個領(lǐng)域已經(jīng)有科技巨頭進(jìn)駐,比如阿里與上汽合作的斑馬網(wǎng)絡(luò),核心業(yè)務(wù)方向就是結(jié)合AliOS的整車底層平臺,為車企提供前裝人機(jī)交互系統(tǒng)。

  前裝的直接價值,在于能夠讓語音交互控制車上更多的部件。比如車窗、雨刷、天窗、空氣凈化器等等。

  另一個意義在于,前裝可以在車上安裝更多傳感器與麥克風(fēng)陣列,讓人控制車的同時,車也可以主動感知到人的存在。由此能夠分清誰在說話、判斷每一個人的狀態(tài)等等。

  此外還由一個區(qū)別在于,科技企業(yè)假如只提供技術(shù)解決方案,那么車聯(lián)網(wǎng)連接的將還是一般互聯(lián)網(wǎng)內(nèi)容,無法獲得專屬于車的支付、內(nèi)容、旅游等產(chǎn)品服務(wù),而前裝系統(tǒng)可以直接綁定車主ID,這是讓車變手機(jī)的一個先決條件。

  當(dāng)然,整車前裝AI交互系統(tǒng)的故事才剛剛開始。

  一方面大量車企并未適應(yīng)這種模式,因為想要獲得更好的語音交互體驗,系統(tǒng)需要直接接入車輛的機(jī)械控制中樞,這在很多車廠看來是有安全隱患的。

  但整車前裝,科技企業(yè)與車企深度合作的路子很可能會越走越遠(yuǎn)。今年 Google I/O 大會開幕前,Google 還宣布了與沃爾沃的合作,雙方會合作打造不同于安卓的車載智能系統(tǒng)??萍计髽I(yè)走向與車企的平等合作,AI語音交互成為車輛本身的一部分,在方向上應(yīng)該沒有什么疑問。

  當(dāng)然了,我們更期待的,可能是語音交互成為駕駛的全部。

  無人駕駛流:人類還在等待的人車對話

  顯然,車聯(lián)網(wǎng)技術(shù)真正在等待的,是與無人駕駛的合流。雖然這個目標(biāo)在今天來看還遠(yuǎn),但從技術(shù)邏輯上看,車輛語音交互有一天會成為全面取代手動的交互模式。

  就像今天有些車主會堅持認(rèn)為,我用手控制挺好的,為什么要說話控制車?這其實涉及很多駕駛習(xí)慣問題,難以一概而論。但不可否認(rèn)的是,假如最終我們只用說說話,車就可以準(zhǔn)確舒適地把我們帶到目的地,那么與車的對話將具有絕對價值。

  這個邏輯所形容的,是L4級別無人駕駛中的語音交互。這個層級里,車輛將拋棄方向盤,也就是說駕駛場景已經(jīng)被取代。但如何獲得更舒適的出行體驗、選擇道路導(dǎo)航方式、緊急情況下的制動,今天看來還是需要人類進(jìn)行主動干預(yù)的。而干預(yù)的方式,應(yīng)該還是以人車對話為主。

  今天已經(jīng)有很多無人駕駛項目,開始研發(fā)無人駕駛場景下的人車對話機(jī)制。這種場景下,用戶需要下達(dá)的命令往往是復(fù)雜抽象的,有點類似我們做出租車時給司機(jī)的建議。那么要讓無人駕駛系統(tǒng)具象化這些建議,并落實成出行模式,就需要強(qiáng)大的自然語言處理能力、深度語義理解能力作為支撐。

  作為無人駕駛的必備配套技術(shù),這個領(lǐng)域目前已經(jīng)匯集了中外各路AI豪杰和車企,但同時也存在大量機(jī)會。讓人車可以像乘客和司機(jī)一樣對話,還有很遠(yuǎn)的路要走。

  車載語音這條賽道,究竟在比什么?

  綜上所述,車聯(lián)網(wǎng)這一局棋,某種程度上來看,真正在考驗的是車載語音交互的技術(shù)解決能力和綜合服務(wù)體驗。

  因為駕駛時的網(wǎng)絡(luò)服務(wù)必須圍繞聲音進(jìn)行,那么聲音能夠獲得的權(quán)限越大,交互技術(shù)越精準(zhǔn),生態(tài)服務(wù)越充沛,消費(fèi)者的體驗也就會越好。

  這一場關(guān)于人車對話的賽跑,無論是科技巨頭,還是新晉獨(dú)角獸、造車新貴,都必須考慮三個方面的問題:

  1、AI語音技術(shù)的體驗分:AI語音交互、IoT系統(tǒng)、云計算,這些技術(shù)體系進(jìn)入汽車,是一個廣泛而深刻的過程。而這個過程中,對科技企業(yè)拿出的技術(shù)解決能力是有嚴(yán)格要求的。車載場景不同于家居,有復(fù)雜的干擾環(huán)境,和必須快速執(zhí)行命令的性能要求。如何讓人車對話時,可以更好地完成遠(yuǎn)場喚醒、方言識別、特殊語序識別,是接下來AI公司需要繼續(xù)努力的。

  2、與車企合作的親密分:如果我們認(rèn)同語音交互控制車輛部分越多越好,前裝優(yōu)勢大于后裝這個邏輯,那么人車交互體驗就是建立在科技企業(yè)與車企的緊密合作基礎(chǔ)上。而在今天,即使是已經(jīng)全面領(lǐng)先的斑馬和AliOS,也面臨客戶群不夠多、合作品牌相對單一的問題。如何讓高端車、合資或者外資品牌車也部署“中國智造”的AI交互系統(tǒng),或許還是任重道遠(yuǎn)的工作。

  3、外接生態(tài)的服務(wù)分:對于車主來說,真正的價值撬點可能并不在語音控車上,而在于車載系統(tǒng)能夠提供的導(dǎo)航、內(nèi)容與綜合服務(wù)生態(tài),是否真正帶來了體驗改變。而這對于人機(jī)交互技術(shù)的提供者來說,還是相對困難的。而外接生態(tài)相對成熟的互聯(lián)網(wǎng)公司,似乎在這個邏輯上更有勝率。

  技術(shù)、車企合作、綜合生態(tài),人車交互產(chǎn)業(yè)或許正在跑著一場鐵人三項。但在無人駕駛真正到來之前的相當(dāng)長一段時間中,車載語音交互都會是汽車場景技術(shù)與體驗進(jìn)化的主旋律。在語言的迷宮下,人和車以另一種方式相遇了。

  而就車聯(lián)網(wǎng)而言,一個探尋的時代,也許會從語言與聲音的魔法中,慢慢開始它的覺醒。至少相比大部分車聯(lián)網(wǎng)偽需求來說,用聲音來觸發(fā)服務(wù),是駕駛場景中無可避免的選擇。