最新国产99热这里只有精品,猫咪AV成人永久网站在线观看

語音助手鏖戰(zhàn)“全雙工”，車載會(huì)是一個(gè)好場景嗎？

2019-10-22 08:54

語音助手鏖戰(zhàn)“全雙工”，車載會(huì)是一個(gè)好場景嗎？

一方面，作為最接近自然交互的形式，全雙工已經(jīng)成為智能語音領(lǐng)域的“香餑餑”，各大AI語音巨頭都在積極布局。

另一方面，車載場景的人機(jī)交互需求也越來越強(qiáng)烈，在手沒有被完全解放的情況下，駕駛員們對更自由、更隨性、更解放的語音交互有著更強(qiáng)烈的需求，全雙工為應(yīng)用“剛需”。

與普通生活場景不同，車載環(huán)境的用戶手動(dòng)操作更加不便捷，而同時(shí)又往往有諸多功能操作（例如關(guān)窗、開空調(diào)）、生活服務(wù)（例如導(dǎo)航）、娛樂消遣需求（例如聽歌），多樣化需求更需要更連續(xù)的對話體驗(yàn)——如果每一個(gè)指令都要喚醒口令，不但用戶體驗(yàn)不佳，從旁觀者看，這種交互方式也頗有些尷尬。

與此同時(shí)，有限空間里的司乘對話，多人對話與人機(jī)交互疊加，加上駕駛環(huán)境的嘈雜，無疑對智能語音提出了更嚴(yán)峻的挑戰(zhàn)。

于是，迫切的用戶需求加上龐大的商業(yè)價(jià)值空間，以及車企這些年對產(chǎn)品創(chuàng)新的渴求，在這場全雙工的鏖戰(zhàn)中，車載語音場景不出預(yù)料成了玩家競逐的焦點(diǎn)，全雙工＋車載的“搭配”迎來廣闊的市場機(jī)會(huì)。例如，不久前的重慶智博會(huì)上，騰訊云小微就聯(lián)合騰訊車聯(lián)展示全雙工語音交互技術(shù)，讓用戶對車載語音助手有了更多的好感和期待。

巨頭鏖戰(zhàn)全雙工，也推動(dòng)“第三空間”競逐走向臺前

目前為止，車載＋全雙工落地應(yīng)用仍處于初期階段，技術(shù)研發(fā)與應(yīng)用適配同步進(jìn)行中。

1、車載全雙工，巨頭各有玩法姿勢

微軟在2018年3月底宣布“全雙工語音交互感官”已完成產(chǎn)品化落地，“長程語音交互成為可能”，到2019年8月，又宣布全雙工語言交互技術(shù)已經(jīng)通過車載設(shè)備完成測試，已經(jīng)有了幾個(gè)測試合作汽車廠。

語音助手鏖戰(zhàn)“全雙工”，車載會(huì)是一個(gè)好場景嗎？

微軟的全雙工語音及其車載應(yīng)用是小冰項(xiàng)目的延續(xù)，第七代微軟小冰的重心之一是實(shí)現(xiàn)車載商用，逐步由“玩具”轉(zhuǎn)向現(xiàn)實(shí)價(jià)值，車載無疑是當(dāng)下最恰當(dāng)?shù)倪x擇。

而百度在押寶AI戰(zhàn)略的大方向下，全雙工技術(shù)的推廣十分積極。今年7月，小度助手升級的全雙工語音已經(jīng)在小度在家智能音箱產(chǎn)品上使用，且開放賦能給更多智能硬件終端。

入局語音交互領(lǐng)域較早的科大訊飛，在2019年5月底發(fā)布了智能物聯(lián)網(wǎng)操作系統(tǒng)iFLYOS 2．0，也在多個(gè)領(lǐng)域開始了全雙工交互技術(shù)的應(yīng)用嘗試。

今年8月，重慶智博會(huì)上，騰訊云小微全雙工語音技術(shù)也正式對外展示。依靠騰訊云小微這些年在語音技術(shù)上的深耕，選擇了最為“剛需”的車載場景率先落地全雙工交互技術(shù)，試圖從最符合用戶需求的駕駛場景打頭陣，然后進(jìn)行全域拓展。

車聯(lián)網(wǎng)與AI助手的結(jié)合，也是技術(shù)與生態(tài)基礎(chǔ)上的B＋C的搭配，非常符合騰訊在ToB轉(zhuǎn)向過程中的一貫調(diào)性。

2、技術(shù)推動(dòng)下，第三空間正由概念走向?qū)嵺`

在很久之前，汽車就被認(rèn)為是家庭、工作之外的“第三空間”，在歐美等汽車文化濃郁的國家，車的第三空間價(jià)值十分明顯。

但在中國，日常出行的屬性仍然占據(jù)大頭，用戶進(jìn)入車內(nèi)，聽音樂、導(dǎo)航、調(diào)空調(diào)……在不用重復(fù)喚醒的情況下，很自然完成一套操作……把全雙工放到車載場景中，如果從汽車角度看，本質(zhì)上是“第三空間”的一種強(qiáng)化。

拋開技術(shù)，從具體場景實(shí)踐來看，巨頭們在全雙工領(lǐng)域的布局和競爭，也在推動(dòng)“第三空間”競逐走向臺前，誰能讓用戶真正體會(huì)到車上服務(wù)的便利，挖掘這個(gè)空間的用戶價(jià)值，誰就能在車載場景中實(shí)現(xiàn)商業(yè)突圍，這本身也與汽車廠商求新、求變、謀求市場增量的需求相吻合。

第三空間的體驗(yàn)塑造，將面對用戶痛點(diǎn)的“三重區(qū)分”的挑戰(zhàn)

離開汽車視角，從全雙工技術(shù)視角來看，其面臨的首要挑戰(zhàn)在于，如何在連續(xù)對話中還能擁有很高準(zhǔn)確率和響應(yīng)速度。

例如，從已有資料看，騰訊云小微的全雙工語音交互技術(shù)，在30秒到90秒的時(shí)間范圍內(nèi)（用戶自行設(shè)定），一次喚醒即可實(shí)現(xiàn)連續(xù)對話，過程中用戶可以隨時(shí)打斷機(jī)器的回答。

語音助手鏖戰(zhàn)“全雙工”，車載會(huì)是一個(gè)好場景嗎？

而除了全雙工的特殊能力，騰訊云小微可實(shí)現(xiàn)車載復(fù)雜噪聲環(huán)境下喚醒率97％以上，語音識別準(zhǔn)確率96％以上，意圖理解準(zhǔn)確率高達(dá)98％。

這里不去對比這些數(shù)字的優(yōu)劣，畢竟多數(shù)語音助手都能拿出還不錯(cuò)的成績，但它們至少說明 “全雙工”交互下，準(zhǔn)確率仍能保持高水準(zhǔn)。不過，在汽車有限的第三空間里塑造用戶體驗(yàn)，語音助手們還有三大硬骨頭要啃——實(shí)現(xiàn)用戶的三種“區(qū)分”需求。

1、在幾何級技術(shù)難度升級的基礎(chǔ)上，區(qū)分“情境”

騰訊云小微稱包括播放音樂、導(dǎo)航、查股票、查天氣等眾多服務(wù)在內(nèi)，用戶都可以通過語音指令，跟車機(jī)一次喚醒、連續(xù)應(yīng)答、自然交互，這其中涉及一個(gè)很重要的問題：跨情境的全雙工服務(wù)。

目前的車載語音助手已經(jīng)可以做到在一定場景內(nèi)免喚醒，例如常用的聽音樂，想聽A歌曲又反悔，想聽B歌曲，機(jī)器自動(dòng)識別不需要用戶多次喚醒。

而當(dāng)場景需求延展后，全雙工語音技術(shù)就不得不面臨既要連續(xù)、又要跨情境“思考”的挑戰(zhàn)，而這又幾乎是汽車體驗(yàn)的必須，內(nèi)容、導(dǎo)航、查詢、設(shè)備控制……區(qū)分場景是“全雙工”的必要技能。

很明顯，即便是人的溝通在轉(zhuǎn)換話題時(shí)也需要適應(yīng)，機(jī)器在面臨這種情境跨越的全雙工語音時(shí)，其難度是乘法級的幾何提升，而非僅僅做疊加而已。

2、在復(fù)雜的對話環(huán)境中，區(qū)分“人”

與歐美不同，在當(dāng)下中國汽車文化中，家庭單位屬于仍然強(qiáng)于個(gè)人單位，“每家都有車”而不是“每人都有車”。很多時(shí)候，車中不只有司機(jī)，而肯定有副駕駛等其他乘客。

所謂“第三空間”不只是為司機(jī)服務(wù)，也為所有乘客服務(wù)。

對車載全雙工而言，這又帶來一個(gè)特殊的問題，如何讓不同的人有屬于自己的完整體驗(yàn)。如果把全雙工比作一個(gè)人，與之溝通時(shí)，司機(jī)或乘客肯定都希望他與自己的溝通是完整的。

從當(dāng)前的解決方式來看，行業(yè)主要采用多音區(qū)設(shè)置：主駕喚醒之后，都是聽主駕的聲音，副駕的喚醒后，都是聽副駕的語音，理論上，另一個(gè)人要接入全雙工交互，必須重新喚醒，才可以開啟自己的完整對話體驗(yàn)。嚴(yán)格來說，這是通過物理設(shè)置的替代性方案，并非機(jī)器對不同聲音的完全識別，而是通過聲音的來源區(qū)分“人”。行業(yè)內(nèi)也正在發(fā)展的“聲紋識別技術(shù)”，直接辨別不同的用戶，或才是未來更為徹底的解決方案，不過這仍需要等待。

3、在豐富多樣的服務(wù)中，區(qū)分“需求”

智能語音從一開始就是兩條腿走路：前端聽懂用戶說了什么，后端根據(jù)用戶的個(gè)性化需求推薦給不同的內(nèi)容、服務(wù)，或者執(zhí)行某些操控指令。

放到車載全雙工這里，其實(shí)問題拓展到了兩個(gè)層面：

怎么聽懂是對機(jī)器說的，而不是對其他人說的（比如人和人聊天），不要誤解用戶的需求；

在確定是對機(jī)器的需求后，如何實(shí)現(xiàn)更為個(gè)性化的服務(wù)輸出，畢竟，如果用戶想吃點(diǎn)喜歡吃的，你隨便導(dǎo)航到了一個(gè)用戶不喜歡的店子，或者甚至用戶想要去放松一下，你給導(dǎo)航到了公司，這樣的連續(xù)交互也就失去了意義。

前者需要語音識別能力的極大加強(qiáng)，它還有許多細(xì)節(jié)需要用技術(shù)實(shí)現(xiàn)，例如騰訊云小微稱其借助云端大腦，不但能理解用戶的話哪些是需要響應(yīng)的指令，哪些只是用戶對別人說的話，這其中同樣涉及復(fù)雜場景需求問題，懂更多還要區(qū)分是不是需求，挑戰(zhàn)進(jìn)一步升級。

后者，本質(zhì)上可以視為個(gè)性化推薦機(jī)制的延續(xù)，考驗(yàn)的語音助手背后的平臺數(shù)據(jù)能力，如何在盡可能短的時(shí)間內(nèi)了解眼前的用戶，為其提供定制化服務(wù)，強(qiáng)化全雙工的“實(shí)質(zhì)”支撐，而不是只有花架子。騰訊云小微打出“懂你所需”的旗號，通過訓(xùn)練后推送定制化服務(wù)內(nèi)容，這是全雙工技術(shù)的行業(yè)必然，只是看誰能更為準(zhǔn)確。

對用戶而言，同樣是自然的交互，如同與人交流一樣，與一個(gè)“懂你所需”的全雙工語音助手交互，就像是熟人聊天，而與無法實(shí)現(xiàn)定制化服務(wù)輸出的機(jī)器交互，就像是在和陌生人聊天，其體驗(yàn)差距無需多言。

語音助手鏖戰(zhàn)“全雙工”，車載會(huì)是一個(gè)好場景嗎？

全雙工語音助手趨勢不可避免，車載只是拼圖的一塊

幾乎不會(huì)有人否認(rèn)，語音助手是人機(jī)交互必然趨勢。經(jīng)過幾年的發(fā)展，在巨頭們的努力下，越來越高的語音識別準(zhǔn)確率，各平臺飚出的準(zhǔn)確率指標(biāo)，本身就證明機(jī)器的“聽見”和“聽懂”已經(jīng)逐步實(shí)現(xiàn)，剩下的是不斷完善的過程。

而“智商”問題一旦接近解決，“情商”問題就走向臺前，讓機(jī)器更貼近人，實(shí)現(xiàn)人性化、情感化，是語音助手必然的趨勢。

于是，全雙工等新技術(shù)不斷涌現(xiàn)。幾乎可以肯定的是，在未來，一方面全雙工必然要突破參數(shù)瓶頸，例如沒有30秒、90秒的區(qū)分，而是無限連續(xù)同時(shí)準(zhǔn)確識別需求，就是如科幻片機(jī)器人管家那樣的無縫交互，這是語音助手發(fā)展的必然；另一方面，更多其他的科技將不斷涌現(xiàn)，例如多模態(tài)識別，將聲音、圖像、環(huán)境等諸多因素整合來與用戶自然交互。

而顯然，雖然車載急迫需要全雙工等更多自然交互技術(shù)，但全雙工并不只會(huì)局限于車載。幾乎所有巨頭的全雙工技術(shù)的“理想”都是全場景應(yīng)用，即便是騰訊云小微選擇以車載為典型，未來也必將在全領(lǐng)域發(fā)力——到目前為止，在出行領(lǐng)域之外，騰訊云小微憑借全棧AI能力及騰訊豐富的內(nèi)容和服務(wù)生態(tài)，在文旅、政務(wù)、教育、智能硬件等多個(gè)領(lǐng)域都有涉獵。

以硬件為例，騰訊云小微AI應(yīng)用解決方案已經(jīng)輸送到機(jī)器人、智能電視、智能音箱、智能空調(diào)等多個(gè)品牌多款產(chǎn)品中，而且百度、科大訊飛、阿里等玩家都在積極布局。

可以說，車載是全雙工最熱的局部戰(zhàn)場，未來的全雙工將是全領(lǐng)域的戰(zhàn)爭，屆時(shí)，當(dāng)物聯(lián)網(wǎng)真正全面落地時(shí)，汽車這樣的第三空間將融入一個(gè)相互連接、不分彼此的“唯一空間”，車載全雙工與家居、工作全雙工聯(lián)動(dòng)，人與虛擬數(shù)字世界將實(shí)現(xiàn)無縫對接。

拭目以待吧。

＊此內(nèi)容為【科技向令說】原創(chuàng)，未經(jīng)授權(quán)，任何人不得以任何方式使用，包括轉(zhuǎn)載、摘編、復(fù)制或建立鏡像。

【完】