[加薪衝刺班] 動口不動手!語音助理發展現況與趨勢


語音為什麼這麼受關注?不妨從控制本身考慮一下。

我們要去控制,

要麼「動手」,要麼「動嘴」,要麼「動腦」。

動手簡單但也麻煩,APP現在都懶得去點。

動腦方便,但腦電波EEG和人工智慧AI技術還在發展中。

還是動嘴容易,語音技術也越來越成熟,也讓我們來看看目前有哪些主要的智慧語音。




§ Google Assistant

於2016 Google I/O 2016 中發佈了 Google 助理(Google Assistant)

其操作方式與Google now 大同小異,

但Assistant的同詞更口語化更接近真人對話,

並且與Apple Siri 相比較之外更加主動。

而Assistant並整合應用在文字通訊軟體Allo和

視訊通訊軟體Duo以及智慧家電Google Home當中。




§ Apple Siri
在語音控制和場景話方面,Siri 只能支持語音交互方式,

對環境要求比較高,在嘈雜環境或者安靜的會議室等則並不能使用

而且,雖然具備一定學習和模仿用戶的能力,

但由於只能單輪對話,Siri 對於個性化需求的把握比較差。

不過在2016WWDC開發者大會上宣佈自IOS10開始,

允許開發者使用Siri SDK在第三方APP上整合Siri的語音控制功能,

代表者往後只要從Siri就能把所需下達的指令傳至該APP,

例如「Line Joe 我會晚點到」。

不難看出Apple企圖以開放Siri SDK

給開發者來與Amazon Echo 和Google Assistant競爭。




§ Microsoft Cortana
頑皮個性是微軟私人助手的一大標籤,

從微軟小冰身上也可見一二。

(在Twitter和LINE上也公開了日本版的「小冰」,名叫Rinna)

小娜與 Siri 和 Google Now 功能類似,

尚未對此領域有顛覆,

值得稱道的是允許與第三方平台連接。

目前在W10當中己加入語音秘書,

會透過使用者的行為和使用習慣,

來記住使用者的喜好,

自動追蹤使用者關心的議題,

並協助將無關的資訊過濾掉,

也會幫忙管理行程、提醒要完成的任務。



§ 百度 度秘
 
應對多樣化個性化的需求,百度的秘籍是採用多模交互與多輪交互。

什麼叫多輪叫互?簡單說,

就是可以實現人和機器連續多輪對話(機器需要理解上下文語義並作出判斷)。

多輪溝通能讓機器最大化了解人的真正需求,

從而提供最滿足需求的優質服務。


除此之外,度秘能夠依據場景的不同,

白天還是黑夜,上班途中還是下班娛樂等,

為用戶提供最適合的服務。


最後聚焦到語音控制能力上,

做為一家中國企業,它對深奧的中文支持度更好,

當用戶表示「好久沒看電影」這種非直接需求時,

度秘可理解出「想看電影」的潛意思。




§ Facebook 虛擬助理 "M"
Facebook 虛擬助理 M 混合了人工智能和人力,

幫助用戶發現訊息並解決問題。

就功能上,比較像訊息集成中心,

幾乎可以解決所有問題並滿足少數人群的需求,功能相當強大。

但需要投入大量人工後台,

後期開放後響應能力如何有待商榷。




§ Amazon Echo
相比 Siri 等需要依賴手機的語音助理,

Echo 最大的優勢還在於它超強的聽力。

它的頂部有七個呈環狀排列的麥克風,

能準確地捕捉到來自各個方向的聲音。

用戶評測隔著兩堵牆(開著門),它也可以聽見並迅速回答問題,

同時較少受雜音干擾,另外,它也不太挑剔使用者的口音。



 
-

§ 結語

自2012年開始,Google、Facebook、蘋果、

Amazon、微軟、IBM及雅虎等科技巨頭們,

紛紛收購人工智慧公司來尋求突破。

而語音助理的最重要的優勢是使用者介面的整合,

整合各種不同個別消費電子產品,物聯網服務等存取,

甚至跨出家庭,將穿戴裝置、汽車資通系統服務等等。


另外很難說第三方開發商和設備製造商

將以多快的速度應用這些語音助理,

但在2017年,這一方面會有大幅度發展。

一旦你看到任一家公司開始吹噓他們的語音助手系統的規模時,

你就知道這場戰爭全面開戰了。


-

dPlus Trend

dPlus International 彙整最新趨勢幫助職場工作者洞悉全球行銷走向