語音助理裝置有那些新奇之處 ?

語音助理裝置有那些新奇之處 ?

2019 年 11 月 5 日 - 上午 9:30 - EXEC TALK

專訪聯發科技業務暨事業發展本部協理 Mark Odani

根據 Juniper Research 資料,目前使用中的語音助理超過 32 億 5 千萬台。消費者日漸仰賴智慧手機的語音助理,以及各種語音協助的智慧家庭連線裝置。無論您想要設定行事曆,或是查看明日天氣預報,語音助理都能提高您的生產力。您只需開口就好,完全不需開啟應用程式、搜尋選單、以及上下移動畫面找出最佳設定。只要告訴裝置指令,即可輕而易舉完成您想作的事。

許多消費者已經發現,聯發科技長期以來一直是語音助理革命的領導者。我們是全球首屈一指的語音助理裝置(VAD)晶片製造商,我們的晶片組驅動市場上最受歡迎的語音助理產品,包括 Amazon Echo Dot、Fire TV Stick 4K,以及許多 OEM 廠商採用 Google Voice Assistant 與 Alibaba 的裝置。

在這邊,聯發科技業務暨事業發展本部協理 Mark Odani 會討論語音助理市場現況、語音科技與聯發科技在此一產業扮演的角色、以及未來的展望。

聯發科技為語音科技領域帶來那些貢獻?

目前,聯發科技的語音助理驅動各式各樣裝置,範圍從智慧音箱、智慧電視到化妝鏡、掃地機器人、恆溫酒櫃等各種連線家電。與頂尖品牌合作的經驗,讓我們深入瞭解消費者需求,以及下一代裝置的需要。在此一領域,聯發科技的特點是能夠設計解決方案,在提供多樣化功能的同時保持超低耗電,後者是智慧裝置不可或缺的需求。我們看到智慧家庭產品已出現強烈需求,不但需要整合語音助理,更需要使用觸控螢幕,讓消費者有更多與裝置互動的方式。

我們的先進終端(Edge AI)人工智慧科技,讓合作夥伴進一步擴展產品功能。運用省電的聯發科技晶片組,我們的夥伴無需使用大型電池,即可在小型智慧裝置內整合人工智慧功能。這些裝置能夠自行處理人工智慧資訊,即使在未連線網路的狀態下,也能支援部份人工智慧擴增語音功能。對合作夥伴而言,這代表他們設計產品時擁有更多選擇,讓消費者的生活更加豐富。

對於各種語音助理產品與音訊應用,聯發科技目前大量出貨中的 MT8516 是最理想產品。這種整合式硬體與軟體解決方案内建四核心 Arm Cortex-A35 應用處理器,最高時脈達 1.3 GHz,能夠以更快速度處理使用者指令。另外,在電池續航力方面,新世代 MT8518 人工智慧語音單晶片達成了重大突破。與前代解決方案相比,MT8518 的待命時間延長十倍,播放時間延長兩倍。這種晶片的低耗電設計,使其適用於可攜式音箱等電池電源設備。我們還希望確保消費者得到最佳音質,所以在 MT8518 內建 PowerAQ,這種功能強大的音訊校正工具已獲許多品牌大廠採用,用於提供優越音質。

為了幫助加快連線裝置整合 Alexa 語音服務的腳步,我們最近推出MT8516 雙麥克風開發工具。隨著消費者在家中引進多種裝置,它們之間的密切合作變得更加重要。運用 Amazon 的多房音樂(MRM)科技,您可以同時在多個配備 Alexa 的裝置上串流喜歡的歌曲。此外,這些裝置的應用處理器內建聯發科技的遠場演算法,因此無需安裝數位信號處理器(DSP),可減少成本與加快設計流程。

業界對於終端人工智慧已有諸多討論。請問終端人工智慧(Edge AI)是什麼,還有對使用者體驗有何影響?

終端人工智慧代表在裝置上處理人工智慧功能,而非送往雲端或經由網路處理。與雲端或遠端處理相比,終端人工智慧具備數項重要優勢,包括在裝置上處理部份功能的速度較快,能讓消費者立即取得他們想要的資訊。此外,和傳送至雲端相比,在裝置上處理資料更為安全,能提供更佳隱私保護。

語音助理引進之初,部份裝置只能在終端處理少數字詞,亦即所謂的「喚醒字」。隨著科技愈來愈進步,語音助理已能夠在終端處理更多資訊,甚至預測消費者行為,與使用者更密切互動。例如,如果您指示智慧音箱在夜晚關上燈光,音箱會同時建議您開啟家中的防盜警鈴。

未來五年內,語音科技會如何演變?

未來數年內,我們預期語音助理將內建在更多樣化的家用與其它領域裝置。例如,我們將看到微波爐、時鐘、洗碗機、以及其它家電根據您的聲音執行指令。基本上,無論是燈光開關或除草機,只要是能夠以語音指令輕易執行的任務,都會獲得語音科技。我們將看到不同型式裝置之間出現更密切整合,造就能與現有裝置合作的新式智慧裝置問世。對於使用其它語音助理平台裝置的消費者而言,這點尤為重要。簡而言之,您可以購買來自不同廠牌的裝置,預期它們能夠彼此溝通。

汽車產業是語音運算的另一個成長領域。未來數年內,我們將看到更多車輛整合語音助理,讓駕駛人雙手無需離開方向盤,即可輕易管理娛樂與舒適功能(例如冷暖氣與調整座位),以及在車內進行導航。隨著汽車擁有更高自主能力,我們預見未來使用者只需運用語音,即可操控全車功能與駕駛體驗。