百度AI交互設計院發佈NIRO2.0自然情感交互系統,能力增強助力產業升級

7月3日-4日,「Baidu Create 2019」百度AI開發者大會在北京國家會議中心隆重舉行,大會聚焦產業智能化,向業界展示了百度最新的技術進展和落地實踐。在此次大會的百度AI交互設計論壇上,百度人工智能交互設計院院長、百度設計體驗委員會主席關岱松與其設計團隊共同向外界展示了百度人工智能交互設計院基於深度學習的人因工程,以及百度AI交互設計在無人駕駛、智能硬件、百度大腦、機械人、AR、VR等方面協同發展的實踐,併發布多項最新AI交互設計成果,不僅包含全新升級的小度交互設計系統,更有AI交互設計助力產業智能化的最新探索。同時,三款基於百度自然情感交互系統NIRO開發的軟硬一體化創新機械人也在現場首次亮相。

以下為演講實錄:

各位開發者,各位嘉賓,我是百度AI交互設計院人機探索實驗室的負責人,大家上午好。今天大會設計分論壇的一個重要主題是AI交互設計如何助力人工智能產業化升級。服務機械人產業在過去幾年中國都有超過35%的增長,而這其中在家庭和公共場所主要功能是教育、娛樂、諮詢、業務辦理的服務機械人正在被越來越多的人接觸到,它們依賴的能力中非常重要的一部分是人機交互能力。

為了提升機械人的人機交互能力,在去年AI Creat 2018我們發佈了機械人的自然情感交互系統NIRO1.0,NIRO1.0包含三個層次-機械人自然語言交互模型、人類情緒應對模型、機械人主動交流交互模型,通過這三個模型可以讓機械人的語音交互更高效、能主動服務、有情商。推動行業進步的根本途徑是提升體驗,人機交互系統只是體驗的一環,只有和硬件能力相互結合發生化學反應,才能更有效的提升機械人的體驗。因此在過去一年裡我們與百度內部多個團隊進行合作,通過軟硬一體化打造了多款機械人產品。今天是這些產品第一次對外展示,大家先睹為快。

第一款產品,「現實版的大白」-公共服務機械人NIRO-Max,它是百度AI交互設計院人機探索實驗室,以NIRO為基礎, 從ID、人機交互到結構工程、機械工程為百度智能雲打造的新產品,將在今年第三季度正式推向市場。

目前服務機械人的主要使用場景是在公共區域,且市場依舊處於非常早期的階段,用戶並沒有在人機交互層形成固定的使用習慣。因此服務機械人成功的關鍵是兩個維度-感官體驗層和使用體驗層,只有它們形成正循環,產品才會越來越多的被使用。

機械人的外觀設計和其他所有產品都不一樣,根據日本機械人專家森昌弘「恐怖谷理論」,當機械人外觀很接近人時反而會讓人覺得恐怖,這是非常特殊的,因此機械人的外觀設計不僅是設計學更是認知科學,比如面部是不是越具象越好?肢體究竟要多完整?為了解決這些問題,在設計NIRO-Max時我們設計了幾十種面部和肢體的組合模式,按三個維度進行了14天超過500次的測試,最終找到機械人面部和肢體配比的舒適區間。並且通過研究發現機械人頭部形態如果接近於嬰兒的頭部形態更能激發好感。

機械人簡單的外表下隱藏了複雜的加工工藝和元器件組合,比如為了保障面部透光率和表情均勻,我們重新設計了噴漆路徑,並在基材加工上做了鏡面拋光和增透處理。為了讓機械人呈現出豐富的表情,我們在機械人這麼小的頭部內定製了小體積超短焦的激光投影,它的投影比例達到0.3.

如果說機械人的外觀決定了是否能吸引用戶首次使用,那麼使用層的體驗將決定它是否被反覆使用。在使用體驗層我們為機械人設計了兩種交互模型 – 語音交互模型和主動交互模型。

在語音交互維度,語音交互主要分為遠場與近場兩個場景,在遠場使用的交互模型是「喚醒-響應-輸入- 理解 – 行動/回答」的交互模型,這種交互模型在智能音箱當產品上已經打磨的非常成熟。但是服務機械人的語音交互更多的是在近場發生,目前主流的喚醒方式有兩種 – 按鈕喚醒和人臉喚醒,而按鈕喚醒需要尋找不易使用,人臉喚醒易誤喚醒抗噪能力差,為了解決這些問題,我們為NIRO-Max設計了兩種喚醒方式- 多模自然喚醒與觸感喚醒。

多模自然喚醒是利用高清攝像頭判斷用戶是否在和機械人說話+麥克風陣列的定向收音增益,它不僅支持多人嘈雜環境下的自然喚醒,而且可以隨時打斷。通過這種方式它的交互效率比喚醒詞交互效率提升5%,喚醒+指令分開輸入主觀感受體驗提升56.2%,喚醒+指令連續輸入主觀感受體驗提升31.2%。

觸感喚醒模仿的是人與人之間通過觸摸來喚醒彼此方式,NIRO – Max通過頭部、肩部、手臂、手掌共7塊觸感傳感器,來支持觸摸喚醒。觸感喚醒不但還原了人類自然的喚醒方式之一,還可以增強趣味性,拉近用戶與產品的距離。

主動交互通過減少用戶輸入來提高服務效率,而主動交互的難點在於在什麼場景下要用什麼形式進行什麼程度的主動交互。NIRO-Max根據機械人的與用戶的距離、機械人的狀態設計了三種主動交互方式- 主動詢問、主動展示、自主巡航。

主動詢問是當用戶走向機械人正面小於1.3m時,這時候對用戶需要服務推斷是比較準確的,機械人會根據當前位置、人臉識別等信息主動詢問某項服務。

而當用戶與機械人的距離處於中場,當檢測到有過往用戶在1.3m到3m之間慢速行走並看向機械人,或停下來看向機械人時,機械人主動展示自身能力並詢問是否需要。

主動巡航的基礎是3攝像頭+雙雷達感知能力,基於這種能力,NIRO-Max可以根據設定路線巡航並在人群聚集處停留一段時間,通過界面播放服務內容,這大大提高了機械人的覆蓋區域。

機械人的功能層質量以體驗層為基礎,感觀層通過科學的設計做到強的交互意願度,在使用層以NIRO系統為基礎,通過自然喚醒、主動交互讓機械人可以有高效的交互、更多的服務時間。

在過去一年基於NIRO的設備不止於此,還有會議室智能助理機械人NIRO-Hi,通過內置NIRO它可以實現一步撥打語音電話,以及語音交互智能屏機械人NIRO-View, 它可以實現多人全自然的語音交互、主動展示信息,還有剛剛展示過的NIRO-Key可以通過預識別實現無停留通行,它們都是基於NIRO的軟硬一體化創新,通過NIRO它們都能實現更自然的語音交互、主動服務用戶、有情商,而越來越多的設備使用NIRO也推動了NIRO能力的提升。

通過一年與機械人產品的軟硬一體化結合應用,不斷的實踐升級探索,今天我們將推出增強版的NIRO – NIRO2.0。NIRO2.0從即日起開放申請,它將擴展兩方面的能力。第一,機械人的自然語音交互模型由單人擴展為多人,這種能力從即日起可以使用。第二,新加入了機械人的自然動作引擎,可以讓機械人的動作流暢自然且在動作幅度、速度上具備一定隨機性,這種能力是今年8月開放使用。目前前面所列舉的機械人產品的人機交互系統已升級為NIRO2.0, 也歡迎大家訪問NIRO官網獲得這些能力。希望越來越多的NIRO 設備可以被創造。

謝謝大家!


想在手機閱讀更多中國內地資訊資訊?下載【香港矽谷】Android應用
分享到Facebook
技術平台: Nasthon Systems