作為百度AI交互設計的重要陣地,經過過去一年不斷的探索,百度人工智能交互設計院取得了令人矚目的成果。在AI交互設計論壇現場,百度人工智能交互設計院高級經理向業界介紹了百度人工智能交互設計院的最新成果:在18個人機交互和人因工程領域的專業學術/行業平台累計發表或錄用23篇論文,通過公眾號發佈68篇人因工程文章,並在行業內發佈了《智能汽車人機交互設計趨勢白皮書》與《2019AI人機交互趨勢研究》兩大核心報告,為行業指出了人工智能時代下的交互設計趨勢。
同時,為了進一步提升用戶體驗,百度人工智能交互設計院建立了中國最AI的家居實驗室。通過邀請被訪者模擬在家庭場景下的真實狀態和行為,結合人體檢測、情緒識別、音頻內容檢測等多項百度大腦開放能力,用AI技術賦能人機交互體驗研究與探索。而通過與百度研究院商業智能實驗室合作,基於百度自主研發、開源開放的深度學習平台飛槳(PaddlePaddle),打造了界面設計深度學習算法,對用戶體驗進行分析,生成最優界面設計區間。
事實上,研究團隊還做了很多超前的人機交互探索,總結出決策樹,使機器變得更加聰明,懂人情。未來的AI賦能,會讓人和機器之間的距離更近,也會讓機器更懂人類。
以下為演講實錄:

各位嘉賓上午好,我是百度人工智能交互設計院高級經理,非常高興站在這裡和大家分享過去一年百度人工智能交互設計院在研究上一些新的突破和進展,我們把它叫做「AI時代的研究新大門」。
AI改變了我們的生活,各種智能產品已經出現在我們的身邊。作為一個高科技公司的員工,我非常習慣上班刷臉打卡簽到、刷臉付錢吃飯,沒事兒撩撩小度,帶訪客一起坐坐無人車。
作為研究員,我們則在智能家居、智能駕駛、公共服務的領域進行人因工程的研究,去發現影響人們與產品交互時的關鍵因素,找到體驗優化點。兩年累積下來,我們開展了50多個研究項目,成果也陸續應用到了產品中。
除了內部應用,我們也通過論文、公眾號文章,以及線下交流等形式和學界、業界不斷交流,分享我們的研究成果,累計發表或錄用論文23篇,發佈公眾號文章68篇。

對前沿趨勢的洞察,我們以白皮書的形式進行總結和傳播。比如我們2018年10月與湖南大學聯合發佈了《智能汽車人機交互設計趨勢白皮書》,2019年2月,獨家發佈了《2019AI人機交互趨勢研究》報告。
在這兩年的經歷中,我們看到了AI的能量巨大,AI改變生活、改變各行各業。所以我們也在一直不斷在思考,在人因工程研究的領域,如果有AI加持,我們能做什麼呢?今天給大家分享我們的兩步實踐。
第一步,我們搭建了一個家居實驗室,讓AI自動識別、採集和分析用戶數據進行研究。過去,為了了解人和智能產品的交互體驗,我們會去用戶家裡拜訪,或者把用戶邀請到我們租用的民居中,進行人機交互的實驗研究。
通過這些研究我們得到了很多重要發現,但是這些研究方法一直面臨著人工分析成本高、時間長、數據精度低的問題,而且一些創新交互原型只能在內網實現時,我們又無法把它們帶到真實的家居環境中測試,帶來了研究的局限性。
所以,建造一個家居實驗室,更真實地還原交互場景,更智能採集和分析數據,提高研究的效率和精度,是我們很早就確定的目標。今天,這個實驗室已經在百度科技園建成並有效投入使用,它支撐了我們在智能家居領域的各項研究。它不是最早的,也不是最大的,但肯定是中國最AI的家居實驗室。在這個實驗室里,涵蓋了客廳、卧室、廚房、餐廳等家庭主要場所,幾乎可以還原被訪者在家裡的一切操作。
在這裡,被訪者可以自由地和各種產品互動,有已經上市的,還有很多我們還在研發中的產品。而且就算是已經上市的產品,通過實驗室集成的設備控制平台,我們可以調整這些設備輸出的各種參數,比如燈光、話術、音色等,並加入很多現有產品還沒有的能力,比如手勢交互、主動交互等等,以供我們測試。這是第一個層面的最AI,它是可以體驗未來AI生活的智能實驗室。

而在被訪者的授權同意下,我們通過在實驗室內布置的音頻、視頻、溫感、紅外等信息採集設備,實時收集實驗過程中被訪者的聲音、動作、情緒等,而不對他們造成任何干擾。
採集到的信息和百度大腦的能力相融合,這就帶來了第二個層面的最AI,它能自動化採集和分析數據。比如,能識別人體、人臉屬性、分析人的音頻、姿態、動作,追蹤人體行為與空間距離,最重要的是,能夠實時監測和分析人的情緒。有了這些能力,讓我們可以更懂用戶。
https://v.qq.com/x/page/m0896crw5be.html
百度智能家居交互設計實驗室
我們邀請被訪者到實驗室,自然地和各種智能產品進行交互,總結出人們和智能產品交互的行為模式和體驗要素。比如他們交互時的位置、距離、關注因素等等。
我們發現除固定位置交互,當人在移動中去和智能語音產品交互的時候,通常人會走近到1.5-2米之間才開始與產品說話,這也在人和人之間的社交交往距離範圍內。並且,大多數情況下人會不自覺去看產品,特別是開機/喚醒/配網的任務下,期待產品除聲音以外更豐富的燈光、界面反饋。這也帶出來小度用戶體驗團隊對燈光反饋的更精細化設計,在接下來的分享中大家會看到設計成果。
在這個過程中,我們發現被訪者會用不同的方式調節去音量,「大點聲」、「聲音大一點」、「大一點點」,這看似是個「文字遊戲」,但實際上卻反映出他們不同的心智模型。所以,我們單獨把這部分數據拿出來分析,把被訪者首次調節音量的指令,和他最終調節滿意的音量對應起來,計算出指令和音量調節步幅之間的對應關係,還原心智模型。
我們還發現,被訪者在不同的距離和音箱交互時,他們最滿意的音量範圍不斷變化。這是為什麼呢?其實是聲音隨着距離的增加在不斷衰減,而人的聽覺舒適區域是相對穩定的55-67分貝。

基於這些研究發現,我們提出了「個性化音量調節策略」,它綜合考慮了音量調節歷史、語義理解以及交互距離等因素。目前這套策略正在內部測試,我們也申請了專利,不久的將來會在產品中應用。
在實驗室,我們還可以記錄下被訪者所有的界面操作行為,以及以每秒15次的頻率,記錄下他的情緒變化,這是一個很精細的數據。
累積一定時間的數據,我們可以畫出被訪者的情緒波動圖。比如說一個被訪者真實閱讀資訊推薦內容11分鐘后所畫出來的情緒曲線,上面有10000個數據點。
通過情緒和行為比對,我們可以找到她的情緒高點,比如這個時候我們看到她在看可愛的貓;也可以找到情緒低點,比如這個時候她在看恐懼的高空視頻,結合行為記錄我們可以看到在這個內容和情緒後續,是關閉閱讀,還是繼續瀏覽類似內容,從而找到內容-情緒-行為之間的關聯關係。當我們提煉出這套策略關係,在實際應用場景中,就可以基於用戶行為反推用戶情緒,修改內容推薦策略,優化產品體驗。

通過讓被訪者在這個「家中」模擬出他真實的生活軌跡,綜合以上的分析能力,我們可以繪製出最細緻的用戶體驗地圖。
我們不再是單一地去評估一個產品的用戶體驗,而是將它們放到同一個時間、空間的維度,更立體地去還原和理解用戶需求、場景、產品、體驗之間的關聯關係。
通過邀請更多不同的人群來家居實驗室進行體驗研究,有單身青年、年輕小夫妻、三口之家、空巢老人,他們代表了我們現有智能家居產品用戶人群的大多數,使得我們更深刻地理解用戶需求,追尋用戶本真,為產品優化提出更細緻的落腳點。
當然,除了對現有產品進行體驗研究,在這裡,我們也會探索未來人機交互可能的形態和模式。
隨着AI情境感知能力的提高,智能產品比如說機械人將可以識別人和環境,主動提供服務。但是,在什麼樣的情況下機械人可以主動,哪些人更願意接受機械人主動交流,不同任務下有沒有差異?比如用戶難過的時候,它怎麼表達安慰?緊急事情發生時,它應該如何通知等等,我們進行了研究。
通過設置不同的情境和人群實驗,我們積累了很多結果並總結形成決策樹。這個決策樹將會讓機械人變得更加聰明,懂人情。

通過以上案例,我們可以看到,AI替代了我們過去繁瑣的數據記錄和分析工作,甚至比我們做得更快、更精、更好。當我們的精力被AI釋放出來,我們可以更專註於用戶需求和行為本身,並在一個更加立體的空間還原他們最本真的訴求。
我相信,未來在這個空間,還有更多的AI能力可以應用,也將有更多場景和產品被創造和驗證。
我們第二步突破和進展,可能大家已經期待了很久,就是運用深度學習,進行用戶體驗的研究。深度學習是一種非常強大的算法,它通過大數據去學習人的認知過程,進而構建複雜的模型,能進行判斷和預測。
我們今年和百度研究院商業智能實驗室展開了深入的合作,嘗試將深度學習算法運用於界面設計、音色體驗、外觀設計等多個維度的用戶體驗研究。目前,我們已經完成的研究成果是在界面設計方面的模型應用。
如何找到最優的界面設計,是困擾每一個設計師、每一個用戶體驗研究者由來已久的問題。因為要設計一個界面,涉及的因素,實在是太多了。以我們最熟悉的手百App首頁為例,簡單拆解,我們可以發現,這個頁面有14個模塊組成,每個模塊各自都可以有不同的變化。

比如最熟悉的搜索框,設計師需要考慮的因素竟然有二十幾個,比如說框的顏色、粗細、高低、圖標設計、字體、字號大小等等。挑選其中最關鍵的8個因素,綜合計算它們可能的取值,全部的組合是近兩百萬個,這是一個人力很難企及的數據。
在過去,我們會讓設計師不斷嘗試,依靠經驗判斷,然後做出艱難的取捨,最終定下來8個,進行線上的小流量實驗。這8個, 是對設計、開發人力、流量影響、數據準確性綜合考量的結果。從200萬到8個,絕大多數方案沒有機會被驗證。到底我們挑選出來的8個,是不是最優的那8個,我們無從知道。
所以,有沒有可能測試更多的方案,獲得最優設計的答案呢?深度學習的出現,讓這件事變為可能。
我們和百度研究院商業智能實驗室的算法工程師合作,基於百度深度學習平台飛槳的算法,訓練機器判斷和預測的能力。這裡演示實現模型構建的流程有8步,實際上可以分為兩個階段。

第一個階段,我們把頁面拆為不同的模塊,收集用戶體驗數據,先對模塊進行深度學習,找到最優模塊設計區間。
第二個階段,我們把每個模塊的最優區間重新組合成不同的界面,再收集用戶體驗數據,讓機器進一步學習,找到最優界面的設計區間。
具體展開模型構建的過程。首先,算法工程師通過模型的複雜度計算深度學習所需要的最少方案數,是2000多個,大約是所有組合的千分之一,依照這些組合隨機生成測試方案。
然後,我們通過眾測的方法,將這些方案隨機拆解給1000多個用戶進行評價,評估每個方案的體驗好壞,我們收集到了4萬多條用戶數據。
接下來,算法工程師基於這些數據,進行深度學習模型構建,讓機器學會判斷設計好壞的標準。經過多輪的學習和模型優化之後,模型準確性會不斷提高。最後,我們再隨機生成300多個新的方案,讓用戶和機器同時判斷,通過兩者判斷的一致性,去檢驗機器的學習效果。
我們來看一下深度學習的部分結果,這裡每一個圖代表了一個設計因素對用戶體驗得分的影響,橫坐標是因素的取值變化,縱坐標代表這個取值下用戶的喜好度,得分是越高越好。
圖一,我們可以看到這個因素非常關鍵,隨着取值的不斷上升,體驗會下降。圖二說明,這個因素取不同值時,對體驗幾乎沒有影響。圖三說明,雖然隨着這個因素取值越大,得分有向下走的趨勢,但它的用戶體驗得分分佈很散,說明這個因素受其它因素的影響較大,它需要綜合考量。

通過模型,我們可以計算得到這個框架下的任意一種設計的用戶體驗得分,設計師可以通過模型反饋的結論,不斷調整設計,從而找到最優方案。這個模型計算的結果與用戶實際打分的結果,一致性達到了92%。

通過同樣的流程,我們進行新聞模塊的深度學習研究。我們梳理出相應的設計因素和取值範圍。這次交叉出來的組合數,是20多萬。我們依然是生成隨機測試方案,進行用戶體驗數據回收,構建深度學習模型。
這是新聞模塊深度學習的部分結果。在這裡我們發現了一個新的規律,即圖一這個因素,隨着它的取值變化,對用戶體驗的影響呈倒U型,即它存在最優區間,它既不是取值越大越好,也不是取值越小越好,而是在中間。

因素二和因素三隨着取值變化,用戶體驗得分會略升或略降,但範圍也是比較分散,同樣受到其他因素的影響,設計時需綜合考慮。
同樣我們得到這個框架下的任意一種設計的用戶體驗得分,這個模型計算的結果與用戶實際打分的結果,一致性是95%。

當我們研究完不同模塊之後,我們將模塊進行組合,進行界面研究,用同樣的流程我們構建了界面級別的深度學習算法模型,給出了最好的界面設計方案。
我們粗略去進行一下深度學習算法和傳統測試方法的比較,應用深度學習去進行設計模塊的研究,我們研究的廣度即方案數提升了百倍級,生成模型的複雜度提升了萬倍級,而研究效率較以往提升3-4倍,模塊學習后給出的最優方案,較傳統測試方法選出的最優方案,用戶體驗提升了16%。更為關鍵的,這是一個可以預測的模型,這意味着,在這個模型框架下,無論任何新的參數設計,都可以被直接計算出用戶體驗得分。
而對頁面來說,我認為這個價值的提升是無窮的。過去我們可能都是靠設計師的經驗,綜合設計出幾種不同的方案,完全無法解釋因素對頁面的影響關係。有了深度學習模型算法,我們每測試一個新的模塊或新的頁面類型,都可以把新的數據加入原有的模型繼續計算,經驗可以復用,最終我們會得到一套的可覆蓋所有移動頁面的用戶體驗深度學習算法評估模型。
總結以上,AI時代,我們從研究AI到讓AI為我們所用,實現了更智能更精準的用戶行為和情緒分析,建立了更高效更複雜的用戶認知模型,這是用戶研究新的開始。我們也還在更多研究中嘗試加入AI,期待在未來的場合給大家做更多的分享。
最後,感謝過去2年對我們持續關注的朋友,百度人工智能交互設計院仍將以引領與定義最好的人機交互作為使命,做時代的探路者,勾勒AI時代的第一張用戶體驗地圖,歡迎更多的朋友關注我們,與我們交流。謝謝大家!