圖靈機械人:帶着千億條語料庫,它成為了 QQ 的群聊機械人 | 創業

曾聽見一位對話機械人公司的老總抱怨自己雖然有一個好的算法卻苦於沒有數據,於是在微信群內廣發「英雄帖」,詢問誰能為其介紹大數據資源。可見大數據已經成為人工智能企業創業最為關鍵的要素,雖不能說得大數據者得天下,但得大數據者至少在創業的道路上已經成功了一半。

當市面上的大多人工智能公司都在買數據時,我們不僅不需要買數據,甚至都已經可以賣了。

圖靈機械人 COO 郭家表示圖靈機械人最大的優勢便是擁有全球頂級的中文對話語庫。據介紹,目前 圖靈機械人 已經擁有 40 多萬的開發者,積累了 1300 多億條語料庫,而且值得一提的是這是對話語料庫,極少有其他公司能達到這樣的量級。那麼圖靈機械人是如何做到的呢?

congdong

一切都得從蟲洞語音助手說起。

蟲洞語音助手 是圖靈機械人於 2012 年正式發佈的類似於蘋果 Siri 的對話機械人,其具備語義搜索、智能問答、語音控制等功能,旨在解決用戶生活中遇到的各種問題,幫助用戶快速獲取信息。作為國內較早的語音助手工具之一,「蟲洞語音助手」於 2012 年 3 月推出第一版,當月就有 40 萬的用戶註冊,產品一炮走紅。而到 2013 年 5 月,蟲洞日活躍用戶度約為 15%,總用戶量接近 1000 萬。

不過,在面對良好發展勢頭的同時,圖靈也注意到了背後潛藏着的隱患。「我們發現就連 Siri 的體驗也都還不夠好。」郭家表示。

據了解,蟲洞語音助手能正確地完成用戶提出的任務和要求,但也不完善,很多時候蟲洞能將連續提出的幾個問題進行關聯,經常只是機械地對每一個問題進行回答,不能區分用於無聊調戲的聊天模式以及正常使用的問答模式。

尚不完善的體驗無法長久地留住用戶。據了解,圖靈本預期 2013 年蟲洞語音助手的用戶將增長到 5000 萬,但實際上在 2014 年 11 月動點科技對其進行報道時,蟲洞的註冊用戶也才只有 3500 萬。顯然,純粹地做語音助手已經不行了或者還不到時候。而圖靈其實早就意識到了這一點,為此,他們在 2014 年開放了蟲洞語音助手的後台接口,讓合作夥伴可以在手機、電視、微信、車載、家居、導航等方面擁有自然語音處理能力,而這便是圖靈機械人。

而由 2C 變成 2B 的舉動也為圖靈帶來了第二春。據郭家介紹,2014 年蟲洞一開放,數據量便開始飆升,「差不多每月增長 1 萬個開發者,1 億多個用戶。」

tuling

大數據促成「中文語境下智能度最高的機械人大腦」

這是圖靈機械人在自己的官網上打出的 Slogan,圖靈竟敢打出這麼一個扎眼的標語,其實並不是標榜自己的技術有多麼好,「現在的人工智能公司最終比拼的其實還是數據,不管是語音識別、語義識別還是視覺識別等算法 95%以上都是開源的,如果某家公司說我算法好,那隻能說他們沒有找到一個會看論文文獻的人。」郭家表示,「大家拼的應該是數據。」

也正是在數據方面的積累使得郭家有信心表示圖靈機械人是「中文語境下智能度最高的機械人大腦」。對此,郭家認為可以從兩方面說明圖靈機械人的「聰明」:

  • 1、準確率,即能否正確回答用戶的問題。我們對比過其他企業的產品,發現我們是最高的。資料顯示,圖靈機械人在語義識別方面的準確率可達 94.7%。
  • 2、趣味度,用戶持續試玩的感受,這方面,我們目前至少排前三。

基於這些,最近圖靈機械人被騰訊選中,被集成到了新版的 QQ 中作為 QQ 群里的聊天機械人,輔助群主運營,「騰訊方面一下子上線幾十萬個群,剛上線最高每秒併發幾萬次,直接讓我們的流量飆升了十多個點。」郭家說到。不過,此次騰訊一共上線了兩款 QQ 群機械人,一款是圖靈機械人,而另一款則是微軟旗下大名鼎鼎的小冰機械人。

而接入中國最大的流量池之一的騰訊 QQ 之後,圖靈方面的對話數據庫顯然也會與其他競爭對手進一步拉開距離。

基於圖靈機械人,打造 Turing OS 機械人操作系統

智能手機的觸屏式交互是對傳統鍵盤式交互的革新,為此,才有了安卓等移動操作系統。而到了人工智能時代,觸摸式交互也開始落伍了,基於語音以及機器視覺等等的多模態交互才是機械人時代的主流交互手段,這是輸入方面的變化;而在輸出方面,機械人時代的輸出也已經不再只是聲音和文字,機械人的肢體動作和表情也將成為輸出的重要部分,新的交互方式決定了 OS 的框架,也意味着安卓等系統不適用於機械人,郭家認為機械人的普及也必須有專門為機械人開發的操作系統的助力。

因此,圖靈在做好主打語義理解的圖靈機械人的同時,還在機械人操作系統方向發力,以期取得更大的價值。據了解,圖靈在機械人的基礎之上整合打包了其他包括語音識別、圖像識別等友商的技術,開發了 Turing OS 機械人操作系統,旨在讓機械人開發更加簡單,開發者只需要安安心心做硬件,而不用專門找人自己開發系統軟件。

另外,郭家認為安卓系統最主要的問題就在於時延。「如果一個機械人要摔倒了,系統必須即時反應,不能有延遲」,所以,Turing OS 機械人操作系統還在 kernal 和 framework 層進行了優化,以達到即時性的要求。

目前,Turing OS 除了在語義識別方面能夠達到 94.7%的準確率以外,人機對話準確率也達到了 88.2%,後者採用情感 TTS 技術,具備 25 種語言情感,包括 468 類情感語言、120 種聲音語調、88 套表情動作,官方宣稱識別準確率達到了 95.1%,可以像人一樣識別和表達情感。

操作系統的競爭是一個巨頭之間的競爭,現在包括阿里巴巴、孫正義旗下的軟銀以及谷歌和微軟都在機械人 OS 上有所發力。面對巨頭,郭家這樣告訴記者,「做 OS 的競爭一定是最頂級的,對我們而言,不要有那麼大的壓力,將自己喜歡做的事情做好就可以了。」

據了解,圖靈目前具有員工 130 餘人。2016 年 1 月,其接受了奧飛動漫 5000 萬元的戰略入股。

題圖來自 123RF


想在手機閱讀更多網絡與創業資訊?下載【香港矽谷】Android應用
分享到Facebook
技術平台: Nasthon Systems