背靠烽火科技,烽火普天Image Q通過大數據語義分析推動集團革新

.. 烽火普天/Image Q是武漢烽火科技集團內部孵化的項目,核心是一個大數據語義分析平台,分為數據採集平台、數據治理平台、數據挖掘平台、智能應用平台和可視化平台5個模塊。之前多應用在輿情監控、商情監控、媒體熱點追蹤等場景中。

「但在輿情、媒體的場景中,只要知道事情發生即可,並不需要很細顆粒度理解到每句話、每個詞的含義,也就是說,把語義分析應用在媒體行業中,有些『大材小用』,」Image Q CTO金勇如是說,在過去的基礎上,Image Q開始向那些需要深度挖掘和細力度理解的領域拓展。

比如,公安行業就是一個很好的應用領域。案件由大量文字描述而成,為了獲取200字的線索關鍵詞,不得不檢閱五六千字的案卷內容,不僅費時,還會對辦案人員造成干擾。Image Q的解決方案是,先從過去的案件語料中提取語義要素,然後進行關聯(比如在「手機專賣店」偷東西和「通信廣場」偷東西是可關聯的),再進行深度挖掘便可應用在刑偵情報中,比如案件串並、線索發現、發現嫌疑人等。

再比如,金融行業的年報裡面有各類指標,Image Q可以提取出來,進行結構化處理,相互組合后形成新的企業要素,是一種高效獲取商業情報的方法。

總結下來,Image Q就是應用在擁有大量文本分析需求的領域裡,把非結構化數據結構化,提高人工閱讀分析的效率。當然,行業、場景不同,所需要的模型也不同,Image Q要根據場景建立不同的模型,並通過詞庫、規則庫、知識庫,進行重新訓練和調整。過程中所需的數據,要麼是公開採集,要麼是企業授權。

不過,中國人說話講究語境,同一個詞在上下文中表達的意思可能不同,對此,金勇解釋,跟情感類文本不一樣,Image Q所應用的場景都是嚴肅文本,在陳述事實的情況下,上下文關聯不多。

以及,在不同的垂直賽道上,都有玩家在做,拿公安行業來說,36氪此前報道的明略、海雲也在布局,金勇告知:「競標的時候確實遇到過,目前看來競爭不是很明顯。他們多是以人為主,分析關聯關係,很多是用在找到嫌疑人後的抓捕過程,Image Q是以事、案件為主,多用在案件合併、案件聯想等。他們更側重平台,集成很多環節,我們只做挖掘一環,數據很樂意對其開放。」

據悉,Image Q是按項目制收費,根據數據量和深度來判斷,客單價在百萬級別。項目周期通常在半年以上,短期情況3-6個月也可以出效果,但實際上,企業的挖掘深度和廣度需求是在不斷拓展的。在公安行業,主要是對大量筆錄進行數據挖掘,目前已和江蘇省等6家公安系統達成合作。

值得一提的是,武漢烽火集團年營收在500多億元,烽火普天/Image Q建立的初衷就是幫助集團在大數據、人工智能方面進行轉型,從一定程度上,也會依託母集團的實力和銷售渠道。

目前,ImageQ團隊有70多人,平均學歷碩士以上。CEO金俏是哈爾濱理工大學計算機及應用學士,武漢大學工商管理碩士研究生,長期致力於信息技術及應用專業工作。首席數據科學家胡華是武漢大學信息管理學院情報學博士,美國亞利桑那大學人工智能實驗室項目組成員。CTO金勇是加拿大新布倫瑞克大學計算機科學博士,曾就職於加拿大國家研究院從事相似度分析以及深度信念網絡等相關研究。首席架構師杜魯擁有9年Java從業經驗,曾負責Bank Mandiri和中國建設銀行等系統研發項目。

公司已經獨立運營,在2016年12月獲得過2700萬A輪融資,由湖北高投資本經營有限公司和武漢高投金運激光產業投資基金。已經啟動下一輪融資。







想在手機閱讀更多程式設計資訊?下載【香港矽谷】Android應用
分享到Facebook
技術平台: Nasthon Systems