大模型時代,掃描被 Z 世代人群重新定義

..

作者丨郭   思

編輯丨陳彩嫻

2023 年,一場大模型劇場大戲持續上演。

台前,以對話形式出現的ChatGPT成為當前人工智能變革浪潮的佼佼者,「懂語言者得天下」是現今大模型市場顯著的商業現實。幕後, NLP、CV 的發展使得AI的價值被大眾重新挖掘。多模態的發展也讓文圖處理的價值到達了新的高峰,而這其中,以OCR技術為基礎的AI視覺技術也有較為亮眼的表現。

掃描產品無形之中迎來了第二春,此前頻頻登上 Github Trending 日榜月榜的開源項目 PaddleOC 、使用量眾多的Adobe Acrobat DC 等這些其實都是運用AI視覺技術有效解決用戶問題的優秀掃描產品。疫情期間,掃描產品也是為數不多實現逆勢增長的AI落地賽道。

一時間,用戶重新將目光聚焦於掃描產品。才猛然發現,AIGC殺手級應用或許已近在眼前,掃描產品帶來的巨大想象空間讓我們對於AI產品落地充滿着期待。


1、需被重新認識的掃描行業

計算機科學自1950年代起步,在掃描這一特定領域,其技術路徑經歷了從早期的統計模式識別,到句法模式識別、人工神經網絡、支持向量機等不同階段,最終發展至今天的深度學習技術。從使用範圍和功能上而言,如今的掃描產品早已不再局限於大眾眼中傳統的車牌識別等,而是裝進了人們觸手可及的手機里,以智能而實用的APP產品出現。

疫情三年,掃描產品實現逆市增長,IDC數據顯示,2021年我國全年文檔掃描儀出貨量達到46.1萬台,同比疫情相對嚴重的2020年增幅達到了9.7%。在傳統大金融以及政府、教育等主流行業的推動下, 「后疫情」 時代的文檔掃描儀市場迸發出蓬勃生機。國外市場情況也一片大好,Office lens、Google Lens等老牌掃描產品在2022年均有着不錯的月活成績。掃描產品無疑是 AI 落地的一支「潛力股」。

AI 科技評論根據公開資料整理

如此巨大增長的背後,其實是因為掃描這個看似普遍不起眼的行業恰恰切中了AIGC產品落地並得以加速推廣的關鍵要點—C端市場的突破。

這其實也是ChatGPT火爆的邏輯。ChatGPT通過其高度逼真的AI對話能力和對用戶需求的精準理解,成功打破了技術壁壘,使得複雜的AI技術能夠在普通消費者中得到廣泛接納和應用。Similarweb的數據顯示,ChatGPT在上線僅僅兩個月的時間裡,其月活躍用戶數就已經達到了1億人。相比之下,即使是現象級的短視頻應用TikTok達到相同用戶量級也花費了大約9個月的時間。

AI工具必須追求普惠是行業共識。以OCR技術為基礎的AI視覺技術與 ChatGPT 有着相似變革範式,自然也就得到了大家的廣泛關注。而另一方面,經過數十年的技術演變與發展,在攻克數據、格式等問題后,以OCR技術為基礎的AI視覺技術落地與推廣已「瓜熟蒂落」。

Grand View Research的報告指出,隨着深度學習和人工智能技術的進步,AI視覺技術的準確性和效率得到了顯著提升。例如,谷歌的Tesseract OCR引擎在多項測試中取得了接近100%的識別準確率,極大地解決了數據準確性的問題。面對格式這個老大難問題,如今的掃描產品已經能夠處理各種複雜的文檔格式和布局,包括表格、圖像、圖形以及多語言文本等,Adobe Acrobat Pro DC和ABBYY FineReader等主流掃描產品都提供了強大的格式識別和轉換功能。IBM的一項研究也強調隨着企業對自動化和智能化需求的增加,掃描技術在金融、醫療、法律、教育等多個行業中的應用越來越廣泛。

來到AI大模型時代,掃描這一市場再次迎來了新的生機。今年8月,夸克掃描王率先在掃描行業落地大模型技術應用,開啟了AIGC+掃描的創新時代。

數據顯示,加載大模型后,目前夸克掃描王手寫字符識別準確率與複雜公式識別準確率已雙雙達到 99%的行業最高水準。透過夸克掃描王的冰山一角,我們猛然發現,其實如今的掃描產品早已經從單純的硬件設備轉變為集成了先進人工智能技術的多功能生產力效率工具。


2、Z世代人群需要怎樣的生產力工具?

掃描市場其實並不是一個藍海。外有谷歌、微軟等老牌巨頭的長久布局,內有一大批不斷湧現的企業紛紛想分一杯羹。在以往的應用落地中,掃描產品在B端的應用十分之多。然而,在如此激烈的B端市場競爭之下,問題其實早已出現,在某些特定領域或用戶群體中,掃描產品的需求可能已經接近飽和。拿個最簡單的例子便是,在十分常見的企業環境中,許多公司已經實施了文檔管理和流程自動化系統,對於新的掃描產品的需求十分有限。

困境之下,廠商們其實都意識到這個市場其實迫切需要新的突破點來實現新的增長。

在C端發力,是他們想到的最快也是最優的思路。不過儘管在C端產品的發力入局者多,但由於絕大多數廠商習慣於此前賴以生存的B端環境,往往對用戶畫像的把握度不夠,市面上的許多掃描產品在基本功能上仍然存在一定程度的同質化。

如今活躍在C端市場的大多都是90后、00后。電通中國《2022解碼Z世代》指出如今近3億Z世代人群2022年就撬動達5萬億元的消費支出,儼然成為國內市場新的消費增長極。Z世代的群像特徵十分明顯。他們熱衷於尋求理想「人設」,對於自己使用的產品有着更高的個性化需求和品質要求。

他們不僅需要基本的掃描和AI 識別功能,還期望應用能集成其他實用工具,如文檔編輯、格式轉換、雲存儲、協作分享等。這批人也很跳脫,希望在各種場景之下都能使用上掃描產品。期待產品能夠適應不同的環境和需求,如課堂筆記掃描、合同管理、發票報銷等。更為重要的是,他們追求產品能夠真正解決自己的問題。

拿最常見的文檔處理場景而言,當我們拿到一份橫版的發票,需要打印在A4中,進行報銷,這個時候,我們如果不額外設置,就會變成一張小發票居於巨大的A4中上方一側,文字內容縮小,閱讀體驗很差。

而實際上,在這個場景中,我們真正的需求是機器能自動識別文件內容橫豎版式,橫版文件適配到A4紙上,自動適配A4紙張大小,打印出來更適合閱讀。

這個需求非常小,卻很細節,對於眾多用戶來說,是一個忍忍就過去了的痛點。不過對於現在挑剔的Z世代而言,可能第一次遇到后,就直接棄用這個產品了。

那麼市面上有沒有人注意到這個細微而重要的痛點呢,還真有,就是那個被年輕一代經常使用的夸克。在年輕用戶群體的視角中,搜索、閱讀小說、觀看電影、通過拍照識別萬物、進行文檔翻譯、生成簡歷、自拍製作證件照等,夸克都可以做到。

圖註:夸克掃描王可以自動識別文件內容橫豎版式,橫版文件自動適配A4紙張大小。

可以說夸克的天下就是靠這群Z時代撐起來的,天然就有對於年輕一代需求精準把握的基因。8月29日,阿里智能信息事業群宣布搭載AI大模型技術的「夸克掃描王App」正式上線,這意味着夸克從夸克APP中將掃描王單拎出來,推出APP。

國內權威第三方數據機構QuestMobile此前調研顯示,夸克掃描王在00后、90後人群佔比超過54%,穩居行業第一。

推出掃描王APP之後,夸克的第一個動作便是將這些看似不起眼卻十分影響用戶體驗的痛點梳理了一遍。通過場景推動技術,提升年輕人效率。

啟動掃描產品的第一步,就意味着我們需要處理文檔。這簡潔的表述實際上定義了掃描的過程。各品牌對這句話的理解和處理方式揭示了他們的差異。對於夸克來說,即使是「處理」這個詞彙,也蘊含著獨特的思考。大部分掃描產品側重於掃描動作后的文檔定型,而夸克則不同,它認為既然目標是獲得符合需求的文檔,為何不將「處理」環節融入掃描過程呢?

例如,當需要為掃描文件添加濾鏡時,常常會遇到掃描完成後內容無法編輯修改的問題。

為此,夸克掃描王推出了萬能掃描功能。用戶在拍攝文檔后可以直接進行編輯,圖片內容可直接修改,智能識別文件類型並優化濾鏡效果。掃描件上的文字內容、字體樣式可自由編輯修改,同時智能識別表格等內容,支持轉為Excel、刪除、替換和提取圖片。

這樣做帶來的好處很直接,30頁的文檔處理速度比其他產品快了2倍。打開手機應用市場,下載同類軟件,這個功能只有夸克能夠做到。

上文提到的兩個場景是我們日常常見,卻的確會存在困擾的地方。此外,夸克掃描王還具備以下功能:能夠掃描已完成填寫的紙質文檔,並一鍵轉化為Word格式,精準還原原始排版。它能自動識別手寫筆跡,讓用戶選擇刪除或保留手寫字體,並可將其智能轉換為印刷體樣式。用戶還可以在線編輯Word文檔中的文字內容。

在對於表格的處理上,夸克掃描王可以直接拍照紙質表格,一鍵生成Excel表格,手寫數字也能精準識別,Excel表格上直接選擇行列在線求和計數。讓財務黨和會計黨直呼YYDS。


3、結語

掃描是一個有門檻、十分垂直的賽道,其發展與AI技術的不斷迭代息息相關。

但在大部分其他AI產品都能達到95分的技術水平之際,掃描產品的殺出重圍並不僅僅是在於從95到96的死磕前進,更多的是在於將目光投至切實的生產力場景。

AI時代,每個技術的發展周期和特性都各不相同,必須兼顧技術和市場的兩端動態。

一方面,需要明確了解技術的局限性和邊界在哪裡,以便精準定位研發方向。另一方面,在推動技術商業化或產品化的過程中,也必須把握好節奏和優先級,確定何時以及如何將這些技術有效地轉化為實際產品或服務。

這就要求廠商在探索技術創新的同時,也要對市場趨勢和用戶需求有深入的理解和敏銳的洞察。真正把提高生產力效率作為第一要義。

過去的三年疫情,掃描行業能夠在寒冬中逆襲,也是源於其對生產力切實的效率提升。

如今來到大模型時代,夸克掃描王,在這場角逐之中,恰恰選了一條最精準也是最合適的道路,以用戶為先,用場景倒推技術。改進行業難以解決的20%難題,收穫80%的效果。才得以讓這次AIGC殺手級應用之戰開始有了新的風向。

隨着大模型競爭步入下半場,AIGC應用的潛在爆發點還有哪些尚待探索?本文作者持續追蹤大模型領域的最新進展,歡迎讀者通過添加作者微信lionceau2046 進行深度交流與探討。


雷峰網 雷峰網 雷峰網



想在手機閱讀更多電腦與科技資訊?下載【香港矽谷】Android應用
分享到Facebook
技術平台: Nasthon Systems