不知道大家有沒有發現,這年頭,連輸入法都越來越難用。
它不是完完全全的不好用,而是暗搓搓有意識的難用,就像是似乎明明知道你想打什么字,可偏偏跟你對著干,故意針對你。
最普遍的就是常用字離奇失蹤,比如“是”字,經常會被“事”擠到了首位;你明明想打“難用”,結果首選字卻是“男用”。
不僅常用字拿不到優先級,詞語解析也經常錯得匪夷所思。
想打"從右到左",它給你蹦出來"蔥油刀座";程序員想輸入一個“Python”,結果出來的是“屁眼通紅”(下面的案例我們做了二次處理,原圖在網上都可以找到);
想打個"毅力",首選是"伊利",這還引得不少人覺得這是在夾帶私貨。
![]()
成語和古詩詞的聯想能力也斷崖式下滑,敲下“ypzyflbylh”,以前能完美識別出“有朋自遠方來不亦樂乎”,可現在,它愣是能給你整出“油潑辣子衣服”;
想輸入“偏我來時不逢春”,結果被識別成“騙我老師不豐唇”???
還有的時候,你打了一個詞,下意識按了確認,一看,選錯了,你要的字在第二個。
于是你重新打一遍,這次學乖了,直接按2,結果輸入法也預判了你的預判,把你上次誤選的那個詞頂到了第二位,正確的字反而回到了第一個。
你以為這是安卓第三方輸入法獨有的問題?那蘋果黨就高興得太早了。
比如輸入 woyebuzhidao,你覺得首選應該是"我也不知道"對吧?不好意思,它給你的是"玩噢也不織大啊噢";輸入 nidaodizaiganshenme,首選是"你大噢遞大噢肝什么"。
![]()
玩噢也不織大啊噢蘋果大噢遞大噢肝什么!!!
我們去看了下,類似關于輸入法降智吐槽,可以說是江湖上傳聞已久的"鬼故事"了。
只是到了如今這年頭,一遇到這種"反向智能"的事兒,大伙兒已經開始習慣性地就把鍋甩給 AI 了。
但實際上,這鍋還真不能全讓 AI 背。
今年 1 月,搜狗就專門給 AI 解釋過,他們表示輸入法的核心底座是對拼音串、詞和用途的理解,AI 不會污染這些環節,官方甚至還說,我們輸入法壓根沒變笨呀。
根據后臺數據顯示,打字準確率是在逐年緩慢提升的,這可和大家的感覺不太一樣。
其實就是兩者對于準確的定義不一樣,在輸入法工程師這邊,只要目標詞出現在候選框前五,就算輸入成功;但對用戶來說,第一下出來的不是想要的詞,這輸入法就是個智障。
那既然不是 AI 的鍋,那到底是為什么?
第一個就是,互聯網語料大爆炸,導致數據被嚴重污染。
輸入法到底是怎么知道你想打什么字的?
![]()
但現在可不一樣了,電競圈、二次元、飯圈、短視頻等等市場,每天都在以指數級的速度創造和拋棄海量詞匯。
輸入法的詞庫為了滿足這些人的需求,就得不斷擴容語料來源。
為了覆蓋這些新詞,廠商不得不大規模引入電商搜索日志、短視頻評論區等口語語料。
數據量上去了,質量卻跌沒了。
![]()
當然了,污染更狠的可能還是用戶自己,不少人打字時并沒那么嚴謹,大量拼音半吊子打出的錯別字,消息也照發不誤,比如句末語氣詞“呀”經常被打成“壓”或“亞”,就問誰還沒被自家爸媽的錯別字整懵過?
也有一些人,因為平臺審核嚴苛,故意用錯字來避嫌(比如播播間之類的詞語),也在進一步污染輸入法的詞庫。
![]()
諷刺的是,這些情況的發生,并不是輸入法變笨了,而是它們變聰明付出的代價。
很多吐槽輸入法的帖子里,總有人在懷念功能機時代,那時候拿個小靈通回消息都能揣口袋里盲打,所以不少人覺得那才是高明。
但說實話,當時大家能覺得好用,恰恰是因為輸入法太笨了,一個鍵對應三四個字母,詞庫固定得死死的,聯想功能約等于沒有。
這么一來,字詞排序永遠固定,你打到某個階段,哪個字出現在第幾個位置,是確定的。
![]()
用久了,手指會形成肌肉記憶,按幾下確認鍵、往下翻幾格,全是自動化操作,它的好用完全是人在適應工具。
現在的輸入法變聰明了,它要主動學習你、預測你、適應你,結果因為詞頻不斷改變,候選字的位置也是動態的,昨天第一個字還是"是",結果今天就變成了"事",用戶根本來不及形成肌肉記憶,從而進一步加深了不好用的印象。
而且,還有個不能忽視的原因,擱以前換手機啥的,登錄賬號,詞庫就跟著走。用了多少年的輸入習慣,完全不會丟,而這有一部分靠的是激進的數據收集和云端同步。
但這幾年,《個人信息保護法》、《數據安全法》相繼落地執行,輸入法廠商在數據采集上被迫全面收縮。
![]()
云端詞庫同步不一定是默認開啟的,必須用戶主動綁定賬戶、主動授權,不少人換一個設備就得從頭訓練輸入法,自然也就覺得不好用了。
那這么說廠商就全沒鍋了嗎?那倒也未必。
因為搜狗、訊飛、百度三家占了第三方手機輸入法 96% 的市場份額,整個市場就像一灘死水。
你去看看搜狗、訊飛、百度,長久以來的更新公告基本就是"修復已知 bug",QQ 輸入法上次 PC 端有實質性更新還要追溯好幾年前了。
![]()
那他們的重心就改到了皮膚、廣告、添加亂七八糟的新功能上了,誰還費勁巴拉卷輸入準確率呢?
而且移動互聯網浪潮后,PC 端輸入法的冷落已經到了廠商自己都得承認的地步了,搜狗就說過電腦端的更新速度遠慢于手機 APP 端。
可真正對輸入法需求高的場景,反而就是在 PC 端,在這些時候遇到的輸入法錯誤,會被放大成對整個輸入法品牌變笨了的整體印象。
說了這么多輸入法的罪狀,是不是有點絕望了?但別急,事情已經有了轉機了。
![]()
前面說了輸入法變難用不能怪 AI,實際上不僅不能怪 AI,輸入法想要迎來質的飛躍,最后還得靠 AI。
這里說的 AI 不是那些什么“幫寫”“幫你高情商回復”“一鍵聯想搜索”這些花里胡哨的功能,而是實實在在利用大模型的能力,提升輸入法的水平。
還記得我們前面說的,輸入法到底最應該做的,就是擁有人類一樣的思維,猜你想說什么、想表達什么。
巧了,這尼瑪不就是 AI 大模型的工作原理嗎?
![]()
隨后,豆包輸入法也沒有在鍵盤打字層面和老牌輸入法硬卷功能,它們直接用字節自家的 Seed-ASR 語音識別模型做了個降維打擊。
這個模型在公開測試集上的錯誤率,相比國內同類模型最高可降低約四成。
![]()
過去二十年,輸入法從一個純粹的打字工具,變成了一個廣告容器、一個功能大雜燴、一個被隱私法規束縛住手腳的數據孤島,互聯網語料爆炸污染了它的詞庫,商業化過度掏空了它的內核,舊技術架構走到了盡頭。
而是安安靜靜地待在屏幕下方,把你的肌肉記憶還給你。
當它真正做到讓你不需要低頭看候選詞的那一天,那個好用的輸入法,才算真正回來了。
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.