你有沒有想過,為什么對著手機(jī)說“嘿,助手”,只有你自己的手機(jī)會(huì)響應(yīng),而旁邊朋友喊同樣的話,你的手機(jī)卻毫無反應(yīng)?更神奇的是,哪怕別人模仿你的語調(diào)大喊大叫,你的手機(jī)依然“裝睡”,只有當(dāng)你親口說出那句喚醒詞,它才立刻亮起屏幕。這背后的秘密,就在于手機(jī)里藏著一個(gè)專屬的“聲音身份證”。
![]()
手機(jī)語音助手之所以只認(rèn)你的聲音,核心依靠的是一套叫做“聲紋識(shí)別”的技術(shù)。每個(gè)人的聲音就像指紋一樣,是獨(dú)一無二的。聲音的形狀由聲帶、喉嚨、口腔和鼻腔的結(jié)構(gòu)共同決定。哪怕兩個(gè)人念同一個(gè)字,聲音里包含的諧波分量、頻率分布、節(jié)奏快慢等細(xì)微特征都完全不同。當(dāng)你第一次設(shè)置語音助手時(shí),手機(jī)會(huì)讓你反復(fù)念幾遍喚醒詞。這個(gè)過程就像在給聲音建檔案——它會(huì)把你的聲音拆解成上百個(gè)數(shù)字特征點(diǎn),組合成一個(gè)固定的聲紋模板。
在實(shí)際使用中,當(dāng)你喊出喚醒詞時(shí),手機(jī)的第一步是檢測聲音里有沒有類似“嘿,助手”的音節(jié)模式。如果連基本音節(jié)都對不上,手機(jī)會(huì)直接忽略。一旦音節(jié)匹配上了,它就會(huì)立刻進(jìn)入更嚴(yán)格的聲紋比對環(huán)節(jié):把這段聲音里的聲紋特征,提取出來與你之前錄入的聲紋模板進(jìn)行比對。只有相似度超過嚴(yán)格閾值的時(shí)候,手機(jī)才會(huì)判定是機(jī)主本人在說話,從而響應(yīng)你的指令。如果聲紋對不上,哪怕音節(jié)念得再標(biāo)準(zhǔn),手機(jī)也會(huì)判定是無效聲音。
![]()
這套機(jī)制也解釋了為什么別人很難欺騙你的手機(jī)。錄制你的聲音去播放,手機(jī)可能會(huì)識(shí)別失敗,因?yàn)閾P(yáng)聲器放出的聲音經(jīng)過了電聲轉(zhuǎn)換,很多微妙的聲紋細(xì)節(jié)已經(jīng)丟失了。哪怕用高保真設(shè)備錄制,手機(jī)內(nèi)部的抗欺詐算法也能檢測出活體聲音與錄音回放之間的差異。更不用說模仿了,因?yàn)槊總€(gè)人的生理結(jié)構(gòu)不同,模仿只能改變表面的音色和語調(diào),卻無法改變深層的聲紋特征。
不過,聲紋識(shí)別并非完美的技術(shù)。當(dāng)你感冒、喉嚨發(fā)炎或者剛睡醒時(shí),聲音會(huì)發(fā)生變化,這時(shí)候手機(jī)有時(shí)會(huì)認(rèn)不出你。一些高端手機(jī)會(huì)加入自適應(yīng)算法,能根據(jù)你的聲音隨時(shí)間緩慢變化的情況逐步更新聲紋模板,從而提高長期使用的穩(wěn)定性。但即便如此,為了保障設(shè)備的整體安全性,手機(jī)通常不會(huì)把聲紋作為唯一解鎖方式,而是配合密碼或面部識(shí)別一起使用。
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.