代碼面開 AI,不是開卷考
今天鴨鴨刷到一條挺有意思的招聘新聞。
外媒 Business Insider 報道稱,谷歌內(nèi)部文件顯示,從今年下半年起,計劃在軟件工程師招聘的“代碼理解”面試環(huán)節(jié),允許候選人使用谷歌官方認(rèn)證的 AI 助手;試點階段將統(tǒng)一使用自研模型 Gemini。谷歌發(fā)言人向媒體證實了這一安排。
![]()
報道里寫得很具體:候選人要在現(xiàn)有代碼庫里做閱讀、排錯和優(yōu)化;面試官會重點看“AI 應(yīng)用熟練度”,包括提示詞工程、對 AI 輸出結(jié)果的核驗,以及調(diào)試能力。谷歌把整套新流程定調(diào)為“人為主導(dǎo)、AI 輔助”,說是想更貼近生成式 AI 時代工程師的真實工作狀態(tài)。
試點會先落在美國部分團隊,面向初、中級崗位,谷歌云以及平臺與設(shè)備等業(yè)務(wù)線會先試。如果跑得順,再擴到更多業(yè)務(wù)和地區(qū)。
嗯,讀到這兒很多人第一反應(yīng)可能是:那不就是開卷嗎。
但鴨鴨想先把話說在前面:
允許帶 Gemini 進考場,不等于題目變簡單。它更像把考場從“默寫語法”挪到“帶一個會瞎編的實習(xí)生一起干活”。你不會驗,他寫得越快,你死得越快。
為啥鴨鴨會這么看?
第一,代碼理解本來就不是比誰敲得快。陌生倉庫里找 bug、理調(diào)用鏈、判斷一次改動會不會牽一發(fā)而動全身,這些活以前靠手寫思路;現(xiàn)在多了一條:你得判斷 AI 給你的“捷徑”是不是在抄近道抄進溝里。
第二,報道里提到的考核點,其實是在把工程師拆成兩半。一半是“會不會指揮 AI”,提示詞怎么寫、上下文怎么給、約束怎么說清楚;另一半是“敢不敢簽字”,AI 改完你敢不敢說這版能合、能發(fā)、能背鍋。缺一半,面試?yán)锒紩娥W。
第三,這事不是谷歌一家自嗨。報道里還提到,澳大利亞公司 Canva 早在 2025 年 6 月就要求相關(guān)崗位候選人在技術(shù)面試?yán)锉仨氂?Copilot、Cursor 或 Claude 這類工具。美國 AI 編程公司 Cognition 也對 Business Insider 表示,已經(jīng)把 AI 使用納入面試流程,還把“面試禁用 AI”比作“讓孩子不帶計算器參加數(shù)學(xué)考試”。行業(yè)方向很直白:以后默認(rèn)工作流里就有 AI,面試還在假裝沒有 AI,反而失真。
第四,皮查伊在 2026 年 4 月 22 日谷歌 Cloud Next 活動上說過,谷歌內(nèi)部約 75% 的新代碼由 AI 生成。這個數(shù)字不是用來嚇唬人的,是用來解釋公司為什么要改面試題。公司真正想問的是:當(dāng) AI 能吐出海量代碼時,你還剩下什么不可替代的判斷力。
那這事兒對正在準(zhǔn)備面試的人意味著啥?
鴨鴨說幾句實在話。
別把“會用 AI”理解成“會點生成”:面試?yán)锔靛X的是你怎么拆問題、怎么限定 AI 的發(fā)揮范圍、怎么對輸出做對照驗證。會點生成的人一抓一把,敢驗收的人不多。
刻意練“讀陌生代碼 + 小步驗證”:給自己找一段不熟悉的開源模塊,先用 AI 生成三種改法,再逐條對照測試用例、邊界條件和性能影響。練的是肌肉記憶,不是 prompt 玄學(xué)。
準(zhǔn)備一兩個“AI 翻過車”的真實例子:面試?yán)锬苤v清楚你怎么發(fā)現(xiàn) AI 給的建議不靠譜、你怎么糾偏,比背八股更像高級工程師。
心態(tài)上把它當(dāng)成開卷里的閉卷:卷子是開的,評分標(biāo)準(zhǔn)沒開。公司要的是你能不能把 AI 的產(chǎn)出變成可上線的結(jié)果。
大家怎么看?如果國內(nèi)大廠跟進“代碼理解環(huán)節(jié)允許官方 AI”,你覺得公平嗎,還是更卷了?歡迎評論區(qū)聊聊~
今天鴨鴨和大家分享一道 AI大模型面試題。
【什么是大模型微調(diào)?與預(yù)訓(xùn)練的核心區(qū)別是什么?】
回答重點
大模型微調(diào)就是在預(yù)訓(xùn)練模型的基礎(chǔ)上,用特定任務(wù)的數(shù)據(jù)對模型做二次訓(xùn)練,讓它從"通才"變成某個領(lǐng)域的"專家"。
跟預(yù)訓(xùn)練的核心區(qū)別有三點:
1)目標(biāo)不同。預(yù)訓(xùn)練是讓模型學(xué)通用的語言理解能力,在幾百 GB 甚至幾 TB 的通用語料上訓(xùn)練,比如維基百科、書籍、網(wǎng)頁。微調(diào)是讓模型適應(yīng)特定任務(wù),比如情感分析、代碼生成、醫(yī)療問答,用的是跟任務(wù)相關(guān)的小規(guī)模標(biāo)注數(shù)據(jù)
2)數(shù)據(jù)規(guī)模差異大。預(yù)訓(xùn)練動輒用幾萬億 token 的數(shù)據(jù),訓(xùn)練成本是幾百萬甚至上千萬美元。微調(diào)可能只需要幾千到幾十萬條標(biāo)注樣本,幾張 A100 跑幾個小時就能搞定
3)學(xué)習(xí)方式不同。預(yù)訓(xùn)練主要是自監(jiān)督學(xué)習(xí),讓模型預(yù)測下一個 token 或者還原被遮蓋的詞,不需要人工標(biāo)注。微調(diào)通常是監(jiān)督學(xué)習(xí),需要輸入輸出配對的標(biāo)注數(shù)據(jù)
![]()
擴展知識為什么需要微調(diào)
預(yù)訓(xùn)練模型雖然能力強,但它學(xué)的是通用知識,面對特定場景還是差點意思。比如用 GPT 直接做法律合同審查,它可能連行業(yè)術(shù)語都理解不準(zhǔn);用它做客服問答,回復(fù)風(fēng)格可能跟公司調(diào)性對不上。
![]()
微調(diào)就是一個性價比極高的中間方案,不用從零開始訓(xùn)練,也不用忍受通用模型在特定場景的平庸表現(xiàn)。
主流微調(diào)策略
1)全參數(shù)微調(diào),把模型所有參數(shù)都拿出來重新訓(xùn)練。效果最好,但成本也最高。一個 70B 參數(shù)的模型,光加載到 GPU 就需要 140GB 顯存,還得額外留空間存梯度和優(yōu)化器狀態(tài),沒有幾十張頂級顯卡根本跑不動
2)部分參數(shù)微調(diào),凍結(jié)大部分層,只訓(xùn)練最后幾層或者特定模塊。減少了計算量,但效果往往不如全參數(shù)微調(diào)
3)參數(shù)高效微調(diào) PEFT,這是現(xiàn)在的主流做法。核心思路是往原模型里插入少量可訓(xùn)練參數(shù),原模型參數(shù)全部凍結(jié)。LoRA是最流行的一種,它在 attention 層的權(quán)重矩陣旁邊加兩個低秩矩陣,訓(xùn)練時只更新這兩個小矩陣。一個 7B 的模型用 LoRA 微調(diào),可訓(xùn)練參數(shù)可能只有幾百萬,顯存占用直接降一個數(shù)量級
LoRA 的原理
LoRA 基于一個假設(shè):微調(diào)時權(quán)重的變化量是低秩的,不需要更新整個大矩陣。
原本要更新的權(quán)重矩陣 W 是 d×d 的,比如 4096×4096,有 1600 多萬參數(shù)。LoRA 把變化量分解成兩個小矩陣 A 和 B 的乘積,A 是 d×r,B 是 r×d,r 一般取 8 或 16。這樣可訓(xùn)練參數(shù)從 d2 降到 2dr,壓縮了幾百倍。
推理時把 LoRA 矩陣合并回原權(quán)重,不增加任何推理延遲。而且可以給同一個基座模型掛不同的 LoRA 權(quán)重,實現(xiàn)多任務(wù)切換。
微調(diào)數(shù)據(jù)的質(zhì)量比數(shù)量重要
搞微調(diào)最容易踩的坑就是迷信數(shù)據(jù)量。其實幾千條高質(zhì)量數(shù)據(jù)的效果往往比幾萬條噪聲數(shù)據(jù)好。Alpaca 當(dāng)年只用了 52000 條數(shù)據(jù)就把 LLaMA 調(diào)成了能聊天的模型。
高質(zhì)量數(shù)據(jù)的標(biāo)準(zhǔn):指令清晰、回答準(zhǔn)確、覆蓋多樣場景、格式一致。與其花時間爬更多數(shù)據(jù),不如花時間清洗和篩選已有數(shù)據(jù)。
篇幅有限,完整答案可以點擊下方小程序進行查閱:
我們精選了近兩年的高頻面試真題,已經(jīng)有 10000 多道面試題目啦,由大廠資深面試官手寫答案,押題命中率超高!
不僅有傳統(tǒng)八股文,場景題、項目題、系統(tǒng)設(shè)計題等等應(yīng)有盡有,還在不斷更新中!
目前優(yōu)惠最低特價 129 元即永久(限時上架)暢看所有面試題和答案,正式運營價格為 399+,不要錯過這次優(yōu)惠哈!
且,現(xiàn)在邀請好友注冊并成為會員,還可獲得 10% 的分傭!詳情見面試鴨拉新邀請有賞規(guī)則(網(wǎng)頁版面試鴨點擊頭像查看)
![]()
網(wǎng)頁端網(wǎng)址:www.mianshiya.com
![]()
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.