![]()
TacticGen想做的,不只是“看懂一段比賽”,而是“生成一套可供比較的戰(zhàn)術(shù)跑位方案”。
過去的足球 AI 更擅長(zhǎng)回答一個(gè)問題:這球接下來大概率會(huì)怎么發(fā)展? 例如誰更可能接球、一次進(jìn)攻是否會(huì)形成射門、球員接下來會(huì)怎么跑。
但真正走進(jìn)教練組的工作流,會(huì)發(fā)現(xiàn)他們關(guān)心的往往不只是“預(yù)測(cè)結(jié)果”,而是另一個(gè)更主動(dòng)的問題:如果我們希望拉開寬度、加強(qiáng)前場(chǎng)壓迫、占領(lǐng)肋部空間,球員接下來應(yīng)該怎么跑?
這正是香港中文大學(xué)(深圳)劉桂良教授團(tuán)隊(duì)聯(lián)合Real Analytics、伯明翰城足球俱樂部、利物浦大學(xué)、西蒙菲莎大學(xué)以及中山大學(xué)提出的 TacticGen 想要解決的問題。
更直白一點(diǎn)說,TacticGen想做的,不只是“看懂一段比賽”,而是“生成一套可供比較的戰(zhàn)術(shù)跑位方案”。
![]()
項(xiàng)目鏈接:https://shengxu.net/TacticGen/
第一作者:徐圣,香港中文大學(xué)(深圳)博士生,研究方向?yàn)閺?qiáng)化學(xué)習(xí)及其在具身智能、體育分析的應(yīng)用,曾在 ICLR,ICML,NeurIPS 等頂級(jí)會(huì)議以第一作者發(fā)表論文。
通訊作者:劉桂良,香港中文大學(xué)(深圳)助理教授,研究主要聚焦于具身智能決策與強(qiáng)化學(xué)習(xí)。在包括NeurIPS、ICML、ICLR在內(nèi)的國際機(jī)器學(xué)習(xí)頂級(jí)學(xué)術(shù)會(huì)議和期刊上發(fā)表論文30余篇,擔(dān)任NeurIPS、ICLR領(lǐng)域主席。
01
這篇論文到底在解決什么問題?
過去幾年,足球 AI 已經(jīng)能比較穩(wěn)定地處理軌跡預(yù)測(cè)任務(wù):給定過去一小段時(shí)間的場(chǎng)上狀態(tài),預(yù)測(cè)接下來幾秒球員和皮球會(huì)如何移動(dòng)。
但真正的戰(zhàn)術(shù)分析,往往不止于“接下來大概率會(huì)發(fā)生什么”,還會(huì)追問:
如果邊鋒拉得更開一點(diǎn),會(huì)不會(huì)把對(duì)手邊后衛(wèi)和中衛(wèi)之間的間距撕出來?
如果中場(chǎng)在球側(cè)形成更好的接應(yīng)三角,持球人會(huì)不會(huì)多一個(gè)向前傳遞線路?
如果防守方更快形成向球側(cè)收縮,是否能更早封鎖肋部和中路通道?
TacticGen 正是把這個(gè)問題向前推進(jìn)了一步。它把戰(zhàn)術(shù)理解為一段目標(biāo)驅(qū)動(dòng)的多智能體未來軌跡:輸入當(dāng)前比賽上下文,給定一個(gè)戰(zhàn)術(shù)目標(biāo),生成滿足該目標(biāo)的后續(xù)跑位方案。也就是說,它不是只復(fù)現(xiàn)真實(shí)比賽里已經(jīng)發(fā)生的移動(dòng),而是可以圍繞明確的戰(zhàn)術(shù)目標(biāo),生成“另一種可能更優(yōu)的跑法”。
這讓足球 AI 的角色發(fā)生了變化。它不再只是賽后分析復(fù)盤工具,而開始接近一個(gè)可交互的戰(zhàn)術(shù)反事實(shí)推演系統(tǒng)。
圖1|研究動(dòng)機(jī):從“軌跡預(yù)測(cè)”走向“目標(biāo)驅(qū)動(dòng)的戰(zhàn)術(shù)軌跡生成”
![]()
這張圖其實(shí)把整篇論文的立意講得很清楚。
左上部分代表傳統(tǒng)方法,重點(diǎn)是估計(jì)“比賽接下來會(huì)怎么發(fā)展”;右上部分則轉(zhuǎn)向generative football tactic design,開始回答“圍繞某個(gè)戰(zhàn)術(shù)目標(biāo),球隊(duì)接下來應(yīng)該怎么跑”。圖里給出的Stretch Play、Zone 14、Deep Defending和Press Carrier,本質(zhì)上都在說明一件事:模型處理的不是抽象標(biāo)簽,而是可以被明確引導(dǎo)的攻防跑位目標(biāo)。
中間和下方則進(jìn)一步概括了這篇論文的關(guān)鍵詞:給定場(chǎng)景條件+用戶目標(biāo),生成可控的多智能體軌跡,并同時(shí)強(qiáng)調(diào)Accuracy、Adaptability、Scalability和Utility。換句話說,這篇工作不只關(guān)心“像不像”,還關(guān)心“能不能被引導(dǎo)”“能不能隨著模型和數(shù)據(jù)規(guī)模繼續(xù)提升”,以及“對(duì)真實(shí)戰(zhàn)術(shù)決策有沒有用”。
02
TacticGen 是怎么做的?
從任務(wù)定義上看,TacticGen 始終圍繞“未來軌跡”展開。
輸入端,模型接收的是比賽上下文,包括球和 22 名球員的一段歷史軌跡、事件類型、時(shí)間信息、比分信息,以及其他反映局勢(shì)的條件;
輸出端,模型要么預(yù)測(cè)后續(xù)的球員與足球軌跡,要么在給定目標(biāo)約束下生成新的球員協(xié)同移動(dòng)軌跡。
論文里給了兩個(gè)實(shí)際工作模式。
TacticGen-Predictive 更接近短時(shí)窗軌跡預(yù)測(cè):根據(jù)最近的場(chǎng)上觀測(cè),預(yù)測(cè)接下來一段時(shí)間的真實(shí)發(fā)展,用于軌跡建模和基準(zhǔn)評(píng)測(cè)。
TacticGen-Conditional 則更接近戰(zhàn)術(shù)生成:當(dāng)皮球未來線路被給定或較強(qiáng)約束時(shí),模型圍繞這條球路去生成更可控的球員移動(dòng)方案。這個(gè)設(shè)定尤其適合 what-if 式的戰(zhàn)術(shù)推演,因?yàn)榉治鰩熁蚪叹毥M往往會(huì)先鎖定一個(gè)傳球或推進(jìn)意圖,再去討論無球隊(duì)員怎樣跑位最合理。
圖2|整體框架:一個(gè)能被目標(biāo)引導(dǎo)的多智能體擴(kuò)散生成器
![]()
這張圖可以分成“訓(xùn)練”和“推理”兩部分來看。
上半部分是基于 Diffusion 的訓(xùn)練階段:模型從帶噪的未來軌跡中學(xué)習(xí)還原真實(shí)軌跡,而且不是逐個(gè)球員孤立建模,而是把球和 22 名球員放進(jìn)同一個(gè)多智能體框架里聯(lián)合學(xué)習(xí)。
下半部分是推理階段,也是它最像“戰(zhàn)術(shù)工具”的地方:同一個(gè)生成器可以在不重訓(xùn)的情況下,被規(guī)則、自然語言或價(jià)值模型引導(dǎo),生成服務(wù)于不同戰(zhàn)術(shù)目標(biāo)的軌跡方案。
03
數(shù)據(jù)集為什么值得強(qiáng)調(diào)?
這篇工作很重要的一點(diǎn),是它不是靠少量數(shù)據(jù)集和 demo 支撐起來的。
論文背后使用的是一個(gè)大規(guī)模、對(duì)齊后的足球數(shù)據(jù)集,覆蓋2018到 2025年的 1,432場(chǎng)比賽,包含3,374,599個(gè)對(duì)齊后的事件,以及97,760,895個(gè)處理后的 tracking frames。
這套數(shù)據(jù)把兩類關(guān)鍵數(shù)據(jù)對(duì)齊在一起:一類是類似 Opta 風(fēng)格的 analyst-annotated event logs,也就是人工標(biāo)注的比賽事件流;另一類是 full-pitch optical tracking,也就是整片球場(chǎng)范圍內(nèi)對(duì)皮球和全部球員位置的連續(xù)跟蹤數(shù)據(jù)。
論文把事件流和 tracking 流連接成統(tǒng)一的訓(xùn)練樣本。這樣,模型看到的就不只是“某個(gè)時(shí)刻誰在什么位置”,而是“某個(gè)戰(zhàn)術(shù)事件發(fā)生時(shí),前后這一整段局勢(shì)是如何演化的”。
從聯(lián)賽覆蓋看,數(shù)據(jù)主體來自高水平職業(yè)賽事,其中包括:英超、英冠、MLS、荷甲等多個(gè)聯(lián)賽。
為了讓建模更穩(wěn)定,tracking 數(shù)據(jù)坐標(biāo)統(tǒng)一映射到 105×68 米標(biāo)準(zhǔn)球場(chǎng),并把進(jìn)攻方向標(biāo)準(zhǔn)化為統(tǒng)一朝右。對(duì)機(jī)器學(xué)習(xí)來說,這一步很關(guān)鍵,因?yàn)樗巡煌荣悺⒉煌瑘?chǎng)地、不同鏡頭體系下的數(shù)據(jù),整理成了可比較、可學(xué)習(xí)的統(tǒng)一戰(zhàn)術(shù)坐標(biāo)系。
04
真正讓人眼前一亮的,
是它可以被“戰(zhàn)術(shù)意圖”直接引導(dǎo)
很多生成模型的強(qiáng)項(xiàng),是生成與真實(shí)數(shù)據(jù)分布相似的結(jié)果。但 TacticGen 更進(jìn)一步,它追求的不是單純“生成得像”,而是“圍繞明確戰(zhàn)術(shù)目標(biāo)生成得有用”。
更關(guān)鍵的是,這種能力并不是靠在訓(xùn)練階段額外注入戰(zhàn)術(shù)條件來實(shí)現(xiàn)的。因?yàn)檫@類做法在推理時(shí)往往只能處理有限的條件,本質(zhì)上仍然是在已有數(shù)據(jù)分布內(nèi)做條件擬合。TacticGen 采用的是 test-time guidance:在推理階段直接把生成軌跡朝目標(biāo)方向引導(dǎo),因此同一個(gè)預(yù)訓(xùn)練生成器就能靈活服務(wù)于不同戰(zhàn)術(shù)意圖。論文給出了三種具體的引導(dǎo)方式。
▎規(guī)則引導(dǎo):把戰(zhàn)術(shù)原則轉(zhuǎn)成可執(zhí)行跑位
第一種是規(guī)則引導(dǎo)。你可以直接寫出希望球隊(duì)滿足的戰(zhàn)術(shù)原則,例如:對(duì)進(jìn)攻方來說,可以支援持球人、保持寬度、創(chuàng)造傳球線路、占領(lǐng)Zone 14或右側(cè)半空間;對(duì)防守方來說,可以更快壓迫、向球側(cè)收縮、壓縮中路與傳球通道。此外,還可以基于場(chǎng)地控制值(Pitch Control Value)做引導(dǎo)。
圖3|規(guī)則引導(dǎo)示例:把抽象戰(zhàn)術(shù)原則變成可執(zhí)行跑位
圖 3 的重點(diǎn),不在于模型“隨便改了幾條線”,而在于它展示了規(guī)則如何真正落到球員移動(dòng)上。如果你熟悉比賽分析就會(huì)知道,這些都不是“視覺上更好看”的位移,而是非常具體的戰(zhàn)術(shù)結(jié)構(gòu)變化。在每個(gè)規(guī)則引導(dǎo)的案例里,模型都在重新組織球隊(duì)的空間結(jié)構(gòu)、層次關(guān)系和協(xié)同方式,以滿足特定的戰(zhàn)術(shù)目標(biāo)。
▎自然語言引導(dǎo):把教練指令轉(zhuǎn)成具體跑位
第二種是自然語言引導(dǎo)。這意味著你不一定需要自己寫規(guī)則。你可以直接用接近教練語言或分析語言的方式告訴模型:“讓前場(chǎng)球員更堅(jiān)決地前插”“讓右邊鋒貼邊外拉,牽引邊后衛(wèi),為右側(cè)半空間騰出通道”。實(shí)現(xiàn)上,模型會(huì)自動(dòng)調(diào)用 LLM,先把這類語言指令轉(zhuǎn)換成可執(zhí)行的引導(dǎo)函數(shù),再在推理階段用這些函數(shù)去約束采樣方向,從而生成符合目標(biāo)的軌跡。
圖4|語言引導(dǎo)示例
圖 4 展示了 TacticGen 如何根據(jù)自然語言描述的教練指令生成對(duì)應(yīng)的具體跑位。無論是“讓進(jìn)攻方更積極前壓”,還是“讓右邊鋒外拉,主動(dòng)牽扯防線”,模型都能把抽象的語言要求轉(zhuǎn)化為符合戰(zhàn)術(shù)意圖、可執(zhí)行、可視化的戰(zhàn)術(shù)移動(dòng)。
▎價(jià)值引導(dǎo):讓軌跡朝更高長(zhǎng)期收益搜索
第三種是價(jià)值引導(dǎo)。論文額外訓(xùn)練了 value model,本質(zhì)上是一個(gè)基于 reward 學(xué)習(xí)的長(zhǎng)期收益(return)評(píng)估器。它讓模型不只滿足局部站位規(guī)則,而是朝著更高長(zhǎng)期戰(zhàn)術(shù)收益的方向搜索。也就是說,它考慮的不只是“這一步站位是否好看”,而是“這一段整體推進(jìn)對(duì)進(jìn)攻或防守是否更有利”。
圖5|基于 value model 的價(jià)值引導(dǎo)示例
這里對(duì)應(yīng)的是 value guidance 的兩個(gè)案例:一個(gè)面向進(jìn)攻方,一個(gè)面向防守方。它們不是去滿足某一條局部規(guī)則,而是借助 value model 提供的 reward 信號(hào),讓生成軌跡朝更高長(zhǎng)期收益的方向搜索。放到戰(zhàn)術(shù)層面理解,進(jìn)攻側(cè)會(huì)更傾向于把球員移動(dòng)組織到更有利的推進(jìn)和威脅區(qū)域;防守側(cè)則會(huì)更傾向于更早形成壓迫、限制持球人與關(guān)鍵空間,從而降低對(duì)手后續(xù)進(jìn)攻收益。
05
為什么說它不只是“能生成”,
而且“生成得靠譜”?
從軌跡預(yù)測(cè)指標(biāo)看,TactiGen 在論文中的多個(gè)基準(zhǔn)指標(biāo)上都取得了領(lǐng)先結(jié)果,包括ADE 0.29、FDE 0.52、joint ADE 0.45和joint FDE 0.92,這些指標(biāo)都比之前的 SOTA 模型有明顯提升。
![]()
這些數(shù)字的意義在于:如果底層的軌跡建模不夠準(zhǔn),后面的戰(zhàn)術(shù)生成就很難站得住。TacticGen先把“真實(shí)軌跡學(xué)得像”這件事做好,再在此基礎(chǔ)上引入目標(biāo)驅(qū)動(dòng)的生成能力,這一點(diǎn)非常重要。
圖6|Scaling 曲線:模型越大、數(shù)據(jù)越多、訓(xùn)練越充分,軌跡誤差持續(xù)下降
![]()
論文進(jìn)行了有關(guān) Scaling 的實(shí)驗(yàn),結(jié)果顯示,隨著訓(xùn)練步數(shù)增加、訓(xùn)練樣本增多,軌跡預(yù)測(cè)誤差持續(xù)下降;模型規(guī)模越大,最終誤差也通常越低。
這說明 TacticGen 不是“某個(gè)小模型剛好調(diào)出來的特例”,而更像是一個(gè)具備 foundation model 潛力的方向。也就是說,只要繼續(xù)給它更多高質(zhì)量數(shù)據(jù)、更長(zhǎng)訓(xùn)練和更大模型,它還有進(jìn)一步提升空間。
對(duì)現(xiàn)實(shí)應(yīng)用來說,這一點(diǎn)比“某次實(shí)驗(yàn)贏了多少”更關(guān)鍵,因?yàn)閼?zhàn)術(shù)建模真正難的是泛化到更復(fù)雜、更多樣、更多上下文約束的比賽情境。
06
最打動(dòng)人的部分,其實(shí)是專家實(shí)驗(yàn)
如果一篇足球 AI 論文只在離線指標(biāo)上做得漂亮,我們通常還會(huì)保留很多疑問:生成的軌跡到底像不像真實(shí)比賽?這些軌跡在戰(zhàn)術(shù)上有沒有意義?職業(yè)從業(yè)者會(huì)不會(huì)認(rèn)可?
TacticGen 的回答,是把專家直接請(qǐng)進(jìn)評(píng)估流程里。
論文與足球從業(yè)者合作開展了專家案例研究,參與者中包括來自伯明翰城足球俱樂部(Birmingham City Football Club)的 5 位足球領(lǐng)域?qū)I(yè)人士。作為英格蘭職業(yè)足球體系中的百年老牌俱樂部,伯明翰城曾兩奪英格蘭聯(lián)賽杯冠軍,因此這套專家實(shí)驗(yàn)也更貼近職業(yè)足球的一線觀察視角,而不只是學(xué)術(shù)語境下的內(nèi)部打分。
專家評(píng)估分成兩類任務(wù)。
第一類是真實(shí)性評(píng)估。專家需要判斷一段后續(xù)球員軌跡究竟來自真實(shí)比賽,還是來自模型生成。結(jié)果表明,專家區(qū)分 generated 和 realistic 的平均F1只有0.50 ± 0.07。這個(gè)結(jié)果最直接的含義是:?jiǎn)慰窜壽E表現(xiàn),專家并不容易穩(wěn)定地區(qū)分真假。
第二類是戰(zhàn)術(shù)效用評(píng)估。在這項(xiàng)盲測(cè)里,專家并不知道哪一邊是真實(shí)方案、哪一邊是 TacticGen 引導(dǎo)生成方案,只能把兩段軌跡匿名并排比較,判斷哪一邊對(duì)指定球隊(duì)更有戰(zhàn)術(shù)價(jià)值。結(jié)果顯示,引導(dǎo)后的 TacticGen 樣本平均 utility score 達(dá)到0.81 ± 0.04;在“真實(shí)跑位 vs 生成跑位”的對(duì)比中,專家有80%的情況下更偏向 TacticGen 生成的方案。
專家實(shí)驗(yàn)表明,TacticGen 生成的軌跡,一方面已經(jīng)足夠接近真實(shí)比賽節(jié)奏和協(xié)同方式;另一方面,在戰(zhàn)術(shù)目標(biāo)下,它甚至?xí)日鎸?shí)樣本更符合專家心中的戰(zhàn)術(shù)偏好。換句話說,專家不只是覺得它“看起來像”,還經(jīng)常認(rèn)為它“戰(zhàn)術(shù)上更值得選”。
圖7|專家評(píng)估結(jié)果:生成軌跡不只接近真實(shí),還經(jīng)常被認(rèn)為更有戰(zhàn)術(shù)價(jià)值
![]()
這張圖對(duì)應(yīng)真實(shí)性評(píng)估。專家區(qū)分真實(shí)軌跡與生成軌跡的平均F1只有0.50 ± 0.07。
![]()
這張圖對(duì)應(yīng)戰(zhàn)術(shù)效用評(píng)估。引導(dǎo)生成軌跡的平均 utility score 達(dá)到0.81 ± 0.04。
07
這篇論文真正的現(xiàn)實(shí)意義,
在于“工作流變了”
TacticGen 在現(xiàn)實(shí)足球工作流里的幾個(gè)潛在意義。
第一,它把傳統(tǒng)賽后復(fù)盤,推進(jìn)到了反事實(shí)戰(zhàn)術(shù)分析。分析師不再只能解釋“這次為什么會(huì)這樣跑”,還可以進(jìn)一步比較“如果這名邊鋒更早外拉、如果這名中場(chǎng)更早進(jìn)入球側(cè)接應(yīng),局面會(huì)不會(huì)更好”。
第二,它讓戰(zhàn)術(shù)討論從“口頭描述”變成“可生成、可比較的軌跡方案”。很多戰(zhàn)術(shù)會(huì)議里,教練組說的其實(shí)都是目標(biāo),比如“壓上去一點(diǎn)”“邊路站開一點(diǎn)”“中路保護(hù)再緊一點(diǎn)”。TacticGen 的價(jià)值在于,它開始有能力把這些目標(biāo)翻譯成可視化、可比較的球員移動(dòng)軌跡。
第三,它為職業(yè)足球里的數(shù)據(jù)分析、比賽準(zhǔn)備和訓(xùn)練設(shè)計(jì),提供了一種新的AI接口。未來不論是做對(duì)手分析、局部戰(zhàn)術(shù)rehearsal,還是為特定場(chǎng)景生成多種跑位候選,目標(biāo)驅(qū)動(dòng)的軌跡生成都會(huì)比單純的軌跡預(yù)測(cè)更貼近真實(shí)決策場(chǎng)景。
第四,它展示了一種更廣義的趨勢(shì):在多主體、強(qiáng)約束、強(qiáng)上下文依賴的現(xiàn)實(shí)世界里,生成模型最有價(jià)值的地方,往往不是“生成一個(gè)像真的東西”,而是“圍繞明確目標(biāo)生成一個(gè)更有用的方案”。
08
TacticGen最迷人的地方,不只是它把足球軌跡建模做得更好,而是它讓我們第一次比較清楚地看到:AI 可以從“理解比賽”繼續(xù)走向“參與戰(zhàn)術(shù)設(shè)計(jì)”。
它的核心對(duì)象始終是球和22名球員未來一段時(shí)間的協(xié)同軌跡。在這個(gè)基礎(chǔ)上,模型既能做真實(shí)軌跡預(yù)測(cè),也能圍繞戰(zhàn)術(shù)目標(biāo)生成新的跑位方案。再加上大規(guī)模職業(yè)比賽數(shù)據(jù)、與 BCFC 等足球?qū)<液献鞯陌咐芯浚约皩?duì)真實(shí)戰(zhàn)術(shù)工作流的貼近,這篇論文已經(jīng)不只是一個(gè)漂亮的學(xué)術(shù)demo,而更像是通往下一代足球分析工具的一次清晰預(yù)演。
如果你關(guān)心體育分析、生成式AI、多智能體建模,或者 AI 如何真正進(jìn)入現(xiàn)實(shí)決策場(chǎng)景,這篇 TacticGen 都值得認(rèn)真讀一讀。
未經(jīng)「AI科技評(píng)論」授權(quán),嚴(yán)禁以任何方式在網(wǎng)頁、論壇、社區(qū)進(jìn)行轉(zhuǎn)載!
公眾號(hào)轉(zhuǎn)載請(qǐng)先在「AI科技評(píng)論」后臺(tái)留言取得授權(quán),轉(zhuǎn)載時(shí)需標(biāo)注來源并插入本公眾號(hào)名片。
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.