<tr id="tp1vn"><td id="tp1vn"><dl id="tp1vn"></dl></td></tr>
  1. <p id="tp1vn"></p>
  2. <sub id="tp1vn"><p id="tp1vn"></p></sub>
    <u id="tp1vn"><rp id="tp1vn"></rp></u>
    <meter id="tp1vn"></meter>
      <wbr id="tp1vn"><sup id="tp1vn"></sup></wbr>
      日韩第一页浮力,欧美a在线,中文字幕无码乱码人妻系列蜜桃 ,国产成人精品三级麻豆,国产男女爽爽爽免费视频,中文字幕国产精品av,两个人日本www免费版,国产v精品成人免费视频71pao
      網(wǎng)易首頁(yè) > 網(wǎng)易號(hào) > 正文 申請(qǐng)入駐

      阿里巴巴團(tuán)隊(duì)開(kāi)源,OCR 又來(lái)一個(gè)高手,第一!

      0
      分享至

      大家好,我是Ai學(xué)習(xí)的老章

      OCR 我寫(xiě)過(guò)太多了,每隔一段時(shí)間就有新模型出來(lái):

      今天這位選手是阿里巴巴團(tuán)隊(duì)開(kāi)源的Logics-Parsing-v2,在兩個(gè)主流 Benchmark 上直接拿了第一:自家的 LogicsDocBench 拿了82.16 分,公開(kāi)的 OmniDocBench-v1.5 拿了93.23 分,都是目前最高分。


      https://www.modelscope.cn/studios/Alibaba-DT/Logics-Parsing/summary?spm=label.24dbbd5e.0.0.34862eb7aIqtVk 這模型有啥不一樣?

      市面上 OCR 模型一大把,Logics-Parsing-v2 憑啥能打?核心就兩個(gè)字:全能

      傳統(tǒng) OCR 做的事情比較窄——識(shí)別文字、提取表格、處理公式。但實(shí)際文檔遠(yuǎn)比這復(fù)雜:報(bào)紙那種多欄排版、跨頁(yè)表格、豎排文字、手寫(xiě)內(nèi)容……這些"臟活累活",大部分模型處理得都不太行。

      Logics-Parsing-v2 在 v1 的基礎(chǔ)上,除了把這些傳統(tǒng)任務(wù)做得更好之外,還加了一個(gè)全新的能力維度,叫Parsing-2.0——支持解析以下內(nèi)容:

      • 流程圖 / 思維導(dǎo)圖→ 輸出 Mermaid 格式

      • 樂(lè)譜→ 輸出 ABC 記譜法

      • 代碼塊 / 偽代碼→ 結(jié)構(gòu)化提取

      • 化學(xué)分子式→ SMILES 格式

      你沒(méi)看錯(cuò),它能看懂樂(lè)譜。這在 OCR 領(lǐng)域算是相當(dāng)炸裂的能力了。


      Logics-Parsing-v2 能力概覽——從傳統(tǒng)文檔到流程圖、樂(lè)譜、代碼全覆蓋 Benchmark 成績(jī)單

      先看自家的LogicsDocBench,這是阿里專(zhuān)門(mén)建的評(píng)測(cè)集,900 頁(yè) PDF,覆蓋三大場(chǎng)景:

      場(chǎng)景

      頁(yè)數(shù)

      包含內(nèi)容

      STEM 文檔

      218 頁(yè)

      物理、數(shù)學(xué)、工程等十多個(gè)學(xué)科

      復(fù)雜排版

      459 頁(yè)

      多欄、跨頁(yè)表格、豎排、圖文混排

      Parsing-2.0

      223 頁(yè)

      化學(xué)式、樂(lè)譜、代碼塊、流程圖

      在這個(gè) Benchmark 上,Logics-Parsing-v2 以82.16 分的總分排名第一,遠(yuǎn)超其他選手。


      LogicsDocBench 評(píng)測(cè)結(jié)果——Logics-Parsing-v2 全面領(lǐng)先

      再看公開(kāi)的OmniDocBench-v1.5,這個(gè)是業(yè)界公認(rèn)的文檔解析評(píng)測(cè)標(biāo)準(zhǔn)。Logics-Parsing-v2 拿了93.23 分,同樣是最高分——比 Gemini 2.5 Pro、GPT-5、豆包 1.6 這些閉源大模型都高。


      OmniDocBench-v1.5 評(píng)測(cè)結(jié)果——開(kāi)源模型首次登頂

      說(shuō)實(shí)話,開(kāi)源 OCR 模型在 OmniDocBench 上打贏閉源大模型,這還是頭一次。之前我測(cè)過(guò)不少 OCR 模型,閉源的 Mathpix、doc2x 一直是天花板,現(xiàn)在這個(gè)天花板被捅穿了。

      跟其他模型比怎么樣?

      在阿里自建的 Benchmark 上(v1 評(píng)測(cè),數(shù)值越低越好,TEDS 越高越好):

      幾個(gè)值得關(guān)注的對(duì)比:

      • vs Gemini 2.5 Pro:Logics-Parsing 在英文文本(0.089 vs 0.115)、表格(0.165 vs 0.154 接近)上都有競(jìng)爭(zhēng)力

      • vs Mathpix:公式識(shí)別 Mathpix 還是很強(qiáng)(0.06 vs 0.106),但綜合能力 Logics-Parsing 更好

      • vs MonkeyOCR / GOT-OCR:全面領(lǐng)先,不在一個(gè)檔次

      • vs 通用大模型(GPT-5、Qwen2.5VL-72B):專(zhuān)用模型優(yōu)勢(shì)明顯

      一個(gè)模型,端到端推理,不需要復(fù)雜的 pipeline,直接圖片進(jìn)、HTML 出。這個(gè)思路比傳統(tǒng)的"檢測(cè)+識(shí)別+后處理"流水線簡(jiǎn)潔太多了。

      輸出格式很講究

      Logics-Parsing-v2 輸出的不是純文本,而是結(jié)構(gòu)化 HTML。

      每個(gè)內(nèi)容塊都帶有:

      • 類(lèi)別標(biāo)簽:段落、表格、圖片、公式等

      • 邊界框坐標(biāo):精確到像素級(jí)的位置信息

      • OCR 文本:識(shí)別出的內(nèi)容

      對(duì)于 Parsing-2.0 的新場(chǎng)景,輸出格式也做了定制:

      • 流程圖 →Mermaid語(yǔ)法(可以直接渲染)

      • 樂(lè)譜 →ABC 記譜法(音樂(lè)人看得懂)

      • 化學(xué)式 →SMILES格式(化學(xué)標(biāo)準(zhǔn)表示)

      這意味著你拿到輸出之后,不需要再做什么后處理,直接就能用。

      怎么跑?

      部署很簡(jiǎn)單:

      conda create -n logics-parsing-v2 python=3.10
      conda activate logics-parsing-v2
      pip install -r requirements.txt

      下載模型(HuggingFace 或 ModelScope 二選一):

      # HuggingFace
      pip install huggingface_hub
      python download_model_v2.py -t huggingface


      # ModelScope(國(guó)內(nèi)更快)
      pip install modelscope
      python download_model_v2.py -t modelscope

      推理一行搞定:

      python3 inference_v2.py --image_path 你的圖片路徑 --output_path 輸出目錄 --model_path 模型路徑

      基于 Qwen3-VL 架構(gòu),對(duì) GPU 有一定要求,但不算離譜。

      實(shí)際效果展示

      說(shuō)了這么多數(shù)據(jù),看幾個(gè)實(shí)際效果:

      扭曲文檔識(shí)別——拍照角度歪斜、紙張彎曲,照樣準(zhǔn)確識(shí)別:


      扭曲文檔識(shí)別效果

      STEM 文檔——復(fù)雜的數(shù)學(xué)公式、物理圖表,結(jié)構(gòu)完整保留:


      STEM 文檔解析效果

      代碼塊識(shí)別——不只是識(shí)別文字,還能保留代碼結(jié)構(gòu):


      代碼塊識(shí)別效果

      流程圖解析——識(shí)別流程圖并轉(zhuǎn)成 Mermaid 代碼,可以直接渲染:


      流程圖解析效果

      樂(lè)譜識(shí)別——這個(gè)真的是第一次在 OCR 模型里見(jiàn)到:


      樂(lè)譜識(shí)別效果 總結(jié)

      Logics-Parsing-v2 給我的感覺(jué)就是:OCR 這個(gè)賽道,終于有一個(gè)模型把"全能"兩個(gè)字做到位了。

      • 雙 Benchmark 第一:LogicsDocBench 82.16,OmniDocBench-v1.5 93.23

      • Parsing-2.0:流程圖、樂(lè)譜、代碼、化學(xué)式,傳統(tǒng) OCR 碰都不碰的東西它全能解

      • 端到端單模型:不需要復(fù)雜 pipeline,圖片進(jìn) HTML 出

      • 開(kāi)源免費(fèi):代碼和模型全部開(kāi)放

      如果你在做文檔數(shù)字化、論文解析、知識(shí)庫(kù)構(gòu)建這類(lèi)工作,這個(gè)模型真的值得試試。

      • GitHub:https://github.com/alibaba/Logics-Parsing

      • HuggingFace 模型:https://huggingface.co/Logics-MLLM/Logics-Parsing-v2

      • 在線 Demo:https://www.modelscope.cn/studios/Alibaba-DT/Logics-Parsing/summary

      制作不易,如果這篇文章覺(jué)得對(duì)你有用,可否點(diǎn)個(gè)關(guān)注。給我個(gè)三連擊:點(diǎn)贊、轉(zhuǎn)發(fā)和在看。若可以再給我加個(gè),謝謝你看我的文章,我們下篇再見(jiàn)!

      特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶(hù)上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。

      Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

      相關(guān)推薦
      熱點(diǎn)推薦
      糖尿病一口番茄不能?chē)L?再次強(qiáng)調(diào):不想得糖尿病腎病,遠(yuǎn)離這6物

      糖尿病一口番茄不能?chē)L?再次強(qiáng)調(diào):不想得糖尿病腎病,遠(yuǎn)離這6物

      健康之光
      2026-05-11 16:35:09
      我60歲了絕經(jīng)已經(jīng)6年,被閨蜜拉著跟67歲退休醫(yī)生去云南玩8天

      我60歲了絕經(jīng)已經(jīng)6年,被閨蜜拉著跟67歲退休醫(yī)生去云南玩8天

      小虎新車(chē)推薦員
      2026-05-08 19:40:44
      青海17歲女學(xué)生溺亡!主動(dòng)去的橋邊,知情人曝猛料,恐不止是意外

      青海17歲女學(xué)生溺亡!主動(dòng)去的橋邊,知情人曝猛料,恐不止是意外

      北緯的咖啡豆
      2026-05-12 11:29:42
      女子線上買(mǎi)榴蓮破防,5房果開(kāi)出3房幾乎沒(méi)肉的“榴蓮糖”,聯(lián)系客服后退款50%

      女子線上買(mǎi)榴蓮破防,5房果開(kāi)出3房幾乎沒(méi)肉的“榴蓮糖”,聯(lián)系客服后退款50%

      大象新聞
      2026-05-12 22:46:09
      申花簽下馬萊加三年長(zhǎng)約,鋒線補(bǔ)強(qiáng)球迷期待新賽季

      申花簽下馬萊加三年長(zhǎng)約,鋒線補(bǔ)強(qiáng)球迷期待新賽季

      漫川舟船
      2026-05-13 00:16:35
      入住兩年,發(fā)現(xiàn)打再多柜子,都不如一個(gè)800庫(kù)好用,讓雜物全消失

      入住兩年,發(fā)現(xiàn)打再多柜子,都不如一個(gè)800庫(kù)好用,讓雜物全消失

      室內(nèi)設(shè)計(jì)師有料兒
      2026-05-11 09:30:15
      特朗普上飛機(jī)前坦白,對(duì)華稱(chēng)呼已變,美參議員:不能再向中國(guó)讓步

      特朗普上飛機(jī)前坦白,對(duì)華稱(chēng)呼已變,美參議員:不能再向中國(guó)讓步

      觸摸史跡
      2026-05-13 01:59:17
      褲子上這兩根繩,一定還有它存在的道理!

      褲子上這兩根繩,一定還有它存在的道理!

      新住家居
      2026-05-12 06:06:10
      蚌埠演唱會(huì)驚天騙局?成龍20 分鐘撈金離場(chǎng)?觀眾花千元看場(chǎng)笑話

      蚌埠演唱會(huì)驚天騙局?成龍20 分鐘撈金離場(chǎng)?觀眾花千元看場(chǎng)笑話

      做一個(gè)合格的吃瓜群眾
      2026-05-12 15:10:23
      張本智和回到日本 當(dāng)眾懺悔:本該贏下梁靖崑 心理和技術(shù)都有問(wèn)題

      張本智和回到日本 當(dāng)眾懺悔:本該贏下梁靖崑 心理和技術(shù)都有問(wèn)題

      風(fēng)過(guò)鄉(xiāng)
      2026-05-12 20:36:06
      南京一學(xué)區(qū)房小區(qū)24小時(shí)狂增250套!一學(xué)區(qū)房5天大降70萬(wàn)元!

      南京一學(xué)區(qū)房小區(qū)24小時(shí)狂增250套!一學(xué)區(qū)房5天大降70萬(wàn)元!

      科學(xué)發(fā)掘
      2026-05-13 00:01:50
      季后賽被橫掃后就退役!湖人離隊(duì)第一人!三年“躺賺”3300萬(wàn)美元

      季后賽被橫掃后就退役!湖人離隊(duì)第一人!三年“躺賺”3300萬(wàn)美元

      鳴哥說(shuō)體育
      2026-05-12 18:44:49
      女子因18元奶茶被親姐拉黑,崩潰大哭:離婚帶娃5年,都看不起我

      女子因18元奶茶被親姐拉黑,崩潰大哭:離婚帶娃5年,都看不起我

      辣媒專(zhuān)欄記錄
      2026-05-11 08:21:59
      卡塞米羅驚人評(píng)價(jià):貝爾比C羅更全面,梅西是防守者的噩夢(mèng)

      卡塞米羅驚人評(píng)價(jià):貝爾比C羅更全面,梅西是防守者的噩夢(mèng)

      星耀國(guó)際足壇
      2026-05-13 00:14:08
      太神奇了!場(chǎng)場(chǎng)三分命中率五成以上,苦熬七年,終于能拿億元合同

      太神奇了!場(chǎng)場(chǎng)三分命中率五成以上,苦熬七年,終于能拿億元合同

      球毛鬼胎
      2026-05-12 21:38:02
      寶媽就兒子割包皮跟寶爸吵了八百回,網(wǎng)友說(shuō):割了能更持久?

      寶媽就兒子割包皮跟寶爸吵了八百回,網(wǎng)友說(shuō):割了能更持久?

      燈錦年
      2026-05-10 19:22:52
      以軍被炸上天,給全世界教訓(xùn):大意輕敵,再精銳也能輸?shù)靡凰?>
    </a>
        <h3>
      <a href=愛(ài)吃醋的貓咪
      2026-05-10 22:06:14
      2026最火的6部韓劇,每部都太適合熬夜追了

      2026最火的6部韓劇,每部都太適合熬夜追了

      小Q侃電影
      2026-05-12 22:20:48
      專(zhuān)家:女性生育力“余額”無(wú)聲流失,35歲后呈斷崖式下降

      專(zhuān)家:女性生育力“余額”無(wú)聲流失,35歲后呈斷崖式下降

      南方都市報(bào)
      2026-05-12 08:48:40
      水谷隼徹底揭穿張本宇一家在日本受尊重的謊言!

      水谷隼徹底揭穿張本宇一家在日本受尊重的謊言!

      生活新鮮市
      2026-05-13 02:38:57
      2026-05-13 04:48:49
      Ai學(xué)習(xí)的老章 incentive-icons
      Ai學(xué)習(xí)的老章
      Ai學(xué)習(xí)的老章
      3395文章數(shù) 11150關(guān)注度
      往期回顧 全部

      科技要聞

      宇樹(shù)發(fā)布載人變形機(jī)甲,定價(jià)390萬(wàn)元起

      頭條要聞

      特朗普稱(chēng)將同中方討論對(duì)臺(tái)軍售和黎智英案 外交部回應(yīng)

      頭條要聞

      特朗普稱(chēng)將同中方討論對(duì)臺(tái)軍售和黎智英案 外交部回應(yīng)

      體育要聞

      騎士終于玩明白了?

      娛樂(lè)要聞

      白鹿風(fēng)波升級(jí)!掉粉20萬(wàn)評(píng)論區(qū)淪陷

      財(cái)經(jīng)要聞

      利潤(rùn)再腰斬 京東干外賣(mài)后就沒(méi)過(guò)過(guò)好日子

      汽車(chē)要聞

      吉利銀河“TT”申報(bào)圖曝光 電動(dòng)尾翼+激光雷達(dá)

      態(tài)度原創(chuàng)

      房產(chǎn)
      健康
      手機(jī)
      教育
      旅游

      房產(chǎn)要聞

      穗八條引爆樓市!萬(wàn)博寶藏紅盤(pán),五一勁銷(xiāo)出圈

      干細(xì)胞能讓人“返老還童”嗎

      手機(jī)要聞

      10年支持不變:谷歌力保現(xiàn)有Chromebook

      教育要聞

      求求你試試「5+1+1」學(xué)習(xí)法!!!

      旅游要聞

      故宮擠滿游客,人人撐傘前行:寧愿熱到出汗,也要奔赴紫禁城!

      無(wú)障礙瀏覽 進(jìn)入關(guān)懷版 主站蜘蛛池模板: 国产精品久久久久久久久鸭| 丰满少妇αⅴ无码区| 国产精品白浆一区二区免费看| 亚洲一区中文字幕在线观看| 亚洲欧洲无码av不卡在线| 久热免费观看视频在线| 久久本道综合久久伊人| 午夜精品福利亚洲国产| 亚洲人亚洲精品成人网站入口| 精品噜噜噜噜久久久久久久久| 亚洲色欲大片AAA无码| 青青草无码免费一二三区| 亚洲中文字幕2019| 中文字幕永久精品国产| 国产伊人色噜噜综合网| av成人无码无在线观看| 欧美人与禽2o2o性论交| 自拍偷拍一区二区三区四区| 亚洲国产成人精品女人久久久| 日本久久二区三区四区五区| 欧美日韩一区二区三| 伊人大杳蕉中文无码| 巨乳少妇电影| 亚洲色天堂网| 97无码免费人妻超级碰碰碰 | 首页日韩精品在线页| 国产精品国产AV片国产| 亚洲日韩精品欧美一区二区三区不卡 | 日韩午夜激情成人福利| 亚洲色www成人永久网址| 一本高清码二区三区不卡| 精品人妻一区介绍| 亚洲精品中文字幕午夜| 97一期涩涩97片久久久久久久| 天堂资源国产老熟女在线| 男女激情一区二区三区| 日韩美女乱淫试看视频多人 | 久久国产精品久久w女人spa| 国产又黄又爽又不遮挡视频| 丁香五月天导航| 亚洲综合精品第一页|