<tr id="tp1vn"><td id="tp1vn"><dl id="tp1vn"></dl></td></tr>
  1. <p id="tp1vn"></p>
  2. <sub id="tp1vn"><p id="tp1vn"></p></sub>
    <u id="tp1vn"><rp id="tp1vn"></rp></u>
    <meter id="tp1vn"></meter>
      <wbr id="tp1vn"><sup id="tp1vn"></sup></wbr>
      日韩第一页浮力,欧美a在线,中文字幕无码乱码人妻系列蜜桃 ,国产成人精品三级麻豆,国产男女爽爽爽免费视频,中文字幕国产精品av,两个人日本www免费版,国产v精品成人免费视频71pao
      網(wǎng)易首頁 > 網(wǎng)易號 > 正文 申請入駐

      ragflow v0.25.1 最新版發(fā)布:API 統(tǒng)一、PDF 解析性能大幅優(yōu)化、連接器刪除同步全面增強(qiáng),更新要點(diǎn)一次看懂

      0
      分享至




      一、版本概覽

      github.com/infiniflow/ragflow 的 v0.25.1 于 2026 年 5 月 2 日發(fā)布。
      這次版本更新可以說是一次“全面升級”:一方面對 Web API、HTTP API、RESTful 路由進(jìn)行了大規(guī)模統(tǒng)一和重構(gòu),另一方面在文檔解析、PDF 大文件處理、數(shù)據(jù)源同步、模型支持、問題修復(fù)等方面也有明顯增強(qiáng)。

      如果用一句話概括這個(gè)版本,可以說是:

      統(tǒng)一接口、優(yōu)化解析、增強(qiáng)同步、擴(kuò)展模型、修復(fù)大量升級與使用問題。

      下面將按照“Summary、Improvements、Model support、Model providers、Bug fixes、What's Changed”這幾個(gè)部分,把 v0.25.1 的更新內(nèi)容完整梳理出來,便于你快速了解這次升級的重點(diǎn)。

      二、版本摘要 1)API 重構(gòu)與統(tǒng)一

      本次版本最核心的變化之一,就是API refactoring and unification
      官方對各類接口做了標(biāo)準(zhǔn)化處理,把 Web API 統(tǒng)一為 RESTful 風(fēng)格,同時(shí)對文檔創(chuàng)建、索引流程進(jìn)行了統(tǒng)一整合,并且保持了向后兼容。

      這意味著什么?
      意味著在后續(xù)開發(fā)、對接、維護(hù)過程中,接口風(fēng)格會更加一致,邏輯會更清晰,使用和擴(kuò)展的成本也會更低。對于長期集成 ragflow 的用戶來說,這類變化通常會顯著提升系統(tǒng)可維護(hù)性。

      2)解析性能優(yōu)化

      本版本新增了OpenDataLoader PDF backend,并且對 PDF 解析做了進(jìn)一步優(yōu)化。
      尤其值得注意的是:

      • ? 對于超過 50 頁的大 PDF,新增了lazy loading 和 chunked parsing

      • ? 這樣可以顯著降低內(nèi)存占用

      • ? 對大文件處理的穩(wěn)定性和效率都有提升

      同時(shí),版本里還提到對超過 300 頁的大 PDF的解析失敗問題做了修復(fù),說明這次在 PDF 處理鏈路上改動(dòng)非常集中,也非常關(guān)鍵。

      3)數(shù)據(jù)源同步增強(qiáng)

      這次更新還增強(qiáng)了多種數(shù)據(jù)源的刪除文件同步能力,包括:

      • ? Bitbucket

      • ? Gmail

      • ? Google Drive

      • ? Airtable

      • ? GitLab

      • ? Dropbox

      • ? Discord

      這類能力的增強(qiáng)很實(shí)用,尤其適合需要保持知識庫內(nèi)容與外部數(shù)據(jù)源狀態(tài)一致的場景。

      4)模型支持更新

      本版本新增或擴(kuò)展了多個(gè)模型支持與模型提供方支持,其中包括:

      • ? DeepSeek v4

      • ? UCloud

      • ? Astraflow

      • ? Minimax

      • ? Gitee

      • ? SiliconFlow

      • ? Aliyun

      • ? Google

      • ? Volcengine

      • ? Moonshot

      • ? Paddle 更多模型

      這說明 ragflow 在模型生態(tài)兼容性上繼續(xù)擴(kuò)張,適配范圍更廣。

      5)Bug 修復(fù)

      官方還修復(fù)了多個(gè)重要問題,包括:

      • ? v0.24.0 到 v0.25.0 升級期間的元數(shù)據(jù)可見性問題

      • ? 重復(fù)聊天輸出

      • ? 文檔與 SDK 搜索消息時(shí) user_id 支持問題

      • ? 上傳流導(dǎo)致文件截?cái)鄦栴}

      • ? 大量接口、頁面、同步、展示、解析相關(guān)問題

      三、詳細(xì)更新內(nèi)容

      下面進(jìn)入重點(diǎn)部分,把本次更新按類別完整展開。

      四、API 重構(gòu)與 RESTful 統(tǒng)一

      v0.25.1 的大量提交都集中在 API 重構(gòu)上,說明這次版本的一個(gè)主線就是:把原來分散的接口逐步整合到統(tǒng)一的 RESTful 設(shè)計(jì)下。

      1. 文檔相關(guān)接口統(tǒng)一

      本次對以下內(nèi)容做了統(tǒng)一或遷移:

      • ? document get_filter

      • ? document infos

      • ? document delete api

      • ? document create flows

      • ? document metadata config update API

      • ? file2document

      • ? doc metadata update

      • ? document upload_and_parse API

      • ? document run api

      • ? document thumbnails API

      • ? doc parse API 的清理

      • ? doc batch change status

      • ? document upload info used in chat

      • ? document metadata config

      這表明文檔相關(guān)鏈路幾乎全線被梳理了一遍,從創(chuàng)建、上傳、解析、運(yùn)行、刪除、縮略圖、信息獲取、元數(shù)據(jù)更新,到批量狀態(tài)變更都進(jìn)行了重構(gòu)。

      2. Chat、Search、Chunk、MCP、Agent 等 REST 化

      除了文檔鏈路,本次還對多個(gè)系統(tǒng)級模塊進(jìn)行了 REST API 改造或遷移:

      • ? chat 和 search 的 restful API 對齊

      • ? chunk APIs 遷移為 RESTful routes

      • ? MCP APIs 遷移到 RESTful api

      • ? agent webhook routes 遷移到 REST APIs

      • ? system apis 重構(gòu)

      • ? stats_api 和 plugin_api 重構(gòu)

      • ? artifact API 遷移

      • ? user REST API 重構(gòu)

      • ? tenant api 重構(gòu)

      • ? task API 新增

      這些變化說明 ragflow 正在系統(tǒng)性地統(tǒng)一整個(gè) API 體系,不只是局部修修補(bǔ)補(bǔ),而是向著更一致、更規(guī)范的服務(wù)端接口結(jié)構(gòu)推進(jìn)。

      3. 向后兼容支持

      本次還加入了backward compat APIs。
      這非常重要,因?yàn)?API 大規(guī)模重構(gòu)最怕影響舊系統(tǒng)接入,而向后兼容接口的加入,可以幫助已有用戶平滑過渡。

      4. 其他接口調(diào)整

      版本中還包括:

      • ? restore openai-compatible chat completions api

      • ? align list operations and strict mode

      • ? search id 或 _id 都可支持

      • ? query param type 修復(fù)

      • ? allow use image2text as chat model

      • ? support release in agent update api

      • ? fix api user patch verb does not work

      這些看似分散,但都屬于 API 層面的穩(wěn)定性和一致性修復(fù)。

      五、文檔解析與 PDF 處理優(yōu)化

      這是本版本另一個(gè)非常突出的亮點(diǎn)。

      1. 新增 OpenDataLoader PDF parser backend

      版本中新增了OpenDataLoader PDF parser backend。
      這意味著 ragflow 在 PDF 接入和解析后端上又多了一種可用方案。

      2. 大 PDF 的懶加載與分塊解析

      對于超過 50 頁的 PDF,新增了:

      • ? lazy loading

      • ? chunked parsing

      這類機(jī)制的核心好處是減少一次性加載帶來的資源壓力,尤其適合大文檔、掃描件、長報(bào)告、手冊類文件。

      3. 路由到 native chunking endpoints

      版本里還提到:

      • ? route docling parsing through native chunking endpoints

      說明解析流程和 chunk 處理流程進(jìn)一步貼近統(tǒng)一的原生分塊接口。

      4. 刪除硬編碼頁數(shù)限制

      修復(fù)了:

      • ? hardcoded page limits causing parsing failures on large PDFs (>300 pages)

      這意味著超大 PDF 的解析失敗問題得到處理,和前面的懶加載、分塊解析形成配套優(yōu)化。

      5. MinerU 相關(guān)修復(fù)

      版本中還包括對 MinerU 解析鏈路的多個(gè)修復(fù):

      • ? switch MinerU API endpoint to /pdf_parse

      • ? MinerU 3.x output discovery and API contract

      說明 PDF 解析后端適配上做了明顯調(diào)整。

      6. 其他解析相關(guān)改進(jìn)

      還有這些內(nèi)容:

      • ? manual naive parser position extraction fallback

      • ? fix isinstance before len in VariableAssigner _remove_first/_remove_last

      • ? fix thumbnail issue in chat

      • ? update rootAsHeadingTip

      • ? optimize title chunk

      • ? docling parse routing

      • ? performance improvements for image loading and parse_into_bboxes

      整體來看,這一版的解析優(yōu)化非常系統(tǒng),既有性能優(yōu)化,也有兼容修復(fù),還有后端適配。

      六、數(shù)據(jù)源同步能力增強(qiáng)

      本版本對“同步刪除文件”這個(gè)能力做了非常廣泛的擴(kuò)展。

      1. 已支持刪除同步的數(shù)據(jù)源

      本次支持同步刪除文件的連接器包括:

      • ? Bitbucket

      • ? Gmail

      • ? Google Drive

      • ? Airtable

      • ? GitLab

      • ? Dropbox

      • ? Discord

      2. Google Drive 與 Gmail 的進(jìn)一步優(yōu)化

      還特別提到:

      • ? optimize memory payload and enable sync deletion

      • ? google authentication - gmail && google-drive

      說明這兩個(gè)數(shù)據(jù)源不僅支持刪除同步,還修復(fù)了認(rèn)證與內(nèi)存負(fù)載方面的問題。

      3. 其他同步相關(guān)修復(fù)

      還有:

      • ? skip unsupported files before download

      • ? prune deleted doc chunks from retrieval

      這意味著刪掉的內(nèi)容在同步、下載、檢索鏈路中會更合理地被處理,避免臟數(shù)據(jù)繼續(xù)影響結(jié)果。

      七、模型支持與模型提供方更新 1. 新增模型支持

      本版本新增DeepSeek v4支持。
      這是本次模型能力更新里最醒目的內(nèi)容之一。

      2. 新增模型提供方

      版本中新增或補(bǔ)充了多個(gè) provider 支持:

      • ? UCloud

      • ? Astraflow

      • ? Minimax

      • ? Gitee

      • ? SiliconFlow

      • ? Aliyun

      • ? Google

      • ? Volcengine

      • ? Moonshot

      3. Paddle 相關(guān)擴(kuò)展

      版本中還提到:

      • ? more model for paddle

      • ? add deepseek and moonshot model json

      • ? update based on more model support

      這表示模型配置和適配層做了擴(kuò)展,模型選擇更加豐富。

      4. 其他模型相關(guān)修復(fù)

      還包括:

      • ? model in GO refactor

      • ? model type to model class

      • ? remove model_bundle.go

      • ? fix think tags in final chat answer

      • ? fix DeepSeek think history

      • ? normalize think tags in final chat answer

      • ? allow image2text as chat model

      這表明模型調(diào)用和輸出處理鏈路都進(jìn)行了整理。

      八、聊天、檢索、Agent、GraphRAG 等能力調(diào)整 1. 聊天功能修復(fù)

      本版本修復(fù)了多個(gè)聊天相關(guān)問題,其中最典型的是:

      • ? 修復(fù)了重復(fù)聊天輸出

      • ? 修復(fù)了思考模型在聊天頁輸出重復(fù)文本

      • ? 修復(fù)了chat shared page 中 canvas SSE fetch 導(dǎo)致的 spurious 103 error

      • ? 修復(fù)了聊天頁底部按鈕點(diǎn)擊無法彈出對話框的問題

      • ? 修復(fù)了聊天中的 thumbnails 問題

      • ? 修復(fù)了chat recommendation 和 thumbup API 對齊問題

      • ? 修復(fù)了widget 頁面右下角按鈕無法顯示彈窗的問題

      • ? 修復(fù)了duplicate chat output

      • ? 修復(fù)了final chat answer 中 think tags 的規(guī)范化問題

      • ? 修復(fù)了DeepSeek think history 相關(guān)問題

      • ? 修復(fù)了image2text 可作為 chat model 使用的問題

      這些修復(fù)說明聊天頁面、輸出流、推薦交互、縮略圖、模型思考?xì)v史等多個(gè)環(huán)節(jié)都進(jìn)行了穩(wěn)定性處理。

      2. 檢索與召回調(diào)整

      本版本還修復(fù)和增強(qiáng)了檢索相關(guān)能力,包括:

      • ? 支持search id 或 _id

      • ? 修復(fù)allow search id or _id

      • ? 修復(fù)retrieval fallback comments

      • ? 修復(fù)prune deleted doc chunks from retrieval

      • ? 在 GO 中實(shí)現(xiàn)retrieval_test

      • ? 將chunk retrieval_test 和 knowledge_graph遷移到 REST API endpoints

      • ? 修復(fù)enable sync deleted file 后對檢索的影響

      這些更新說明檢索鏈路在 ID 兼容性、刪除內(nèi)容過濾、測試接口、REST 化方面都做了調(diào)整。

      3. Agent 相關(guān)更新

      Agent 模塊在這一版也有明顯動(dòng)作,包括:

      • ? 新增Agent api

      • ? 將agent webhook routes遷移到 REST APIs

      • ? 修復(fù)agent toolcall null response

      • ? 修復(fù)schema validation

      • ? 修復(fù)DeepSeek think history

      • ? 修復(fù)support release in agent update api

      • ? 優(yōu)化agent reset conversation variable defaults

      • ? 修復(fù)prioritize explore session ID and reset default conversation variables

      說明 Agent 的 API、變量默認(rèn)值、工具調(diào)用返回、發(fā)布支持、會話優(yōu)先級等都進(jìn)行了整理。

      4. GraphRAG 相關(guān)修復(fù)

      版本中與 GraphRAG 相關(guān)的內(nèi)容也不少:

      • ? 修復(fù)GraphRAG entity resolution merges以避免 graph mutation races

      • ? 修復(fù)delete graphrag raptor

      • ? 修復(fù)graph task type

      • ? 修復(fù)delete graph

      • ? 修復(fù)GraphRAG icon not displaying

      • ? 新增persist RAPTOR layer metadata on summary chunks

      • ? 新增persist PDF bookmark outline as document metadata

      這些改動(dòng)說明 GraphRAG、RAPTOR、圖任務(wù)、圖刪除、元數(shù)據(jù)持久化和圖標(biāo)展示都經(jīng)歷了較多修復(fù)。

      九、數(shù)據(jù)與元數(shù)據(jù)相關(guān)更新 1. 元數(shù)據(jù)可見性與遷移問題修復(fù)

      這次版本明確修復(fù)了:

      • ? v0.24.0 到 v0.25.0 升級期間的metadata visibility issues

      • ?Recall Test Page Metadata Not Displaying

      • ?document level auto metadata config missing after save

      • ?document level auto metadata config

      • ?metadata parsing regression for upgraded v0.24 datasets

      • ?metadata config

      • ?doc metadata update

      • ?migrate document metadata config update API

      • ?migrate doc upload info used in chat

      • ?document level auto metadata config missing after save

      這些問題都和升級后的元數(shù)據(jù)展示、保存、解析、配置遷移有關(guān),屬于版本升級中的高頻痛點(diǎn),這次都做了修復(fù)和重構(gòu)。

      2. 元數(shù)據(jù)與數(shù)據(jù)集操作

      版本中還涉及:

      • ? dataset management endpoints

      • ? visit dataset error

      • ? file logs not displayed in dataset ingestion page

      • ? dataset: general chunk method 配置選項(xiàng)缺失

      • ? fix api and sdk support of searching message with user_id

      • ? fix document and sdk support of searching message with user_id

      • ? fix query param type

      • ? fix preserve infinity available_int zero filter

      • ? fix case-insensitive matching for manual meta_data_filter in / not in list values

      這說明數(shù)據(jù)集、消息搜索、過濾條件、日志展示、chunk 配置等也都在同步調(diào)整。

      3. 數(shù)據(jù)庫與遷移文檔

      版本還新增了:

      • ? database schema and migration guide

      這表示官方提供了數(shù)據(jù)庫結(jié)構(gòu)和遷移指引,有助于用戶理解升級變化。

      十、連接器與數(shù)據(jù)源同步的進(jìn)一步擴(kuò)展

      前面已經(jīng)提到刪除文件同步能力增強(qiáng),這里再完整整理一下本版本涉及的連接器和相關(guān)修復(fù)。

      1. 新增或增強(qiáng)刪除同步能力的連接器

      這次明確支持同步刪除文件的場景包括:

      • ? Bitbucket

      • ? Gmail

      • ? Google Drive

      • ? Airtable

      • ? GitLab

      • ? Dropbox

      • ? Discord

      2. 額外修復(fù)與增強(qiáng)

      還包括:

      • ? fix blob sync: skip unsupported files before download

      • ? fix google authentication - gmail && google-drive

      • ? optimize memory payload and enable sync deletion

      • ? enable sync deleted files in gitlab

      • ? support deleted-file sync in dropbox

      • ? enable sync deleted file for Discord

      • ? enable sync deleted files in Bitbucket

      • ? enable sync deleted files for Gmail && fix google drive issues

      • ? enable sync deleted file in airtable

      這些條目說明連接器側(cè)的刪除同步能力是本版本的重要工作方向之一,而且覆蓋面很廣。

      十一、Go 端與服務(wù)端能力更新

      這一版在 Go 相關(guān)能力上也做了很多補(bǔ)充和修復(fù)。

      1. 新增和擴(kuò)展 provider

      Go 端新增或擴(kuò)展了這些模型提供方:

      • ? UCloud

      • ? Astraflow

      • ? minimax

      • ? gitee

      • ? siliconflow

      • ? aliyun

      • ? google

      • ? volcengine

      • ? moonshot

      • ? drop instance models

      2. Go 端其他更新

      還有:

      • ? add balance command

      • ? update db model

      • ? implement provider: Moonshot

      • ? implement provider: volcengine

      • ? implement provider: MiniMax

      • ? fix compilation

      • ? update chat URL

      • ? update create model instance command

      • ? refactor model in GO

      • ? refactor model type to model class

      • ? simplify Encode

      • ? remove model_bundle.go, modify chat_session.go

      • ? add new provider

      • ? add redis zcard

      • ? add missing timeout to ragflow server health check

      • ? add executor.shutdown

      • ? go: fix compilation

      這些內(nèi)容體現(xiàn)出 Go 端在 provider、編譯、健康檢查、聊天會話、模型抽象、命令行、數(shù)據(jù)庫、Redis 等方面都有同步維護(hù)。

      十二、前端、頁面與交互修復(fù)

      本版本的 UI 和頁面問題修復(fù)也不少。

      1. 頁面和按鈕問題

      包括:

      • ? chat 頁面重復(fù)輸出修復(fù)

      • ? widget 頁面右下角按鈕彈窗問題修復(fù)

      • ? PaddleOCR dialog 按鈕樣式問題修復(fù)

      • ? GraphRAG 圖標(biāo)不顯示修復(fù)

      • ? thumbnails issue in chat 修復(fù)

      • ? file logs table pipeline column header 顯示錯(cuò)誤修復(fù)

      • ? file logs not displayed in dataset ingestion page 修復(fù)

      2. 其他頁面相關(guān)修復(fù)

      還有:

      • ? Recall Test Page Metadata Not Displaying

      • ? visit dataset error

      • ? fix button styles in PaddleOCR dialog

      • ? fix widget page dialog display

      • ? fix chart or table related display problems

      • ? fix v0.24 to v0.25 metadata visibility issues

      • ? fix chat shared page SSE fetch error

      這些修復(fù)說明頁面體驗(yàn)、表格顯示、對話框、日志、縮略圖、圖標(biāo)展示等都在這一版被持續(xù)整理。

      十三、文檔、說明與發(fā)布相關(guān)內(nèi)容

      本版本還包含多項(xiàng)文檔和發(fā)布說明更新:

      • ? add DeepWiki developer guide page

      • ? user-level memory is supported in v0.25.0

      • ? v0.25.0 release notes

      • ? two PDF parser optimizers are supported as of v0.25.0

      • ? fix API key guide typo

      • ? updated a 0.25-specific faq

      • ? update API document

      • ? update version references to v0.25.1 in READMEs and docs

      • ? add database schema and migration guide

      • ? updated Title chunker references

      • ? add shared UI component lock convention to CLAUDE.md

      • ? release note update

      這些內(nèi)容說明本版本不僅改了代碼,也補(bǔ)充和維護(hù)了大量文檔、指南、FAQ、版本引用和遷移說明。

      十四、安全、穩(wěn)定性與兼容性修復(fù)

      這一版還針對不少穩(wěn)定性和安全性問題進(jìn)行了處理。

      1. 安全相關(guān)

      包括:

      • ? validate URL scheme and resolved IP before crawling to prevent SSRF

      這是一個(gè)非常關(guān)鍵的安全修復(fù),說明抓取流程對 URL 與 IP 做了更嚴(yán)格校驗(yàn)。

      2. 上傳與文件處理穩(wěn)定性

      包括:

      • ? fix upload stream handling to prevent truncated files

      • ? skip unsupported files before download

      • ? add executor.shutdown

      • ? add missing timeout to health check

      這些修復(fù)提升了上傳、下載、任務(wù)執(zhí)行和健康檢查的穩(wěn)定性。

      3. 兼容性與數(shù)據(jù)處理

      包括:

      • ? fix Infinity table-not-exist error

      • ? preserve infinity available_int zero filter

      • ? fix case-insensitive matching for manual meta_data_filter

      • ? fix query param type

      • ? always return success if no such task id

      • ? fix api user patch verb does not work

      • ? fix commit override from api-key to api_key

      • ? fix create folder does not accept FOLDER

      • ? fix allow search id or _id

      這些都屬于接口行為、參數(shù)兼容、過濾邏輯和異常返回方面的

      十五、繼續(xù)整理:更多 API、任務(wù)、檢索與系統(tǒng)修復(fù) 1. 任務(wù)與調(diào)度相關(guān)

      本版本在任務(wù)管理上也有補(bǔ)充:

      • ? 新增task API

      • ? 修復(fù)always return success if no such task id

      • ? 修復(fù)add executor.shutdown

      • ? 修復(fù)add missing timeout to ragflow server health check

      這些內(nèi)容說明任務(wù)創(chuàng)建、查詢、執(zhí)行收尾和健康檢查鏈路都更完整了。

      2. 系統(tǒng)與基礎(chǔ)接口調(diào)整

      本次還涉及:

      • ?system apis重構(gòu)

      • ?tenant api重構(gòu)

      • ?stats_api and plugin_api重構(gòu)

      • ?REST API langfuse api-key調(diào)整

      • ?API connectors重構(gòu)

      • ?api document更新

      • ?api refactor: stats_api and plugin_api

      • ?refactor user REST API

      • ?fix api user patch verb does not work

      • ?fix commit override from api-key to api_key

      這類工作雖然不直接面向業(yè)務(wù)功能,但對系統(tǒng)統(tǒng)一性和長期維護(hù)很重要。

      十六、上傳、文件、縮略圖與解析鏈路修復(fù) 1. 文件上傳與流處理

      這次修復(fù)了:

      • ? upload stream handling to prevent truncated files

      這說明上傳過程中斷文件被截?cái)嗟膯栴}得到處理。

      2. 文件與縮略圖

      還包括:

      • ? thumbnails issue in chat

      • ? migrate document thumbnails API

      • ? fix thumbnails issue in chat

      • ? The GraphRAG icon is not displaying

      • ? button styles in PaddleOCR dialog not applying correctly

      這些改動(dòng)涉及縮略圖接口、聊天頁縮略圖展示、圖標(biāo)展示、按鈕樣式等,屬于前端體驗(yàn)與接口聯(lián)動(dòng)修復(fù)。

      3. 文件日志與數(shù)據(jù)集頁面

      版本中還修復(fù):

      • ? file logs not displayed in dataset ingestion page

      • ? FileLogsTable pipeline column header displaying incorrectly

      • ? visit dataset error

      這些問題都屬于數(shù)據(jù)集和文件日志頁面的可視化與可訪問性修復(fù)。

      十七、繼續(xù)補(bǔ)充:解析器、Chunk、RAPTOR、Title Chunk 等優(yōu)化

      本版本中與解析、Chunk 組織、標(biāo)題處理相關(guān)的條目也很多。

      1. Chunk 與標(biāo)題優(yōu)化

      包括:

      • ? optimize title chunk

      • ? updated Title chunker references

      • ? route docling parsing through native chunking endpoints

      • ? migrate chunk APIs to RESTful routes

      • ? migrate chunk retrieval_test and knowledge_graph to REST API endpoints

      這說明 chunk 處理和標(biāo)題處理作為文檔分析的關(guān)鍵環(huán)節(jié),在這一版被集中整理。

      2. RAPTOR 與 PDF 元數(shù)據(jù)

      還包括:

      • ? persist RAPTOR layer metadata on summary chunks

      • ? persist PDF bookmark outline as document metadata

      • ? fix delete graphrag raptor

      • ? RAPTOR “Generation scope” reset to “Single file” when selecting “Dataset”

      這些內(nèi)容說明 RAPTOR 層的元數(shù)據(jù)、書簽大綱、刪除邏輯和生成范圍都做了處理。

      3. 解析位置與回退邏輯

      包括:

      • ? manual naive parser position extraction fallback

      • ? doc change parser

      • ? switch MinerU API endpoint to /pdf_parse

      • ? MinerU 3.x output discovery and API contract

      這些都是解析后端的細(xì)節(jié)優(yōu)化。

      十八、繼續(xù)補(bǔ)充:搜索、過濾、消息與用戶 ID

      這一版對搜索與消息相關(guān)的兼容問題也做了很多修正。

      1. 搜索消息與 user_id

      包括:

      • ? document and sdk support of searching message with user_id

      • ? searching message with user_id

      • ? allow search id or _id

      說明搜索接口在用戶維度和 ID 兼容維度上都做了擴(kuò)展。

      2. 過濾條件修復(fù)

      包括:

      • ? preserve infinity available_int zero filter

      • ? case-insensitive matching for manual meta_data_filter in / not in list values

      • ? fix query param type

      這些修復(fù)讓過濾行為更符合預(yù)期,避免因類型、大小寫、零值而出現(xiàn)結(jié)果偏差。

      3. 檢索測試與知識圖譜

      包括:

      • ? implement retrieval_test in GO

      • ? migrate chunk retrieval_test and knowledge_graph to REST API endpoints

      • ? add retrieval fallback comments

      說明檢索測試和知識圖譜相關(guān)接口也在 REST 化。

      十九、繼續(xù)補(bǔ)充:數(shù)據(jù)庫、模型、依賴與構(gòu)建 1. 數(shù)據(jù)庫與遷移

      包括:

      • ? add database schema and migration guide

      • ? update db model

      • ? handle Infinity table-not-exist error

      • ? preserve infinity available_int zero filter

      2. 模型抽象與實(shí)現(xiàn)

      包括:

      • ? model refactor in GO

      • ? model type to model class

      • ? remove model_bundle.go, modify chat_session.go

      • ? more model for paddle

      • ? add deepseek and moonshot model json

      • ? add drop instance models

      3. 依賴與構(gòu)建

      包括:

      • ? bump lxml from 6.0.2 to 6.1.0

      • ? bump grpc from 1.66.2 to 1.79.3

      • ? fix uv.lock

      • ? fix compilation

      • ? go: fix compilation

      這些內(nèi)容說明本版本也完成了依賴更新和編譯層面的維護(hù)。

      二十、補(bǔ)充:更多連接器刪除同步場景

      為了更清晰,這里再把本次新增或修復(fù)的刪除同步能力統(tǒng)一總結(jié)一遍:

      • ? Bitbucket 刪除文件同步

      • ? Gmail 刪除文件同步

      • ? Google Drive 刪除文件同步

      • ? Airtable 刪除文件同步

      • ? GitLab 刪除文件同步

      • ? Dropbox 刪除文件同步

      • ? Discord 刪除文件同步

      以及與之相關(guān)的修復(fù):

      • ? skip unsupported files before download

      • ? optimize memory payload and enable sync deletion

      • ? fix google authentication - gmail && google-drive

      • ? enable sync deleted files for Gmail && fix google drive issues

      這部分是本次連接器能力提升的重點(diǎn)之一。

      二十一、最終總結(jié):v0.25.1 到底強(qiáng)在哪里

      代碼地址:github.com/infiniflow/ragflow

      綜合這次更新可以看到,ragflow v0.25.1 不是一個(gè)單點(diǎn)修復(fù)版本,而是一個(gè)覆蓋面非常廣的版本,主要體現(xiàn)在以下幾個(gè)方向:

      1. 接口全面統(tǒng)一

      Web API、HTTP API、REST API 被大范圍統(tǒng)一,文檔、聊天、搜索、chunk、MCP、Agent、統(tǒng)計(jì)、插件、租戶、任務(wù)等鏈路都在收斂到更一致的架構(gòu)。

      2. 解析能力更強(qiáng)

      新增 OpenDataLoader PDF backend,支持大 PDF 懶加載和分塊解析,修復(fù)超大 PDF 解析失敗,MinerU 適配也有修正,PDF 處理能力明顯增強(qiáng)。

      3. 刪除同步更全面

      多個(gè)連接器支持同步刪除文件,尤其是 Bitbucket、Gmail、Google Drive、Airtable、GitLab、Dropbox、Discord 等場景,進(jìn)一步提升了知識庫與外部數(shù)據(jù)源的一致性。

      4. 模型生態(tài)繼續(xù)擴(kuò)展

      DeepSeek v4、UCloud、Astraflow、Minimax、Gitee、SiliconFlow、Aliyun、Google、Volcengine、Moonshot 等支持陸續(xù)加入,模型選擇更豐富。

      5. 穩(wěn)定性修復(fù)很多

      包括重復(fù)聊天輸出、元數(shù)據(jù)可見性、上傳截?cái)?、檢索過濾、頁面顯示、圖標(biāo)樣式、任務(wù)返回、健康檢查、編譯問題等,覆蓋了前后端和服務(wù)端的多類問題。

      6. 文檔和遷移信息更完整

      版本說明、FAQ、API 文檔、遷移指南、數(shù)據(jù)庫 schema、版本引用等都有更新,便于升級和排查。

      我們相信人工智能為普通人提供了一種“增強(qiáng)工具”,并致力于分享全方位的AI知識。在這里,您可以找到最新的AI科普文章、工具評測、提升效率的秘籍以及行業(yè)洞察。 歡迎關(guān)注“福大大架構(gòu)師每日一題”,發(fā)消息可獲得面試資料,讓AI助力您的未來發(fā)展。

      特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。

      Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

      相關(guān)推薦
      熱點(diǎn)推薦
      工資13500元/月(6險(xiǎn)2金+雙休)2026年編制單位面向社會公開招收427名工作人員公告!5月11日開始報(bào)名!

      工資13500元/月(6險(xiǎn)2金+雙休)2026年編制單位面向社會公開招收427名工作人員公告!5月11日開始報(bào)名!

      材料科學(xué)與工程
      2026-05-11 10:06:00
      電力設(shè)備需求的超級周期來臨,關(guān)注電網(wǎng)設(shè)備ETF(561380)

      電力設(shè)備需求的超級周期來臨,關(guān)注電網(wǎng)設(shè)備ETF(561380)

      每日經(jīng)濟(jì)新聞
      2026-05-13 09:52:14
      李賽鳳的亂倫,床縫摸出個(gè)用過的套,衣柜里還藏著個(gè)半裸的干兒子

      李賽鳳的亂倫,床縫摸出個(gè)用過的套,衣柜里還藏著個(gè)半裸的干兒子

      西樓知趣雜談
      2026-04-26 10:18:11
      陳都靈,瘦的讓人心疼

      陳都靈,瘦的讓人心疼

      陳意小可愛
      2026-05-01 10:53:54
      正常人可以偶爾偷吃一顆偉哥嗎?有什么副作用?本文為你講出實(shí)情

      正常人可以偶爾偷吃一顆偉哥嗎?有什么副作用?本文為你講出實(shí)情

      健康科普365
      2026-05-09 21:05:04
      特朗普36小時(shí)北京行,帶了兩個(gè)最反華的人,黃仁勛最后一刻登機(jī)

      特朗普36小時(shí)北京行,帶了兩個(gè)最反華的人,黃仁勛最后一刻登機(jī)

      邱震海
      2026-05-13 20:30:03
      大伯出獄全家沒人接,我開車去接他,他偷偷塞我一張卡說有1200萬

      大伯出獄全家沒人接,我開車去接他,他偷偷塞我一張卡說有1200萬

      千秋文化
      2026-05-09 20:08:48
      太過分!基本盤竟然被用來嘲諷有愛國情懷的人

      太過分!基本盤竟然被用來嘲諷有愛國情懷的人

      映射生活的身影
      2026-05-13 21:13:11
      60歲蔣雯麗現(xiàn)狀:定居英國,素顏又瘦又老,沒想到一代女神也老了

      60歲蔣雯麗現(xiàn)狀:定居英國,素顏又瘦又老,沒想到一代女神也老了

      娛說瑜悅
      2026-03-20 14:38:40
      最后時(shí)刻,黃仁勛擠上飛向北京的“空軍一號”

      最后時(shí)刻,黃仁勛擠上飛向北京的“空軍一號”

      中國新聞周刊
      2026-05-13 20:56:03
      深度丨黃仁勛從缺席到 “壓軸加入”特朗普訪華團(tuán)的戲劇性轉(zhuǎn)折

      深度丨黃仁勛從缺席到 “壓軸加入”特朗普訪華團(tuán)的戲劇性轉(zhuǎn)折

      中國網(wǎng)
      2026-05-13 14:13:06
      水谷隼徹底揭穿張本宇一家在日本受尊重的謊言!

      水谷隼徹底揭穿張本宇一家在日本受尊重的謊言!

      生活新鮮市
      2026-05-13 02:38:57
      NBA球隊(duì)老板手撕華裔女獵手:100億的仙人跳 搞砸了

      NBA球隊(duì)老板手撕華裔女獵手:100億的仙人跳 搞砸了

      慕容律師
      2026-05-13 14:15:09
      杜特爾特盟友沖進(jìn)國會,抓人的特工緊隨其后,現(xiàn)場一片嘩然

      杜特爾特盟友沖進(jìn)國會,抓人的特工緊隨其后,現(xiàn)場一片嘩然

      芳芳?xì)v史燴
      2026-05-13 04:58:35
      “你兒子比農(nóng)村土狗還好養(yǎng)!”中學(xué)男孩全碳水飲食,吃出可憐面相

      “你兒子比農(nóng)村土狗還好養(yǎng)!”中學(xué)男孩全碳水飲食,吃出可憐面相

      妍妍教育日記
      2026-05-12 17:35:01
      NBA季后賽明天5月14日賽程:天王山大戰(zhàn)!活塞主場PK騎士

      NBA季后賽明天5月14日賽程:天王山大戰(zhàn)!活塞主場PK騎士

      薇說體育
      2026-05-13 17:06:36
      撕破偽裝后的日本,為何會讓英法反應(yīng)如此強(qiáng)烈?

      撕破偽裝后的日本,為何會讓英法反應(yīng)如此強(qiáng)烈?

      泠泠說史
      2026-05-13 21:10:19
      樊振東話題熱度飆升!名嘴揭露與國際乒聯(lián)矛盾,記者現(xiàn)場提問被拒

      樊振東話題熱度飆升!名嘴揭露與國際乒聯(lián)矛盾,記者現(xiàn)場提問被拒

      一枚野球君
      2026-05-13 20:47:11
      詐完中國又訛歐洲,越南高鐵一桃殺四士玩過火,遲早要把自己點(diǎn)了

      詐完中國又訛歐洲,越南高鐵一桃殺四士玩過火,遲早要把自己點(diǎn)了

      瀲滟晴方DAY
      2026-05-13 11:34:24
      OPPO余某“底褲”被扒光!知情人曝更多 難怪敢囂張恐被公司開除

      OPPO余某“底褲”被扒光!知情人曝更多 難怪敢囂張恐被公司開除

      天天熱點(diǎn)見聞
      2026-05-12 04:54:10
      2026-05-13 21:52:49
      moonfdd incentive-icons
      moonfdd
      福大大架構(gòu)師每日一題
      1223文章數(shù) 68關(guān)注度
      往期回顧 全部

      科技要聞

      騰訊一季度營收1964.6億元 同比增9%

      頭條要聞

      媒體:黃仁勛絕非"順路同行" 而是美方刻意納入的籌碼

      頭條要聞

      媒體:黃仁勛絕非"順路同行" 而是美方刻意納入的籌碼

      體育要聞

      14年半,74萬,何冰嬌沒選那條更安穩(wěn)的路

      娛樂要聞

      白鹿掉20萬粉,網(wǎng)友為李晨鳴不平

      財(cái)經(jīng)要聞

      美國總統(tǒng)特朗普抵達(dá)北京

      汽車要聞

      C級純電轎跑 吉利銀河"TT"申報(bào)圖來了

      態(tài)度原創(chuàng)

      家居
      旅游
      手機(jī)
      房產(chǎn)
      軍事航空

      家居要聞

      內(nèi)在自敘,無域有方

      旅游要聞

      中國新文創(chuàng)市集集結(jié)各地文創(chuàng),五大演藝專區(qū)百場演出好戲不斷

      手機(jī)要聞

      好消息:安卓17已正式發(fā)布!壞消息:留給開發(fā)者的時(shí)間不多了!

      房產(chǎn)要聞

      卷瘋了!最低殺到7字頭!手握30萬,??跇鞘袡M著走!

      軍事要聞

      沙特被指3月曾對伊朗發(fā)動(dòng)多次“報(bào)復(fù)性”空襲

      無障礙瀏覽 進(jìn)入關(guān)懷版 主站蜘蛛池模板: 精品日本一区二区| 欧美三级乱人伦电影| 老太脱裤子让老头玩xxxxx| 久久成人影院精品777| 久久精品免费视看国产成人| 亚洲av成人无码精品电影在线| 亚洲深深色噜噜狠狠网站| 午夜成人精品福利网站在线观看| 狠狠躁夜夜躁人人爽天天不卡软件| 免费涩涩18网站入口| 亚洲人成电影网站图片| 亚洲熟女av超清一区二区三区| 亚洲国产精品一区二区三| 精品制服丝袜亚洲专区| 国产亚av手机在线观看| 国产三级av在线播放| 青青青国产精品一区二区| 肉色欧美久久久久久久免费看| 精品人妻一区无码视频| 欧美国产日产一区二区| 国产 高清 无码 在线播放| 精品亚洲国产成人AV制服丝袜| 国产产无码乱码精品久久鸭| 亚洲成av人片天堂网九九| 又黄又硬又粗av影视在线观看| 人妻丝袜中文无码AV影音先锋专区| 国产精成人品| 亚洲性日韩精品一区二区| 久久91精品牛牛| 日韩一区二区超清视频| 久久精品国产99久久丝袜| 琪琪女色窝窝777777| 美女91社| 亚洲欧洲日产国码无码av野外| 羞羞色男人的天堂| 人妻人人做人做人人爱| 国精一二二产品无人区免费应用 | 久久人人97超碰国产公开 | 任我爽精品视频在线观看| 中文亚洲成A人片在线观看| 日韩av激情在线|