MinerU 是一款由上海人工智能實(shí)驗(yàn)室 OpenDataLab 團(tuán)隊(duì)開發(fā)的開源高質(zhì)量數(shù)據(jù)提取工具,專注于從復(fù)雜 PDF 文檔、網(wǎng)頁(yè)和電子書中高效提取內(nèi)容。它能夠?qū)瑘D片、公式和表格的多模態(tài) PDF 轉(zhuǎn)化為 Markdown 格式(如 markdown、json),且具備高精度解析工具鏈,支持多種輸入模型,支持自動(dòng)識(shí)別亂碼、轉(zhuǎn)換公式為 LaTex、保留文檔結(jié)構(gòu),支持 176 種語言的準(zhǔn)確識(shí)別,適用于學(xué)術(shù)、財(cái)務(wù)、法律等領(lǐng)域,兼容 Windows/Linux/Mac 平臺(tái)。
正文完
2024-08-24