一款使用AI来解析PDF的开源工具:gptpdf

一款使用AI来解析PDF的开源工具:gptpdf

1、使用 PyMuPDF 库,对 PDF 进行解析出所有非文本区域,并做好标记 2、使用视觉大语言模型(如 GPT-4o)将 PDF 解析为 markdown。 我们的方法非常简单(只有293行代码),但几乎可以完美地解析排版、数学公式、表格、图片、图表等。

每页平均价格:0.013 美元

项目地址:

https://github.com/CosmosShadow/gptpdf

本文地址:https://www.163264.com/8558

(1)
上一篇 2024年7月3日 下午10:03
下一篇 2024年7月4日 上午7:16

相关推荐