02:50 · Mar 21, 2025 · Fri 📣 #发现频道[开源] 扫描件 PDF 转 Markdown / EPUB,自动修复 OCR 错误https://meta.appinn.net/t/topic/67857 小众软件官方论坛 [开源] 扫描件 PDF 转 Markdown / EPUB,自动修复 OCR 错误 最近我们开源了一个 PDF 处理工具 - pdf-craft,专注于解决扫描书籍 PDF 转换的痛点,让书籍数字化更智能。pdf-craft 支持将 PDF 转为 Markdown 和 EPUB,智能处理文本、图表、公式等内容,适用于技术文档、书籍数字化、论文研究等场景。 痛点与解决方案 PDF 不便于移动设备阅读:将 PDF 转为 EPUB,适配各种屏幕大小 书籍结构混乱:智能分析章节、目录,重建结构化内容 注释和引用难以追踪:使用 LLM 智能处理注释和引用 OCR 识别错误多:结合 LLM 自动矫正识别错误…