快速开始
欢迎使用识文君!本指南将帮助您快速上手,开始您的PDF文字识别之旅。
🚀 第一步:下载安装
系统要求
- macOS: 10.15+ (支持 Intel 和 Apple Silicon)
- Windows: Windows 10/11 x64
- Linux: Ubuntu 18.04+, CentOS 7+, 或其他主流发行版
下载应用
- 访问 GitHub Releases
- 下载适合您系统的版本
- 按照系统提示完成安装
提示
首次启动时,应用会自动显示关于页面,介绍主要功能。
⚙️ 第二步:安装依赖
识文君需要 libvips 库来处理PDF和图像。请根据您的系统安装:
macOS
brew install vips
Windows
GitHub官方: vips-dev-w64-all-8.12.2.zip
- 网盘下载: TeraCloud网盘 (免登录下载)
详细配置步骤:
- 解压文件: 将下载的zip文件解压到D盘根目录
- 配置环境变量:
- 右键"此电脑" → "属性" → "高级系统设置"
- 点击"环境变量"按钮
- 在"系统变量"中找到"Path",点击"编辑"
- 点击"新建",添加:
D:\vips-dev-w64-all-8.12.2\bin
- 点击"确定"保存所有设置
- 验证安装:
- 重启命令提示符
- 输入
vips --version
验证安装成功
Linux (Ubuntu/Debian)
sudo apt-get install libvips-dev
重要
如果依赖缺失,应用启动时会显示相应提示。请按提示安装后重新启动应用。
🤖 第三步:配置AI服务
识文君支持多种AI服务,您可以根据需求选择:
支持的AI服务
服务 | 特点 | 推荐用途 |
---|---|---|
OpenAI | 高精度,支持复杂文档 | 重要文档处理 |
Google Gemini | 多语言支持优秀 | 多语言文档 |
Pollinations | 免费使用 | 日常文档处理 |
自定义服务 | 兼容OpenAI接口 | 企业内部部署 |
配置步骤
- 点击顶部工具栏的"设置"按钮
- 在AI配置区域选择预设模板
- 填入您的API密钥和相关配置
- 选择OCR模型和文本处理模型
- 点击💾按钮保存配置
API密钥获取
- OpenAI: 访问 platform.openai.com
- Google Gemini: 访问 ai.google.dev
- Pollinations: 无需API密钥,可直接使用
📄 第四步:开始识别
加载文档
- 点击界面中的"选择文件"按钮
- 选择PDF文件(当前仅支持PDF格式)
- 等待文档加载完成
- 在左侧预览区查看文档内容
文字识别
- 选择要处理的页面(可单页或多页)
- 点击"开始处理"按钮
- 观察处理进度,等待识别完成
- 在右侧查看识别结果
编辑和优化
- 点击页面右侧的"编辑文本"按钮
- 在编辑器中修改识别结果
- 使用"AI处理"功能进一步优化文本
- 保存更改
📤 第五步:导出结果
支持的格式
- TXT: 纯文本格式
- Markdown: 支持格式化文本
- Word: DOCX格式,适合正式文档
- HTML: 网页格式
- RTF: 富文本格式
导出方式
单页导出:
- 在页面右侧点击"导出"按钮
- 选择导出格式和内容类型
- 点击"导出"完成
批量导出:
- 点击"历史记录"按钮
- 查看所有处理过的文档
- 选择导出格式
- 批量导出所有结果
🎉 完成!
恭喜您已经掌握了识文君的基本使用方法!
下一步
小贴士
建议先用小文档测试,熟悉操作流程后再处理大批量文档。