完整实现 Tauri + Vanilla JS 轻量级截图工具 Phase 1 - 项目搭建 - Tauri 2.x 项目初始化 - Vite 前端项目搭建 - 基础 UI 框架(CSS 变量、组件库) - 构建配置优化 Phase 2 - 核心截图功能 - 全屏/区域/窗口截图 - 截图预览和管理 - 文件命名和缩略图 - 全局快捷键集成 Phase 3 - 上传与存储 - 多图床上传(GitHub/Imgur/自定义) - 配置管理系统 - SQLite 数据库 Phase 4 - OCR 集成 - 云端 OCR(百度/腾讯云) - 插件管理系统 - 本地 OCR 插件(Go) - OCR 结果处理 Phase 5 - AI 分类系统 - Claude/OpenAI API 集成 - Prompt 模板引擎 - 模板管理界面 - 自动分类流程 Phase 6 - 历史记录与管理 - 图库视图(网格/列表) - 搜索与筛选 - 批量操作 - 导出功能(JSON/CSV/ZIP) Phase 7 - 打包与发布 - 多平台构建配置 - CI/CD 工作流 - 图标和资源 - 安装包配置 Co-Authored-By: Claude Opus 4.6 <noreply@anthropic.com>
2.2 KiB
2.2 KiB
CutThenThink OCR Plugin
本地 OCR 插件,基于 Tesseract OCR 引擎实现。
功能特性
- 支持多语言识别(中文、英文、日文、韩文等)
- 返回文本内容和边界框信息
- 提供置信度评分
- 跨平台支持(Windows、macOS、Linux)
系统依赖
Linux (Ubuntu/Debian)
sudo apt-get install tesseract-ocr
sudo apt-get install tesseract-ocr-chi-sim # 简体中文
sudo apt-get install tesseract-ocr-chi-tra # 繁体中文
sudo apt-get install libtesseract-dev
macOS
brew install tesseract
brew install tesseract-lang # 包含中文语言包
Windows
- 下载安装 Tesseract from UB Mannheim
- 将 Tesseract 安装目录添加到 PATH 环境变量
- 安装中文语言包
编译
# 下载依赖
go mod download
# 编译当前平台
go build -o ocr-plugin main.go
# 交叉编译
GOOS=windows GOARCH=amd64 go build -o ocr-plugin.exe main.go
GOOS=darwin GOARCH=amd64 go build -o ocr-plugin-mac main.go
GOOS=linux GOARCH=amd64 go build -o ocr-plugin-linux main.go
使用
查看版本
./ocr-plugin version
识别文本
./ocr-plugin recognize -image /path/to/image.png -lang eng+chi_sim
参数说明
-image: 图片文件路径(必需)-lang: OCR 语言(默认: eng+chi_sim)
支持的语言代码
eng- Englishchi_sim- 简体中文chi_tra- 繁体中文jpn- Japanesekor- Korean
输出格式
成功响应
{
"success": true,
"engine": "tesseract",
"language": "eng+chi_sim",
"blocks": [
{
"text": "识别的文本",
"confidence": 95.5,
"bbox_x": 100,
"bbox_y": 200,
"bbox_width": 150,
"bbox_height": 30,
"block_type": "text"
}
]
}
错误响应
{
"success": false,
"error": "错误信息"
}
性能优化
- 图片预处理: 在识别前对图片进行降噪、二值化处理可提高准确率
- 语言选择: 只加载需要的语言包可以提高速度
- 图片尺寸: 过大的图片会降低识别速度,建议缩放到合理尺寸
许可证
MIT License