313e1f40d8d5788211f871445aa73cd7645e02f2
重大更改: 1. requirements.txt - 移除 paddleocr/paddlepaddle,使用纯 API 版本 2. src/core/ocr.py - 完全重写 - 移除 PaddleOCREngine 和 ensure_paddleocr() - 移除 numpy 依赖(不再需要) - 实现完整的 CloudOCREngine - 支持百度/腾讯/阿里云 OCR API - 添加自定义 API 支持 3. src/config/settings.py - 简化 OCR 配置 - OCRMode 枚举仅保留 CLOUD - OCRConfig 添加 provider 字段 4. src/core/__init__.py - 移除 PaddleOCREngine 导出 5. src/gui/main_window.py - 移除 ensure_paddleocr 导入 6. build.bat/build.sh - 简化构建参数 - 移除所有 ML 库的 --exclude-module - 移除 pyi_hooks 依赖 - 添加 openai/anthropic hidden-import 测试: - ✓ 所有核心模块导入成功 - ✓ 没有 PaddleOCR 相关错误 Co-Authored-By: Claude Opus 4.6 <noreply@anthropic.com>
CutThenThink
智能截图OCR与AI分析工具
项目简介
CutThenThink 是一款基于 PyQt6 的桌面应用程序,集成了OCR文字识别和AI智能分析功能。用户可以通过截图、选择区域,然后使用OCR提取文字,并利用多种AI模型进行智能分析和处理。
主要功能
- 智能截图: 支持多种方式截图(矩形选择、窗口选择、全屏等)
- OCR识别: 基于PaddleOCR的高精度文字识别
- AI分析: 支持多种AI模型(OpenAI GPT、Anthropic Claude等)
- 内容编辑: 内置编辑器,支持图片标注和文字编辑
- 历史记录: 本地数据库保存所有截图和分析记录
- 快捷操作: 全局快捷键支持,快速截图和分析
技术栈
- GUI框架: PyQt6 6.6.1
- 数据库: SQLAlchemy 2.0.25
- OCR引擎: PaddleOCR 2.7.0.3
- AI模型: OpenAI API、Anthropic API
- 图像处理: Pillow 10.0.0
安装
环境要求
- Python 3.8+
- 操作系统: Windows / macOS / Linux
安装步骤
- 克隆项目
git clone <repository_url>
cd CutThenThink
- 创建虚拟环境
python -m venv venv
source venv/bin/activate # Linux/macOS
# 或
venv\Scripts\activate # Windows
- 安装依赖
pip install -r requirements.txt
- 配置AI服务
创建配置文件 config.yaml:
ai:
provider: "openai" # 或 "anthropic"
openai:
api_key: "your-openai-api-key"
model: "gpt-4"
anthropic:
api_key: "your-anthropic-api-key"
model: "claude-3-sonnet-20240229"
使用方法
启动应用:
python src/main.py
默认快捷键:
Ctrl+Shift+A: 截图并分析Ctrl+Shift+S: 仅截图Ctrl+Shift+H: 打开历史记录Esc: 取消截图
项目结构
CutThenThink/
├── src/
│ ├── gui/ # GUI组件
│ │ ├── widgets/ # 自定义控件
│ │ └── styles/ # 样式文件
│ ├── core/ # 核心功能
│ ├── models/ # 数据模型
│ ├── config/ # 配置管理
│ └── utils/ # 工具函数
├── data/ # 数据目录
│ ├── images/ # 截图存储
│ └── database/ # 数据库文件
├── requirements.txt # 项目依赖
├── .gitignore # Git忽略文件
└── README.md # 项目说明
开发计划
- 项目初始化
- 基础GUI框架搭建
- 截图功能实现
- OCR识别集成
- AI分析功能
- 数据库存储
- 历史记录管理
- 配置系统
- 快捷键支持
- 打包发布
贡献指南
欢迎提交Issue和Pull Request!
许可证
MIT License
联系方式
- 项目地址: [GitHub Repository]
- 问题反馈: [Issues]
Description
Languages
Python
72.2%
HTML
24.2%
Batchfile
2.8%
Shell
0.8%