mirror of
https://github.com/arch3rPro/1Panel-Appstore.git
synced 2026-04-14 07:57:12 +08:00
8.2 KiB
8.2 KiB
OpenDeepWiki
AI驱动的代码知识库
功能 Features
- 快速转换:支持将所有GitHub、GitLab、Gitee、Gitea等代码仓库几分钟内转换为知识库。
- 多语言支持:支持所有编程语言的代码分析和文档生成。
- 代码结构图:自动生成Mermaid图,帮助理解代码结构。
- 自定义模型支持:支持自定义模型和自定义API,灵活扩展。
- AI智能分析:基于AI进行代码分析和代码关系理解。
- SEO友好:基于Next.js生成SEO友好型文档和知识库,方便搜索引擎抓取。
- 对话式交互:支持与AI对话,获取代码详细信息和使用方法,深入理解代码。
特性清单 Feature List
- 支持多代码仓库(GitHub、GitLab、Gitee、Gitea等)
- 支持多编程语言(Python、Java、C#、JavaScript等)
- 支持仓库管理(增删改查仓库)
- 支持多AI提供商(OpenAI、AzureOpenAI、Anthropic等)
- 支持多数据库(SQLite、PostgreSQL、SqlServer、MySQL等)
- 支持多语言(中文、英文、法文等)
- 支持上传ZIP文件和本地文件
- 提供数据微调平台,生成微调数据集
- 支持目录级仓库管理,动态生成目录和文档
- 支持仓库目录修改管理
- 支持用户管理(增删改查用户)
- 支持用户权限管理
- 支持仓库级别生成不同微调框架数据集
项目介绍 Project Introduction
OpenDeepWiki是一个开源项目,灵感来源于DeepWiki,基于.NET 9和Semantic Kernel开发。旨在帮助开发者更好地理解和利用代码库,提供代码分析、文档生成和知识图谱构建等功能。
主要功能:
- 分析代码结构
- 理解仓库核心概念
- 生成代码文档
- 自动生成代码的README.md
- 支持MCP(Model Context Protocol)协议
MCP支持
OpenDeepWiki支持MCP协议:
- 可以作为单仓库的MCPServer,进行仓库分析。
示例配置:
{
"mcpServers": {
"OpenDeepWiki":{
"url": "http://Your OpenDeepWiki service IP:port/sse?owner=AIDotNet&name=OpenDeepWiki"
}
}
}
- owner:仓库所属组织或拥有者名称
- name:仓库名称
添加仓库后,可通过提问测试,如“什么是OpenDeepWiki?”,效果如下图所示:
这样,OpenDeepWiki可作为MCPServer,供其他AI模型调用,方便分析和理解开源项目。
🚀 快速开始 Quick Start
- 克隆仓库
git clone https://github.com/AIDotNet/OpenDeepWiki.git
cd OpenDeepWiki
- 修改
docker-compose.yml中环境变量配置:
- OpenAI示例:
services:
koalawiki:
environment:
- KOALAWIKI_REPOSITORIES=/repositories
- TASK_MAX_SIZE_PER_USER=5 # AI每用户最大并行文档生成任务数
- CHAT_MODEL=DeepSeek-V3 # 模型需支持函数调用
- ANALYSIS_MODEL= # 用于生成仓库目录结构的分析模型
- CHAT_API_KEY= # 你的API Key
- LANGUAGE= # 默认生成语言,如“Chinese”
- ENDPOINT=https://api.token-ai.cn/v1
- DB_TYPE=sqlite
- MODEL_PROVIDER=OpenAI # 模型提供商,支持OpenAI、AzureOpenAI、Anthropic
- DB_CONNECTION_STRING=Data Source=/data/KoalaWiki.db
- EnableSmartFilter=true # 是否启用智能过滤,影响AI获取仓库文件目录能力
- UPDATE_INTERVAL # 仓库增量更新间隔,单位天
- MAX_FILE_LIMIT=100 # 上传文件最大限制,单位MB
- DEEP_RESEARCH_MODEL= # 深度研究模型,空则使用CHAT_MODEL
- ENABLE_INCREMENTAL_UPDATE=true # 是否启用增量更新
- ENABLE_CODED_DEPENDENCY_ANALYSIS=false # 是否启用代码依赖分析,可能影响代码质量
- ENABLE_WAREHOUSE_COMMIT=true # 是否启用仓库提交
- ENABLE_FILE_COMMIT=true # 是否启用文件提交
- REFINE_AND_ENHANCE_QUALITY=true # 是否精炼并提高质量
- ENABLE_WAREHOUSE_FUNCTION_PROMPT_TASK=true # 是否启用仓库功能提示任务
- ENABLE_WAREHOUSE_DESCRIPTION_TASK=true # 是否启用仓库描述任务
- CATALOGUE_FORMAT=compact # 目录结构格式 (compact, json, pathlist, unix)
- ENABLE_CODE_COMPRESSION=false # 是否启用代码压缩
- AzureOpenAI和Anthropic配置类似,仅需调整
ENDPOINT和MODEL_PROVIDER。
数据库配置
SQLite (默认)
- DB_TYPE=sqlite
- DB_CONNECTION_STRING=Data Source=/data/KoalaWiki.db
PostgreSQL
- DB_TYPE=postgres
- DB_CONNECTION_STRING=Host=localhost;Database=KoalaWiki;Username=postgres;Password=password
SQL Server
- DB_TYPE=sqlserver
- DB_CONNECTION_STRING=Server=localhost;Database=KoalaWiki;Trusted_Connection=true;
MySQL
- DB_TYPE=mysql
- DB_CONNECTION_STRING=Server=localhost;Database=KoalaWiki;Uid=root;Pwd=password;
🔍 工作原理 How It Works
OpenDeepWiki利用AI实现:
- 克隆代码仓库本地
- 读取.gitignore配置,忽略无关文件
- 递归扫描目录获取所有文件和目录
- 判断文件数量是否超过阈值,超过则调用AI模型智能过滤目录
- 解析AI返回的目录JSON数据
- 生成或更新README.md
- 调用AI模型生成仓库分类信息与项目总览
- 清理项目分析标签内容并保存项目总览到数据库
- 调用AI生成思考目录(任务列表)
- 递归处理目录任务,生成文档目录结构
- 保存目录结构到数据库
- 处理未完成的文档任务
- 若为Git仓库,清理旧提交记录,调用AI生成更新日志并保存
OpenDeepWiki 仓库解析成文档详细流程图
graph TD
A[克隆代码仓库] --> B[读取.gitignore配置忽略文件]
B --> C[递归扫描目录获取所有文件和目录]
C --> D{文件数量是否超过阈值}
D -- 否 --> E[直接返回目录结构]
D -- 是 --> F[调用AI模型进行目录结构智能过滤]
F --> G[解析AI返回的目录JSON数据]
E --> G
G --> H[生成或更新README.md]
H --> I[调用AI模型生成仓库分类信息]
I --> J[调用AI模型生成项目总览信息]
J --> K[清理项目分析标签内容]
K --> L[保存项目总览到数据库]
L --> M[调用AI生成思考目录任务列表]
M --> N[递归处理目录任务,生成DocumentCatalog]
N --> O[保存目录结构到数据库]
O --> P[处理未完成的文档任务]
P --> Q{仓库类型是否为Git}
Q -- 是 --> R[清理旧的提交记录]
R --> S[调用AI生成更新日志]
S --> T[保存更新日志到数据库]
Q -- 否 --> T
高级配置 Advanced Configuration
环境变量 Environment Variables
KOALAWIKI_REPOSITORIES:仓库存储路径TASK_MAX_SIZE_PER_USER:AI每用户最大并行文档生成任务数CHAT_MODEL:聊天模型(需支持函数调用)ENDPOINT:API端点ANALYSIS_MODEL:用于生成仓库目录结构的分析模型CHAT_API_KEY:API密钥LANGUAGE:生成文档语言DB_TYPE:数据库类型,支持sqlite、postgres、sqlserver、mysql(默认:sqlite)MODEL_PROVIDER:模型提供商,默认OpenAI,支持AzureOpenAI、AnthropicDB_CONNECTION_STRING:数据库连接字符串EnableSmartFilter:是否启用智能过滤,影响AI获取仓库目录能力UPDATE_INTERVAL:仓库增量更新间隔(天)MAX_FILE_LIMIT:上传文件最大限制(MB)DEEP_RESEARCH_MODEL:深度研究模型,空则使用CHAT_MODELENABLE_INCREMENTAL_UPDATE:是否启用增量更新ENABLE_CODED_DEPENDENCY_ANALYSIS:是否启用代码依赖分析,可能影响代码质量ENABLE_WAREHOUSE_COMMIT:是否启用仓库提交ENABLE_FILE_COMMIT:是否启用文件提交REFINE_AND_ENHANCE_QUALITY:是否精炼并提高质量ENABLE_WAREHOUSE_FUNCTION_PROMPT_TASK:是否启用仓库功能提示任务ENABLE_WAREHOUSE_DESCRIPTION_TASK:是否启用仓库描述任务CATALOGUE_FORMAT:目录结构格式 (compact, json, pathlist, unix)ENABLE_CODE_COMPRESSION:是否启用代码压缩

