实习双周报 (第 7-8 周)
刘晓枫 | 2025年7月28日
目录 AGENDA
1. LangGraph 工作流优化
2. MCP 工具集拓展
3. Dify 平台实践
4. 问题与思考
1. LangGraph 工作流优化
ReAct Agent 工作流
- 以 HTTP 方式集成至 Dify 平台进行调用。
- 核心功能与提示词优化,提升工具调用准确性。
- 基于多个实际工单进行测试,验证流程有效性。
- 归纳并形成标准化测试用例集,为后续评估提供基准。
1. LangGraph 工作流优化
代码助手工作流
技术迭代
- 本地知识库: 从 ChromaDB 迁移至 Faiss,完成调试与验证。
- 云端知识库: 升级为 RAGFlow,并同步优化整体结构与提示词。
后续规划与实现
- 代码知识库更新: 探索并实现代码知识库的自动化、增量化更新机制。
- RAGFlow 文档 MCP: 完善 RAGFlow 文档更新相关的 MCP 工具。
- 实现方式: 计划通过“下载文档 -> 在内存/本地修改 -> 上传新文档 -> 删除旧文档”的原子操作,确保数据一致性。
2. MCP 工具集拓展
新增核心工具
- GitLab 文件获取: 支持从代码仓库直接拉取文件。
- RAGFlow QA 上传: 支持将字符串直接上传至 QA 知识库。
维护与优化
- 更新部分 MCP 工具的版本号。
- 修复了工具参数类型在前端不显示的问题。
- (探索) 上传 chunk 到文档 (功能可用但解析效果不佳)。
3. Dify 平台实践
- 算法问题排查工作流: 新增 QA 对上传至 RAGFlow 知识库功能,实现知识沉淀闭环。
- Nacos 插件集成探索: 调研 Dify 对 Nacos 官方插件的支持,以简化已部署 MCP 工具的调用。
- 成果输出: 构建了 Nacos 集成示例工作流,并输出标准操作流程(SOP),便于团队复用。
4. 问题与思考 (1/3)
RAGFlow QA 上传方案
- 问题: LangGraph 中 Answer 为 Markdown 源码,其包含的 `\t` 会导致 RAGFlow 异常分块。
- 尝试: 直接上传二进制字符串失败,但上传包含 Q/A 两列的 XLSX 文件可成功解析。
- 风险: 若保存 Excel 文件至本地再上传,未来部署可能引入文件误删或权限问题。
- 当前方案: 在内存中创建虚拟 Excel 二进制文件进行上传,规避本地文件操作,稳定可靠。
4. 问题与思考 (2/3)
MCP 部署 - 知识库权限管理
- 现状: 代码助手 LangGraph 工作流位于 `mcp_algo`,存在 RAGFlow 权限问题。
- 思考: 是否应由管理员账户统一创建各领域知识库?
- 优点1: 知识库对团队可见,便于共享与协作。
- 优点2: API KEY 可配置为环境变量,简化用户操作,无需自建。
- 优点3: 避免因个人创建知识库导致信息孤岛和知识冗余。
4. 问题与思考 (3/3)
MCP 部署 - 架构演进
- 挑战: ReAct Agent 需调用现有 MCP 服务,部署时需要处理网络端口和访问隔离。
- 未来架构设想:
- 轻度使用: 用户本地 Clone 仓库运行,不独立部署。
- 中度使用: 建立高层 MCP 服务,统一管理 LangGraph 工作流,并调用底层基础工具。
- 重度使用: 高层 MCP 服务按领域进行划分,应对复杂的业务需求和隔离。