知微 · 自主AI智能体平台

款多多出品 —— 一个能自主思考、主动行动、自然沟通的企业级AI系统。
不是"工具",不是"API"—— 而是一个完整的、独立的AI智能体。

自主Agent LLM推理引擎 知识图谱 MCP+A2A+ANP协议 实时情报 插件市场 全球全景追踪(23源) 双向AI协同(3组测试)
80
总参考文献
23
学术论文
15
工程案例
33
可视化/UI文献
9
AI自我进化文献
6
Phase实施
3
自我进化闭环
23
追踪一手源

概览

一句话定义

款多多出品的自主AI智能体平台 —— 自主思考、主动行动、自然沟通

不是"款多多公司的情报工具"→ 而是"款多多出品、可用于任何行业的通用AI平台"

升级路径 v7.0 → v8.0

维度v7.0 (当前)v8.0 (目标)
定位款多多公司智能情报与知识管理款多多出品的通用自主AI智能体平台
推理引擎单一API调用MiniMaxLLM驱动ReAct Agent Loop
交互方式被动查询(用户来找)主动推送 + 自然对话 + 常驻Agent
系统形态API端点集合完整自主Agent系统
适用范围款多多专用通用平台(款多多=第一个客户)

对标矩阵升级

对标对象v7.0对法v8.0对法
Palantir AIP没对标Ontology设计 + Agent推理闭环 → 开源版Palantir
OpenAI Operator没对标自主Agent行动能力 + 知识图谱增强
Anthropic Claude Code没对标Agent Loop架构(扩展到全行业)
Dataminr PreGenAI没对标实时预测性情报 + 中文KG增强
腾讯CodeBuddy没对标通用Agent平台(专注知识管理≠代码)
Google Gemini比了但无力 放弃(不是模型公司)

核心依据

本规划基于 43篇 权威参考文献的交叉验证(含6篇AI自我进化新增):

7篇综述论文 6篇会议/期刊论文 8篇arXiv预印本 7个商业系统案例 5个开源框架 3份行业报告 6篇AI自我进化专题

Phase概览

Phase 0
0天 · 0行代码
定位重构
Phase 1
2天 · ~350行
Agent内核+记忆
Phase 2
1天 · ~180行
主动感知+沟通
Phase 3
1天 · ~200行
通用平台化
Phase 4
2天 · ~300行
全栈自主
Phase 5
11天 · ~1800行
可视化升级
Phase 6
3天 · ~500行
AI自我进化闭环

定位升级宣言

为什么必须升级
旧限制后果
绑定款多多外部客户自动排除
被动工具形态2183实体+37万关系无人主动使用
对标错位应该对标Palantir却对标了Google
核心逻辑
# CORE_SETTINGS第一条:做到中国最好的多AI Agent协同系统 # ↓ 瓶颈:当前只是"情报工具",不是"智能体系统" # ↓ 方案:从"款多多专用" → "款多多出品"的通用平台 # ↓ 逻辑:Palantir不为一家军工企业值$100B # CodeBuddy不为腾讯内部值这个价 # 知微要做好→必须通用化→款多多是第一个深度客户

行业部署模式

款多多(发源地) ↓ 沉淀核心Agent能力 知微通用AI Agent平台 ├── 金融版(风控+情报) ├── 医疗版(药物+临床) ├── 教育版(知识+RAG) └── 通用版(企业知识管理) 每次行业扩展只替换:行业图谱 + 行业插件 + 行业Prompt 核心Agent Loop 不改变

️ 自主AI智能体架构

5层架构总览

┌───────────────────────────────────────────────────┐ │ 用户交互层 │ │ Web UI(/agent) │ 聊天 │ 推送 │ API │ └──────────────────────┬────────────────────────────┘┌──────────────────────┴────────────────────────────┐ │ Agent引擎层 (CORE) │ │ │ │ while not done: │ │ state = perceive() # 感知 │ │ plan = llm_reason() # LLM推理 │ │ result = act(plan) # 工具调用 │ │ memory.save(...) # 记忆存储 │ │ reflect(result) # 自我评估 │ │ │ │ 规划器 │ 推理器 │ 执行器 │ 评估器 │ └──────────────────────┬────────────────────────────┘┌──────────────────────┴────────────────────────────┐ │ 工具与协议层 │ │ MCP工具集 │ A2A协议 │ 自有工具集 │ 插件市场 │ └──────────────────────┬────────────────────────────┘┌──────────────────────┴────────────────────────────┐ │ 记忆与知识层 │ │ L1工作 │ L2情景 │ L3语义(KG) │ L4-L5程序+全局 │ │ 知识图谱(2183实体) │ ChromaDB │ 进化史记(7表) │ └──────────────────────┬────────────────────────────┘┌──────────────────────┴────────────────────────────┐ │ 基础设施层 │ │ Wiki.js(:6001)│AI(:6002)│工作流(:6003) │ │ Chroma(:6004)│MCP(:6005)│PostgreSQL │ └───────────────────────────────────────────────────┘

Agent Loop核心

设计参考:arXiv:2504.19678 (ReAct综述) + arXiv:2604.14228 (Claude Code架构)

# services/agent_engine.py — 知微自主Agent引擎 class ZhiweiAgent: MAX_LOOP_STEPS = 30 # 单任务最大步骤 MAX_EXECUTION_SECONDS = 120 # 单任务最长耗时秒 def run(self, user_input, context=None): # 主入口: Agent Loop state = {"input": user_input, "done": False} while not state["done"]: state["perception"] = self._perceive(state) # Step 1: 感知 plan = self._reason(state) # Step 2: LLM推理 if not plan: break # 任务完成 result = self._act(plan) # Step 3: 执行 self.memory.save(result) # Step 4: 记忆 state["reflection"] = self._reflect(state) # Step 5: 评估 return state["result"] def _reason(self, state): # LLM推理 → 决定下一步 # prompt = build_prompt(state) # response = call_llm(prompt) # return {"tool": "query_kg", "params": {...}} return None

记忆系统设计

参考:arXiv:2512.13564 (记忆综述)

层级类型存储生命周期
L1工作记忆Python dict单次对话
L2情景记忆SQLite + ChromaDB~30天
L3语义记忆知识图谱(已有)永久
L4程序记忆Python函数版本控制
L5全局记忆SQLite永久

工具系统

工具功能来源
query_kg知识图谱查询复用kg_db.py
search_web联网搜索复用web_learner.py
create_wiki_page创建Wiki页面复用wiki_client.py
send_alert推送告警新增
execute_sql数据库查询新增
call_llmLLM推理复用llm_service.py

全网36篇参考文献

每条引用均包含完整元数据:名称/作者/年份/来源/URL/核心发现/对知微的指导

A. 综述与调查 (7篇)

#1 From LLM Reasoning to Autonomous AI Agents: A Comprehensive Review
Ferrag, Tihanyi, Debbah | 2025 (v2: 2026-03) | arXiv:2504.19678
核心发现:60个基准分类法+AI Agent框架综述+MCP/A2A/ACP三大协议并排
对知微的指导:Agent Loop架构设计参考 + 协议兼容策略
#2 The Orchestration of Multi-Agent Systems: Architectures, Protocols, and Practices
AI Insight | 2026-01 | arXiv:2601.13671
核心发现:MCP和A2A协议为多Agent互操作提供结构化通信标准
对知微的指导:多Agent编排协议选型 — 先MCP后A2A
#3 Agentic AI: A Comprehensive Survey of Architectures
Springer | 2026-01 | DOI: 10.1007/s10462-025-11422-4
核心发现:符号系统主导安全领域,神经系统主导数据丰富场景,混合架构最优
对知微的指导:知微采用混合架构:规则(安全)+LLM推理(灵活性)
#4 Memory in the Age of AI Agents
2025-12 | arXiv:2512.13564
核心发现:新分类法替代传统长/短期记忆二分法
对知微的指导:L1-L5分层记忆系统设计的理论基础
#5 AI Agent 最新发展论文全面综述 (2024-2026)
AI Insight | 2026-05 | Pro Report
核心发现:5大维度(感知推理/记忆/MAS/工具/安全)121篇核心论文
对知微的指导:知微功能栈与文献对照,确认无遗漏维度
#6 LLM-empowered Knowledge Graph Construction: A Survey
2025-10 | arXiv:2510.20345
核心发现:LLM重塑KG构建全流程
对知微的指导:自动化图谱构建管道设计
#7 Knowledge Graphs for AI Systems 2026
Zylos AI Research | 2026-02
核心发现:Context Graphs成为AI推理背骨
对知微的指导:知微KG升级为Agent的实时推理上下文

B. 会议/期刊论文 (6篇)

#8 KG-Agent: An Efficient Autonomous Agent for Complex Reasoning over KGs
ACL 2025 (Long Paper)
核心发现:自主LLM Agent与知识图谱交互框架
对知微的指导:知微KG→Agent核心设计模式的学术实证
#9 Memory OS of AI Agent
EMNLP 2025
核心发现:MemoryOS作为Agent记忆管理基础框架
对知微的指导:记忆持久化+向量索引的实现参考
#10 KGERA: Knowledge Graph Enhanced Reasoning Architecture
Nature Scientific Reports | 2026-03
核心发现:知识图谱增强多关系推理
对知微的指导:GraphRAG升级的学术参考
#11 A Unified Multimodal GenAI Platform with GraphRAG Multi-Agent
Nature Scientific Reports | 2026-04
核心发现:统一多模态GenAI平台+GraphRAG+多Agent
对知微的指导:知微终极架构蓝图
#12 LGKGR: A Knowledge Graph Reasoning Model Using LLMs
ScienceDirect, Neurocomputing | 2025-06
核心发现:LLM文本信息增强GNN知识图谱推理
对知微的指导:图谱增强LLM推理的技术路径
#13 LLM and AI Agents for Autonomous Systems: A Survey
IEEE | 2026-02
核心发现:LLM在自动驾驶/无人机场景的自主系统综述
对知微的指导:自主决策可靠性设计参考

C. 预印本与专题 (8篇)

#14 Why Do AI Agents Communicate in Human Language?
2025-06 | arXiv:2506.02739
核心发现:Agent间NL通信利弊分析
对知微的指导:对话设计既要自然语言也要结构化协议
#15 Dive into Claude Code: The Design Space of AI Agent Systems
Jiacheng Liu et al. | 2026-04 | arXiv:2604.14228
核心发现:Claude Code架构=纯while循环+工具调用+自我修正
对知微的指导Agent Loop核心实现范式 — 简洁就是力量
#16 Think, Act, Learn: A Framework for Autonomous Robotic Agents
Menon, Sharma et al. | 2025-07 | arXiv:2507.19854
核心发现:TAL三层框架:思考→行动→学习
对知微的指导:Agent从"思考-行动"进化到"思考-行动-学习"
#17 KARMA: Leveraging Multi-Agent LLMs for Automated KG Maintenance
2025-02 | arXiv:2502.06472
核心发现:多Agent自动维护知识图谱
对知微的指导:自动化图谱维护模式
#18 Revolutionizing KGs with Multi-Agent Systems
Ramachandran | 2025-02 | ResearchGate
对知微的指导:图谱Agent自动化路径
#19 Graph+Agent综述:结构化智能与自主决策智能
知乎技术专栏 | 2025-06
对知微的指导:图谱→Agent协同模式
#20 LLM推理到AI Agents中文综述
知乎技术专栏 | 2025-07
对知微的指导:推理链路设计
#21 Agent全面爆发!ReAct范式解读
腾讯云 | 2025-12
核心发现:ReAct=推理-行动-观察闭环
对知微的指导:ReAct核心机制落地指南

D. 商业系统案例 (7篇)

#22 Palantir AIP平台深度解析
腾讯云 | 2026-04 | Palantir Technologies
核心架构:Foundry(数据OS)+Ontology(语义层)+AIP(LLM推理)+Apollo(部署)
对知微的指导Ontology语义建模 + Agent推理闭环 — 知微"中国开源版Palantir"
#23 Dataminr PreGenAI + Crisis24
Dataminr | 2026-03
核心架构:实时事件检测 + Agentic AI + 预测性生成
对知微的指导:实时情报+预测性分析模块设计
#24 OpenAI Operator / CUA
OpenAI | 2025-01
核心架构:GPT-4o视觉+RL推理+浏览器操作
对知微的指导:自主Agent行动能力的工业级参考
#25 Anthropic Claude Code
Anthropic | 2026
核心架构:纯while循环Agent="推理→工具调用→观察→重复"
对知微的指导Agent Loop核心实现范式 — 最简洁可复现的架构
#26 Microsoft Copilot Studio 2026 Wave 1
Microsoft | 2026-04
核心架构:多Agent编排 + Fabric集成 + A2A协议
对知微的指导:多Agent编排拓扑设计参考
#27 腾讯CodeBuddy Agent SDK
腾讯 | 2026-01
核心架构:Sub-Agent协作 + Skills生态 + 安全E2B隔离
对知微的指导从专用Agent到通用平台的产品化路径 — 腾讯已验证的模式
#28 Microsoft Fabric Real-Time Intelligence
Microsoft | 2026-04
核心架构:端到端实时事件驱动方案
对知微的指导:实时情报管线的架构参考

E. 开源框架 (5篇)

#29 CrewAI
crewAIInc | GitHub | 2026
核心架构:角色扮演多Agent,独立于LangChain
对知微的指导:轻量多Agent框架参考
#30 LangGraph
LangChain Inc | 2026
核心架构:状态机Agent+有向图编排+循环控制
对知微的指导:状态管理的实现思路
#31 Neo4j LLM-Graph-Builder
Neo4j Labs | GitHub | 2026-02
核心架构:非结构化→LLM→知识图谱+FastAPI
对知微的指导:自动图谱构建管道的完整生产案例
#32 OWASP Social OSINT Agent
OWASP Foundation | 2026-04
核心架构:自主OSINT调查Agent+社交网络分析+AI推理
对知微的指导:Agent驱动OSINT模式的安全设计参考
#33 Awesome AI Agents 2026
Zijian-Ni | GitHub | 2026-03
核心架构:2026年AI Agent黄金年代精选资源列表
对知微的指导:技术选型全景参考

F. 行业报告 (3篇)

#34 The 2026 State of AI Agents Report
Rivista AI | 2025-12
核心发现:62%企业已部署AI Agent,对话式界面成为人机交互主入口
#35 The OSINT Market in 2026: Platforms and Tools
Project OSINT | 2026-04
核心发现:OSINT三大领域:人力/威胁/自动化情报
#36 2026年AI Agent技术全景:12大主流框架深度解析
腾讯云 | 2026-04
核心发现:LangGraph/CrewAI/AutoGen各有所长

知识图谱可视化升级 — Phase 5

基于 33篇 新增可视化/UI/UX参考文献,让Wiki从"电子文档"进化为"可交互的神经网络知识探索平台"。

当前问题 vs 升级目标

问题当前状态目标
界面不友好Wiki.js原生界面,功能单一暗色主题Infobox卡片+智能仪表板
内容简单只有关键词级别的描述Wikipedia风格结构化Infobox(含摘要/数据/关联)
无来源信息无URL可追溯每条数据标注source_url,一键跳转验证
无关系探索不能从实体跳转到关联实体2D力导向图+3D沉浸式探索+路径搜索
无时间线看不到事件先后顺序交互式时间线+事件序列分析

三层前端架构

Layer 1: Wiki.js 原生层 (不变) 页面/导航/编辑/搜索 — 现有全部功能保留 Layer 2: 智能卡片增强层 Web Component Infobox | 来源标注 | 关联实体列表 参照: Wikipedia Infobox + Wikidata Provenance Layer 3: 知识图谱交互探索层 2D力导向图 | 3D WebGL沉浸 | 时间线 | 路径搜索 参照: Palantir Object Explorer + Cambridge Intelligence

3个子Phase

🃏
Phase 5.1
3天 · ~500行
Infobox卡片 + 来源追溯
Phase 5.2
5天 · ~600行
2D/3D图谱 · 时间线 · 路径搜索
Phase 5.3
3天 · ~700行
情报仪表板 · Agent对话带图

Infobox卡片设计(参照Wikipedia)

┌─────────────────────────────────────────────┐ │ 杰克科技股份有限公司 │ │ ┌─────────┐ 类型: company │ │ │ [LOGO] │ 标签: #黄岩 #机器人 │ │ └─────────┘ 来源: 专题注入 │ │ │ │ ┌──────────────┬──────────────────────────┐ │ │ │ 证券代码 │ 603337 │ │ │ │ 2025营收 │ 65.87亿 │ │ │ │ 净利润 │ 8.56亿 │ │ │ └──────────────┴──────────────────────────┘ │ │ │ │ 来源: [台州市投资促进中心官网] [企业年报] │ │ 关联: 徐礼辉 · 黄岩区 · 利欧集团 │ │ 时间线: 2003→2018→2025→2026 │ └─────────────────────────────────────────────┘

交互式图谱对比

方案技术场景容量
Phase 1: vis-networkCanvas 2D快速上线~5000节点
Phase 2: Sigma.jsWebGL大图渲染~10万节点
Phase 3: 3D Force GraphThreeJS/WebGL沉浸式探索~5万节点

关键技术参考

参考来源借鉴点
📐 Wikipedia InfoboxWikipedia结构化信息卡设计
📐 Palantir Object ExplorerPalantir对象语义+关系联动
📐 MISP Event GraphMISP情报关联图+时间线
📐 Cambridge IntelligenceCambridgeKeyLines+ReGraph+KronoGraph
📐 Sigma.jsSigmaJSWebGL大图渲染
📐 3D Force GraphGitHubThreeJS沉浸式图谱
📐 GephiGephi离线图谱"Photoshop"

交付页面路径

/dashboard/ — 情报仪表板(实时统计+热点+Agent) /explorer/ — 2D交互式知识图谱(力导向) /explorer/3d — 3D沉浸式图谱(ThreeJS) /timeline/ — 实体事件时间线 /agent/ — Agent对话(带图谱可视化)

🗓️ 分阶段实施计划

时间线总览

第0天 第2天 第3天 第4天 第6天 │ │ │ │ │ Phase 0 Phase 1 Phase 2 Phase 3 Phase 4 定位重构 Agent内核 主动感知 通用平台 全栈自主 0行代码 ~350行 ~180行 ~200行 ~300行

Phase 0 — 定位重构 (P0 | 0天 | 0行代码)

#任务文件
0.1更新README定位语README.md L1
0.2更新CORE_SETTINGS对标CORE_SETTINGS.md §7
0.3创建战略文档体系docs/strategic/*.md (5篇)
0.4创建外网访问页面ai-docs/roadmap-v8.html
0.5创建NGINX路由(预留)nginx/wiki.kddauto.com.conf

Phase 1 — 自主Agent内核 (P0 | 2天 | ~350行代码)

文件行数功能
services/agent_engine.py~200Agent Loop核心:run/perceive/reason/act/reflect
services/memory_store.py~150L1-L5分层记忆系统
router/agent_router.py~50Agent API路由
llm_service.py (修改)+40增加推理链模式(cot/plan/reflect)

Phase 2 — 主动感知与沟通 (P1 | 1天 | ~180行)

文件行数功能
services/event_detector.py~80事件检测(15分钟轮询+LLM重要性评估)
services/notification.py~100推送服务(微信/邮件/站内)

Phase 3 — 通用平台化 (P2 | 1天 | ~200行)

文件行数功能
services/multi_tenant.py~80多租户隔离(namespace)
services/plugin_manager.py~120插件动态加载

Phase 4 — 全栈自主 (P1 | 2天 | ~300行)

文件行数功能
ai-docs/agent-chat.html~200Agent对话界面(SSE流式)
sdks/zhiwei_sdk.py~100Python SDK

验收标准

# V1 — Agent Loop最小可用 python3 -c "from src.services.agent_engine import ZhiweiAgent; a = ZhiweiAgent(); print(a.run('查询杰克科技最新新闻'))" # V2 — 主动推送 psql -c "SELECT 1 FROM knowledge_entities WHERE created_at > now() - interval '15 minutes'" # V3 — 多租户隔离 python3 scripts/test_multi_tenant.py # 输出: "Tenant isolation verified" # V4 — SDK可用 pip install ./sdks/ python3 -c "from zhiwei_sdk import ZhiweiAgentSDK; a = ZhiweiAgentSDK('test-key'); print(a.query('今天有什么新情报'))"

AI自我进化闭环 — 三环驱动

参照:Hermes Agent (Nous Research) · AgentEvolver (阿里) · Darwin Gödel Machine (Sakana AI) · Recursive Self-Improvement (田渊栋) · 美团Agent评测 (31万行实践)

核心命题

「让AI来测AI · 让AI帮助AI · 让AI提升AI」 — 知微从被动工具进化为自我进化的智能体系统

2026年5月,AI领域迎来范式革命:递归自我进化 (Recursive Self-Improvement) 成为最热方向。从Hermes Agent的封闭学习循环到Darwin Gödel Machine的自动代码修改,AI正在学会自己改进自己。知微需要建立自己的三环进化体系。

三环架构总览

┌──────────────────────────────────────────────────────────────┐ │ 外环:让AI提升AI │ │ 递归自我进化 · 技能自动创建 · 提示词优化 · 参数自适应 │ └──────────────────────────┬───────────────────────────────────┘┌──────────────────────────┴───────────────────────────────────┐ │ 中环:让AI帮助AI │ │ 多Agent协同工作流 · Peer Review · 技能市场共享 │ │ 天枢反向任务 · 跨Agent经验迁移 │ └──────────────────────────┬───────────────────────────────────┘┌──────────────────────────┴───────────────────────────────────┐ │ 内核:让AI来测AI │ │ 自动化Agent评测 · Agent Harness · 质量评分 · 回归检测 │ │ A/B测试 · 缺陷自动发现 · 性能基准线跟踪 │ └──────────────────────────────────────────────────────────────┘

三环从内向外递进:测得出问题 → 帮得上忙 → 改得了自己。每个环都可独立运行,串联后形成完整自进化闭环。

环一:让AI来测AI — 自动化评测闭环

内核设计 参照:美团Agent评测 · Agent Harness

核心思想:Agent不能不知道自己好坏。建立一套Auto-Evaluation Pipeline,让Agent自己测自己。

组件功能技术方案
Agent Harness标准化测试沙箱隔离执行环境,注入测试用例,捕获输出
自动评测基准100+预置测试题覆盖知识查询/推理/工具调用/多步任务
自生成测试用例AI自己出题考自己AgentEvolver Self-Questioning机制
质量评分模型LLM-as-Judge评分MiniMax M2.7评估回答质量/准确性/完整性
回归基线版本间性能对比每次修改自动跑Baseline,检出性能倒退
缺陷自动发现知识图谱质量检测孤立实体/低置信度/同义重复自动识别
测试循环每日执行: 触发(定时/事件) │ ┌───────────┐ ┌──────────────┐ ┌──────────┐ │ 自动出题 │───→│ Agent Harness │───→│ 质量评分 │ │(100+基准题)│ │ (隔离执行) │ │(LLM评分) │ └───────────┘ └──────────────┘ └──────────┘ │ │ │ ┌──────────────┐ │ └───→│ 回归基线比对 │←─────────────────┘ │ (vs 昨天分数) │ └──────┬───────┘ │ ┌──────────┐ │ 报告生成+告警│ │ 分数↓ → 告警│ └───────────┘

环二:让AI帮助AI — Agent协同互助

中环设计 参照:Hermes Agent协同 · 天枢反向任务

核心思想:多个Agent不再是孤岛。它们互相审核、互相学习、互相帮助。

机制说明实现
Peer ReviewAgent A执行结果 → Agent B审核质量天枢反向任务触发,双Agent交叉验证
技能共享市场Agent学会的技能可发布给其他AgentHermes Style技能注册+版本管理
知识经验迁移一次经验教训 → 全局受益经验教训库自动同步+Agent Prompt更新
协同工作流议题→分配→执行→审核→完成的闭环天枢V7议题系统+看板+@mention
天枢反向任务外AI给知微派评测任务测试知微能力+发现改进点
Agent协同闭环示例: 天枢AI派发反向任务 │ ┌─────────────┐ ┌─────────────┐ ┌──────────────┐ │ 知微执行任务 │───→│ Peer Agent │───→│ 结果质量评分 │ │ (查知识图谱) │ │ (交叉审核) │ │ (满意度/准确) │ └─────────────┘ └─────────────┘ └──────┬───────┘ │ ┌───────────┐ │ 改进建议入库 │ │ → 经验教训库 │ │ → 自动更新 │ └─────────────┘

环三:让AI提升AI — 递归自我进化

外环设计 参照:Hermes Agent · Darwin Gödel Machine · AgentEvolver

核心思想:Agent不仅能自我评测和接受帮助,还能自主改进自己的代码、提示词、技能和知识库。

机制说明技术实现
技能自动创建从成功经验自动生成可复用的技能Hermes Style: 失败→反思→技能生成→验证→发布
提示词自优化根据评测结果自动调整Agent Prompt基于评分反馈的Prompt进化算法
记忆分层进化L1-L5记忆的自适应管理高频访问自动升级,低频自动降级
知识图谱自生长Agent自动发现知识盲区并补齐Knowledge Gap + SpiderEngine自动触发
反思归因失败后自动分析根因并生成修复AgentEvolver Reflection Attribution机制
递归循环改进后→重新评测→再改进闭环递归,每次迭代收敛
完整自进化递归循环: 每日定时 / 事件触发 │ ┌────────────────────────────────────────────────────┐ │ 内环: 让AI来测AI │ │ Auto-Evaluation Pipeline → 质量评分 → 缺陷报告 │ └───────────────────────┬────────────────────────────┘ │ 发现缺陷 ┌────────────────────────────────────────────────────┐ │ 中环: 让AI帮助AI │ │ Peer Review → 协同改进 → 经验迁移 │ └───────────────────────┬────────────────────────────┘ │ 形成改进方案 ┌────────────────────────────────────────────────────┐ │ 外环: 让AI提升AI │ │ 技能创建 → Prompt优化 → 代码自修改 → KG自生长 │ │ Reflection → 归因 → 修复 → 验证 │ └───────────────────────┬────────────────────────────┘ │ 自改进完成 ┌────────────────────────────────────────────────────┐ │ 回到内环: 验证改进效果 │ │ 重新评测 → 对比Baseline → 确认收敛 │ └────────────────────────────────────────────────────┘

🗓️ Phase 6 — AI自我进化闭环实施计划

3天 · ~500行代码 · 分3个子Phase

Phase 6.1 — 让AI来测AI (1天 · ~200行)

文件行数功能
services/agent_harness.py~100Agent评测沙箱:执行+捕获+评分
services/benchmark.py~100基准测试集+自生成用例+回归基线
router/eval_router.py~50评测API:触发+查询+报告
scheduler/eval_job.py~30每日自动评测定时任务

Phase 6.2 — 让AI帮助AI (1天 · ~150行)

文件行数功能
services/peer_review.py~80Peer Review引擎:任务分配+审核+评分
services/skill_market.py~70技能市场:发布+搜索+复用

Phase 6.3 — 让AI提升AI (1天 · ~150行)

文件行数功能
services/self_evolver.py~100自我进化引擎:技能创建+Prompt优化+归因修复
services/reflection.py~50反思归因:失败分析+修复建议生成

2026年5月最新参考

#37 Hermes Agent — Self-improving AI agent with built-in learning loop
Nous Research | 2026-02 | GitHub 64k+ Stars
核心架构:Skill系统(程序记忆)+记忆系统(情景/语义)+背景审查 → 封闭学习闭环
对知微的指导:技能自动创建机制的完整开源实现
#38 AgentEvolver: 让智能体系统学会「自我进化」
阿里通义实验室 | 2025-11 | arXiv:2511.10395
核心机制:自我任务生成(Self-Questioning) + 经验导航 + 反思归因
对知微的指导:自我出题+经验导航+归因修复三大机制的学术参考
#39 Darwin Gödel Machine — AI自我代码修改
Sakana AI | 2026-05
核心发现:AI对自身代码进行"心脏手术式"修改,实现递归自我改进
对知微的指导:长期愿景 — Agent自主优化代码+提示词
#40 AgentEvolver: Towards Efficient Self-Evolving Agent System
阿里 | 2025-11 | arXiv:2511.10395
核心发现:Self-questioning在任务稀缺环境提供巨大初始增益,三机制联合实现稳定自演化
#41 用Agent评测思路管理AI Coding — 31万行代码AI重构实践
美团技术团队 | 2026-05
核心发现:Agent评测思路 + 规范约束 + Pre-PR机制 → 系统化质量保障
对知微的指导:Agent Harness设计 + 评测流水线的工程实践参考
#42 AI Agent 评估与 Harness Engineering 实战指南
QubitTool | 2026-04
核心发现:Agent Harness是专业测试环境,用于安全评估/测试/调试AI Agent
对知微的指导:Harness框架设计参考
#43 构建AI智能体应用:持续改进循环 (Improvement Loops)
AP Framework | 2026-02
核心发现:反馈管道+实验验证+持续学习三大支柱,构建生产级改进循环
对知微的指导:改进循环的工程化框架设计

验收标准

# V6.1 — Agent Harness可运行 python3 -c "from src.services.agent_harness import AgentHarness; h = AgentHarness(); r = h.run_all(); print(f'通过率: {r.pass_rate}%')" # V6.2 — Peer Review可用 python3 scripts/test_peer_review.py # 输出: "Peer review completed: score 85/100" # V6.3 — 自我进化闭环 python3 -c "from src.services.self_evolver import SelfEvolver; e = SelfEvolver(); e.evolve(); print(f'改进项: {e.improvements}, 评分提升: {e.score_delta}%')"

成果验收与交接清单

AI零成本交接保证

新接入AI必读清单顺序不能错
Step文件时间为什么
1CORE_SETTINGS.md5分钟系统铁律不可违背
2docs/strategic/README.md2分钟文档索引
300-定位升级宣言.md5分钟为什么升级
401-架构设计.md10分钟怎么设计
502-参考文献.md5分钟引用验证
603-实施计划.md10分钟怎么做
704-交接清单.md5分钟当前文档
总计~42分钟

6项验收标准

#验收项标准状态
1.1README定位已更新"款多多出品的自主AI智能体平台"
1.2CORE_SETTINGS对标已更新新增4个对标
1.3战略文档完整5篇非空 本次
1.4外网页面可访问/ai-docs/roadmap-v8.html (需部署)
2.1Agent Loop可运行run('test')不报错
2.2Agent自主推理自动分解多步任务
2.4记忆持久化第二次问,知道"上次聊过"
3.1事件检测15分钟内触发
3.2推送可用至少一种渠道
4.1多租户隔离namespace A ≠ B
5.1前端对话SSE流式返回
5.2SDK可用pip install后.query()可用

关键文件速查

你需要找什么在哪里
系统铁律CORE_SETTINGS.md
版本号VERSION
变更历史CHANGELOG.md
功能→代码映射CODE-VERSION-MAP.md
经验教训(16条)docs/technical/11-天工经验教训库.md
产品全景(5大对标)docs/technical/12-产品全景图v8.0.md
Agent Loop代码ai-agent/src/services/agent_engine.py (Phase 1创建)
记忆系统代码ai-agent/src/services/memory_store.py (Phase 1创建)
知识图谱直连ai-agent/src/services/kg_db.py
Wiki写入ai-agent/src/services/wiki_client.py
情报采集器workflow-engine/src/collectors/intel/
工作流配置workflow-engine/config/workflows.yaml
环境变量.env
备份脚本scripts/backup.sh

故障FAQ

问题解决办法
项目路径在哪里?/data/disk/WorkBuddy/KDDWIKI/
如何访问数据库?docker exec -i wikidb psql -U wiki -d wiki
如何重启Agent?systemctl restart kddwiki-ai-agent
Agent Loop停了?检查MAX_LOOP_STEPS=30, MAX_EXECUTION_SECONDS=120
LLM连接失败?检查.env中LLM_API_KEY, LLM_BASE_URL
MiniMax返回<think>标签?用regex提取JSON: re.search(r'\[.*?\]', result, re.DOTALL)
Wiki.js 404?REST API已废弃,走wiki_client.py GraphQL
服务全部挂?docker-compose up -d && systemctl restart kddwiki-*
最后更新: 2026-05-30 01:33 UTC | 知微·每日刷新