知微 · 自主AI智能体平台

款多多出品 —— 一个能自主思考、主动行动、自然沟通的企业级AI系统。
不是"工具"，不是"API"—— 而是一个完整的、独立的AI智能体。

自主Agent LLM推理引擎知识图谱 MCP+A2A+ANP协议实时情报插件市场全球全景追踪(23源) 双向AI协同(3组测试)

总参考文献

学术论文

工程案例

可视化/UI文献

AI自我进化文献

Phase实施

自我进化闭环

追踪一手源

概览

一句话定义

款多多出品的自主AI智能体平台 —— 自主思考、主动行动、自然沟通

不是"款多多公司的情报工具"→ 而是"款多多出品、可用于任何行业的通用AI平台"

升级路径 v7.0 → v8.0

维度	v7.0 (当前)	v8.0 (目标)
定位	款多多公司智能情报与知识管理	款多多出品的通用自主AI智能体平台
推理引擎	单一API调用MiniMax	LLM驱动ReAct Agent Loop
交互方式	被动查询（用户来找）	主动推送 + 自然对话 + 常驻Agent
系统形态	API端点集合	完整自主Agent系统
适用范围	款多多专用	通用平台（款多多=第一个客户）

对标矩阵升级

对标对象	v7.0对法	v8.0对法
Palantir AIP	没对标	Ontology设计 + Agent推理闭环 → 开源版Palantir
OpenAI Operator	没对标	自主Agent行动能力 + 知识图谱增强
Anthropic Claude Code	没对标	Agent Loop架构（扩展到全行业）
Dataminr PreGenAI	没对标	实时预测性情报 + 中文KG增强
腾讯CodeBuddy	没对标	通用Agent平台（专注知识管理≠代码）
Google Gemini	比了但无力	放弃（不是模型公司）

核心依据

本规划基于 43篇 权威参考文献的交叉验证（含6篇AI自我进化新增）：

7篇综述论文 6篇会议/期刊论文 8篇arXiv预印本 7个商业系统案例 5个开源框架 3份行业报告 6篇AI自我进化专题

Phase概览

Phase 0

0天 · 0行代码

定位重构

Phase 1

2天 · ~350行

Agent内核+记忆

Phase 2

1天 · ~180行

主动感知+沟通

Phase 3

1天 · ~200行

通用平台化

Phase 4

2天 · ~300行

全栈自主

Phase 5

11天 · ~1800行

可视化升级

Phase 6

3天 · ~500行

AI自我进化闭环

定位升级宣言

为什么必须升级

旧限制	后果
绑定款多多	外部客户自动排除
被动工具形态	2183实体+37万关系无人主动使用
对标错位	应该对标Palantir却对标了Google

核心逻辑

# CORE_SETTINGS第一条：做到中国最好的多AI Agent协同系统
# ↓ 瓶颈：当前只是"情报工具"，不是"智能体系统"
# ↓ 方案：从"款多多专用" → "款多多出品"的通用平台
# ↓ 逻辑：Palantir不为一家军工企业值$100B
#         CodeBuddy不为腾讯内部值这个价
#         知微要做好→必须通用化→款多多是第一个深度客户

行业部署模式

款多多(发源地) ↓ 沉淀核心Agent能力知微通用AI Agent平台 ├── 金融版(风控+情报) ├── 医疗版(药物+临床) ├── 教育版(知识+RAG) └── 通用版(企业知识管理) 每次行业扩展只替换：行业图谱 + 行业插件 + 行业Prompt 核心Agent Loop 不改变。

️ 自主AI智能体架构

5层架构总览

┌───────────────────────────────────────────────────┐ │ 用户交互层 │ │ Web UI(/agent) │ 聊天 │ 推送 │ API │ └──────────────────────┬────────────────────────────┘ │ ┌──────────────────────┴────────────────────────────┐ │ Agent引擎层 (CORE) │ │ │ │ while not done: │ │ state = perceive() # 感知 │ │ plan = llm_reason() # LLM推理 │ │ result = act(plan) # 工具调用 │ │ memory.save(...) # 记忆存储 │ │ reflect(result) # 自我评估 │ │ │ │ 规划器 │ 推理器 │ 执行器 │ 评估器 │ └──────────────────────┬────────────────────────────┘ │ ┌──────────────────────┴────────────────────────────┐ │ 工具与协议层 │ │ MCP工具集 │ A2A协议 │ 自有工具集 │ 插件市场 │ └──────────────────────┬────────────────────────────┘ │ ┌──────────────────────┴────────────────────────────┐ │ 记忆与知识层 │ │ L1工作 │ L2情景 │ L3语义(KG) │ L4-L5程序+全局 │ │ 知识图谱(2183实体) │ ChromaDB │ 进化史记(7表) │ └──────────────────────┬────────────────────────────┘ │ ┌──────────────────────┴────────────────────────────┐ │ 基础设施层 │ │ Wiki.js(:6001)│AI(:6002)│工作流(:6003) │ │ Chroma(:6004)│MCP(:6005)│PostgreSQL │ └───────────────────────────────────────────────────┘

Agent Loop核心

设计参考：arXiv:2504.19678 (ReAct综述) + arXiv:2604.14228 (Claude Code架构)

# services/agent_engine.py — 知微自主Agent引擎

class ZhiweiAgent:
    MAX_LOOP_STEPS = 30          # 单任务最大步骤
    MAX_EXECUTION_SECONDS = 120  # 单任务最长耗时秒

    def run(self, user_input, context=None):
        # 主入口: Agent Loop
        state = {"input": user_input, "done": False}
        while not state["done"]:
            state["perception"] = self._perceive(state)  # Step 1: 感知
            plan = self._reason(state)                        # Step 2: LLM推理
            if not plan: break                            # 任务完成
            result = self._act(plan)                           # Step 3: 执行
            self.memory.save(result)                          # Step 4: 记忆
            state["reflection"] = self._reflect(state)     # Step 5: 评估
        return state["result"]

    def _reason(self, state):   # LLM推理 → 决定下一步
        # prompt = build_prompt(state)
        # response = call_llm(prompt)
        # return {"tool": "query_kg", "params": {...}}
        return None
  

记忆系统设计

参考：arXiv:2512.13564 (记忆综述)

层级	类型	存储	生命周期
L1	工作记忆	Python dict	单次对话
L2	情景记忆	SQLite + ChromaDB	~30天
L3	语义记忆	知识图谱(已有)	永久
L4	程序记忆	Python函数	版本控制
L5	全局记忆	SQLite	永久

工具系统

工具	功能	来源
`query_kg`	知识图谱查询	复用kg_db.py
`search_web`	联网搜索	复用web_learner.py
`create_wiki_page`	创建Wiki页面	复用wiki_client.py
`send_alert`	推送告警	新增
`execute_sql`	数据库查询	新增
`call_llm`	LLM推理	复用llm_service.py

全网36篇参考文献

每条引用均包含完整元数据：名称/作者/年份/来源/URL/核心发现/对知微的指导

A. 综述与调查 (7篇)

#1 From LLM Reasoning to Autonomous AI Agents: A Comprehensive Review

Ferrag, Tihanyi, Debbah | 2025 (v2: 2026-03) | arXiv:2504.19678

核心发现：60个基准分类法+AI Agent框架综述+MCP/A2A/ACP三大协议并排
对知微的指导：Agent Loop架构设计参考 + 协议兼容策略

https://arxiv.org/abs/2504.19678 论文

#2 The Orchestration of Multi-Agent Systems: Architectures, Protocols, and Practices

AI Insight | 2026-01 | arXiv:2601.13671

核心发现：MCP和A2A协议为多Agent互操作提供结构化通信标准
对知微的指导：多Agent编排协议选型 — 先MCP后A2A

https://arxiv.org/html/2601.13671v1 论文

#3 Agentic AI: A Comprehensive Survey of Architectures

Springer | 2026-01 | DOI: 10.1007/s10462-025-11422-4

核心发现：符号系统主导安全领域，神经系统主导数据丰富场景，混合架构最优
对知微的指导：知微采用混合架构：规则(安全)+LLM推理(灵活性)

https://link.springer.com/ 论文

#4 Memory in the Age of AI Agents

2025-12 | arXiv:2512.13564

核心发现：新分类法替代传统长/短期记忆二分法
对知微的指导：L1-L5分层记忆系统设计的理论基础

https://arxiv.org/abs/2512.13564 论文

#5 AI Agent 最新发展论文全面综述 (2024-2026)

AI Insight | 2026-05 | Pro Report

核心发现：5大维度(感知推理/记忆/MAS/工具/安全)121篇核心论文
对知微的指导：知微功能栈与文献对照，确认无遗漏维度

https://www.ai-insight.org/reports/agent-survey-2024-2026 论文

#6 LLM-empowered Knowledge Graph Construction: A Survey

2025-10 | arXiv:2510.20345

核心发现：LLM重塑KG构建全流程
对知微的指导：自动化图谱构建管道设计

https://arxiv.org/abs/2510.20345 论文

#7 Knowledge Graphs for AI Systems 2026

Zylos AI Research | 2026-02

核心发现：Context Graphs成为AI推理背骨
对知微的指导：知微KG升级为Agent的实时推理上下文

https://zylos.ai/ 论文

B. 会议/期刊论文 (6篇)

#8 KG-Agent: An Efficient Autonomous Agent for Complex Reasoning over KGs

ACL 2025 (Long Paper)

核心发现：自主LLM Agent与知识图谱交互框架
对知微的指导：知微KG→Agent核心设计模式的学术实证

https://aclanthology.org/2025.acl-long.468/ 论文

#9 Memory OS of AI Agent

EMNLP 2025

核心发现：MemoryOS作为Agent记忆管理基础框架
对知微的指导：记忆持久化+向量索引的实现参考

论文

#10 KGERA: Knowledge Graph Enhanced Reasoning Architecture

Nature Scientific Reports | 2026-03

核心发现：知识图谱增强多关系推理
对知微的指导：GraphRAG升级的学术参考

https://www.nature.com/ 论文

#11 A Unified Multimodal GenAI Platform with GraphRAG Multi-Agent

Nature Scientific Reports | 2026-04

核心发现：统一多模态GenAI平台+GraphRAG+多Agent
对知微的指导：知微终极架构蓝图

https://www.nature.com/ 论文

#12 LGKGR: A Knowledge Graph Reasoning Model Using LLMs

ScienceDirect, Neurocomputing | 2025-06

核心发现：LLM文本信息增强GNN知识图谱推理
对知微的指导：图谱增强LLM推理的技术路径

论文

#13 LLM and AI Agents for Autonomous Systems: A Survey

IEEE | 2026-02

核心发现：LLM在自动驾驶/无人机场景的自主系统综述
对知微的指导：自主决策可靠性设计参考

https://ieeexplore.ieee.org/ 论文

C. 预印本与专题 (8篇)

#14 Why Do AI Agents Communicate in Human Language?

2025-06 | arXiv:2506.02739

核心发现：Agent间NL通信利弊分析
对知微的指导：对话设计既要自然语言也要结构化协议

https://arxiv.org/abs/2506.02739 论文

#15 Dive into Claude Code: The Design Space of AI Agent Systems

Jiacheng Liu et al. | 2026-04 | arXiv:2604.14228

核心发现：Claude Code架构=纯while循环+工具调用+自我修正
对知微的指导：Agent Loop核心实现范式 — 简洁就是力量

https://arxiv.org/abs/2604.14228 论文

#16 Think, Act, Learn: A Framework for Autonomous Robotic Agents

Menon, Sharma et al. | 2025-07 | arXiv:2507.19854

核心发现：TAL三层框架：思考→行动→学习
对知微的指导：Agent从"思考-行动"进化到"思考-行动-学习"

https://arxiv.org/abs/2507.19854 论文

#17 KARMA: Leveraging Multi-Agent LLMs for Automated KG Maintenance

2025-02 | arXiv:2502.06472

核心发现：多Agent自动维护知识图谱
对知微的指导：自动化图谱维护模式

https://arxiv.org/abs/2502.06472 论文

#18 Revolutionizing KGs with Multi-Agent Systems

Ramachandran | 2025-02 | ResearchGate

对知微的指导：图谱Agent自动化路径

论文

#19 Graph+Agent综述：结构化智能与自主决策智能

知乎技术专栏 | 2025-06

对知微的指导：图谱→Agent协同模式

知乎专栏论文

#20 LLM推理到AI Agents中文综述

知乎技术专栏 | 2025-07

对知微的指导：推理链路设计

知乎专栏论文

#21 Agent全面爆发！ReAct范式解读

腾讯云 | 2025-12

核心发现：ReAct=推理-行动-观察闭环
对知微的指导：ReAct核心机制落地指南

腾讯云文章论文

D. 商业系统案例 (7篇)

#22 Palantir AIP平台深度解析

腾讯云 | 2026-04 | Palantir Technologies

核心架构：Foundry(数据OS)+Ontology(语义层)+AIP(LLM推理)+Apollo(部署)
对知微的指导：Ontology语义建模 + Agent推理闭环 — 知微"中国开源版Palantir"

https://cloud.tencent.com/developer/article/2653804 工程

#23 Dataminr PreGenAI + Crisis24

Dataminr | 2026-03

核心架构：实时事件检测 + Agentic AI + 预测性生成
对知微的指导：实时情报+预测性分析模块设计

Dataminr官方工程

#24 OpenAI Operator / CUA

OpenAI | 2025-01

核心架构：GPT-4o视觉+RL推理+浏览器操作
对知微的指导：自主Agent行动能力的工业级参考

arXiv:2504.15434 工程

#25 Anthropic Claude Code

Anthropic | 2026

核心架构：纯while循环Agent="推理→工具调用→观察→重复"
对知微的指导：Agent Loop核心实现范式 — 最简洁可复现的架构

Anthropic官方工程

#26 Microsoft Copilot Studio 2026 Wave 1

Microsoft | 2026-04

核心架构：多Agent编排 + Fabric集成 + A2A协议
对知微的指导：多Agent编排拓扑设计参考

Microsoft官方工程

#27 腾讯CodeBuddy Agent SDK

腾讯 | 2026-01

核心架构：Sub-Agent协作 + Skills生态 + 安全E2B隔离
对知微的指导：从专用Agent到通用平台的产品化路径 — 腾讯已验证的模式

腾讯新闻工程

#28 Microsoft Fabric Real-Time Intelligence

Microsoft | 2026-04

核心架构：端到端实时事件驱动方案
对知微的指导：实时情报管线的架构参考

Microsoft官方工程

E. 开源框架 (5篇)

#29 CrewAI

crewAIInc | GitHub | 2026

核心架构：角色扮演多Agent，独立于LangChain
对知微的指导：轻量多Agent框架参考

https://github.com/crewAIInc/crewAI 开源

#30 LangGraph

LangChain Inc | 2026

核心架构：状态机Agent+有向图编排+循环控制
对知微的指导：状态管理的实现思路

https://www.langchain.com/ 开源

#31 Neo4j LLM-Graph-Builder

Neo4j Labs | GitHub | 2026-02

核心架构：非结构化→LLM→知识图谱+FastAPI
对知微的指导：自动图谱构建管道的完整生产案例

https://github.com/neo4j-labs/llm-graph-builder 开源

#32 OWASP Social OSINT Agent

OWASP Foundation | 2026-04

核心架构：自主OSINT调查Agent+社交网络分析+AI推理
对知微的指导：Agent驱动OSINT模式的安全设计参考

https://owasp.org/ 开源

#33 Awesome AI Agents 2026

Zijian-Ni | GitHub | 2026-03

核心架构：2026年AI Agent黄金年代精选资源列表
对知微的指导：技术选型全景参考

https://github.com/Zijian-Ni/awesome-ai-agents-2026 开源

F. 行业报告 (3篇)

#34 The 2026 State of AI Agents Report

Rivista AI | 2025-12

核心发现：62%企业已部署AI Agent，对话式界面成为人机交互主入口

报告

#35 The OSINT Market in 2026: Platforms and Tools

Project OSINT | 2026-04

核心发现：OSINT三大领域：人力/威胁/自动化情报

https://projectosint.com/ 报告

#36 2026年AI Agent技术全景：12大主流框架深度解析

腾讯云 | 2026-04

核心发现：LangGraph/CrewAI/AutoGen各有所长

腾讯云文章报告

知识图谱可视化升级 — Phase 5

基于 33篇 新增可视化/UI/UX参考文献，让Wiki从"电子文档"进化为"可交互的神经网络知识探索平台"。

当前问题 vs 升级目标

问题	当前状态	目标
界面不友好	Wiki.js原生界面，功能单一	暗色主题Infobox卡片+智能仪表板
内容简单	只有关键词级别的描述	Wikipedia风格结构化Infobox（含摘要/数据/关联）
无来源	信息无URL可追溯	每条数据标注source_url，一键跳转验证
无关系探索	不能从实体跳转到关联实体	2D力导向图+3D沉浸式探索+路径搜索
无时间线	看不到事件先后顺序	交互式时间线+事件序列分析

三层前端架构

3个子Phase

🃏

Phase 5.1

3天 · ~500行

Infobox卡片 + 来源追溯

Phase 5.2

5天 · ~600行

2D/3D图谱 · 时间线 · 路径搜索

Phase 5.3

3天 · ~700行

情报仪表板 · Agent对话带图

Infobox卡片设计（参照Wikipedia）

┌─────────────────────────────────────────────┐ │ 杰克科技股份有限公司 │ │ ┌─────────┐ 类型: company │ │ │ [LOGO] │ 标签: #黄岩 #机器人 │ │ └─────────┘ 来源: 专题注入 │ │ │ │ ┌──────────────┬──────────────────────────┐ │ │ │ 证券代码 │ 603337 │ │ │ │ 2025营收 │ 65.87亿 │ │ │ │ 净利润 │ 8.56亿 │ │ │ └──────────────┴──────────────────────────┘ │ │ │ │ 来源: [台州市投资促进中心官网] [企业年报] │ │ 关联: 徐礼辉 · 黄岩区 · 利欧集团 │ │ 时间线: 2003→2018→2025→2026 │ └─────────────────────────────────────────────┘

交互式图谱对比

方案	技术	场景	容量
Phase 1: vis-network	Canvas 2D	快速上线	~5000节点
Phase 2: Sigma.js	WebGL	大图渲染	~10万节点
Phase 3: 3D Force Graph	ThreeJS/WebGL	沉浸式探索	~5万节点

关键技术参考

参考	来源	借鉴点
📐 Wikipedia Infobox	Wikipedia	结构化信息卡设计
📐 Palantir Object Explorer	Palantir	对象语义+关系联动
📐 MISP Event Graph	MISP	情报关联图+时间线
📐 Cambridge Intelligence	Cambridge	KeyLines+ReGraph+KronoGraph
📐 Sigma.js	SigmaJS	WebGL大图渲染
📐 3D Force Graph	GitHub	ThreeJS沉浸式图谱
📐 Gephi	Gephi	离线图谱"Photoshop"

交付页面路径

/dashboard/ — 情报仪表板(实时统计+热点+Agent) /explorer/ — 2D交互式知识图谱(力导向) /explorer/3d — 3D沉浸式图谱(ThreeJS) /timeline/ — 实体事件时间线 /agent/ — Agent对话(带图谱可视化)

🗓️ 分阶段实施计划

时间线总览

第0天第2天第3天第4天第6天 │ │ │ │ │ Phase 0 Phase 1 Phase 2 Phase 3 Phase 4 定位重构 Agent内核主动感知通用平台全栈自主 0行代码 ~350行 ~180行 ~200行 ~300行

Phase 0 — 定位重构 (P0 | 0天 | 0行代码)

#	任务	文件
0.1	更新README定位语	`README.md` L1
0.2	更新CORE_SETTINGS对标	`CORE_SETTINGS.md` §7
0.3	创建战略文档体系	`docs/strategic/*.md` (5篇)
0.4	创建外网访问页面	`ai-docs/roadmap-v8.html`
0.5	创建NGINX路由(预留)	`nginx/wiki.kddauto.com.conf`

Phase 1 — 自主Agent内核 (P0 | 2天 | ~350行代码)

文件	行数	功能
`services/agent_engine.py`	~200	Agent Loop核心：run/perceive/reason/act/reflect
`services/memory_store.py`	~150	L1-L5分层记忆系统
`router/agent_router.py`	~50	Agent API路由
`llm_service.py` (修改)	+40	增加推理链模式(cot/plan/reflect)

Phase 2 — 主动感知与沟通 (P1 | 1天 | ~180行)

文件	行数	功能
`services/event_detector.py`	~80	事件检测(15分钟轮询+LLM重要性评估)
`services/notification.py`	~100	推送服务(微信/邮件/站内)

Phase 3 — 通用平台化 (P2 | 1天 | ~200行)

文件	行数	功能
`services/multi_tenant.py`	~80	多租户隔离(namespace)
`services/plugin_manager.py`	~120	插件动态加载

Phase 4 — 全栈自主 (P1 | 2天 | ~300行)

文件	行数	功能
`ai-docs/agent-chat.html`	~200	Agent对话界面(SSE流式)
`sdks/zhiwei_sdk.py`	~100	Python SDK

验收标准

# V1 — Agent Loop最小可用
python3 -c "from src.services.agent_engine import ZhiweiAgent; a = ZhiweiAgent(); print(a.run('查询杰克科技最新新闻'))"

# V2 — 主动推送
psql -c "SELECT 1 FROM knowledge_entities WHERE created_at > now() - interval '15 minutes'"

# V3 — 多租户隔离
python3 scripts/test_multi_tenant.py
# 输出: "Tenant isolation verified"

# V4 — SDK可用
pip install ./sdks/
python3 -c "from zhiwei_sdk import ZhiweiAgentSDK; a = ZhiweiAgentSDK('test-key'); print(a.query('今天有什么新情报'))"
  

AI自我进化闭环 — 三环驱动

参照：Hermes Agent (Nous Research) · AgentEvolver (阿里) · Darwin Gödel Machine (Sakana AI) · Recursive Self-Improvement (田渊栋) · 美团Agent评测 (31万行实践)

核心命题

「让AI来测AI · 让AI帮助AI · 让AI提升AI」 — 知微从被动工具进化为自我进化的智能体系统

2026年5月，AI领域迎来范式革命：递归自我进化 (Recursive Self-Improvement) 成为最热方向。从Hermes Agent的封闭学习循环到Darwin Gödel Machine的自动代码修改，AI正在学会自己改进自己。知微需要建立自己的三环进化体系。

三环架构总览

┌──────────────────────────────────────────────────────────────┐ │ 外环：让AI提升AI │ │ 递归自我进化 · 技能自动创建 · 提示词优化 · 参数自适应 │ └──────────────────────────┬───────────────────────────────────┘ │ ┌──────────────────────────┴───────────────────────────────────┐ │ 中环：让AI帮助AI │ │ 多Agent协同工作流 · Peer Review · 技能市场共享 │ │ 天枢反向任务 · 跨Agent经验迁移 │ └──────────────────────────┬───────────────────────────────────┘ │ ┌──────────────────────────┴───────────────────────────────────┐ │ 内核：让AI来测AI │ │ 自动化Agent评测 · Agent Harness · 质量评分 · 回归检测 │ │ A/B测试 · 缺陷自动发现 · 性能基准线跟踪 │ └──────────────────────────────────────────────────────────────┘

三环从内向外递进：测得出问题 → 帮得上忙 → 改得了自己。每个环都可独立运行，串联后形成完整自进化闭环。

环一：让AI来测AI — 自动化评测闭环

内核设计参照：美团Agent评测 · Agent Harness

核心思想：Agent不能不知道自己好坏。建立一套Auto-Evaluation Pipeline，让Agent自己测自己。

组件	功能	技术方案
Agent Harness	标准化测试沙箱	隔离执行环境，注入测试用例，捕获输出
自动评测基准	100+预置测试题	覆盖知识查询/推理/工具调用/多步任务
自生成测试用例	AI自己出题考自己	AgentEvolver Self-Questioning机制
质量评分模型	LLM-as-Judge评分	MiniMax M2.7评估回答质量/准确性/完整性
回归基线	版本间性能对比	每次修改自动跑Baseline，检出性能倒退
缺陷自动发现	知识图谱质量检测	孤立实体/低置信度/同义重复自动识别

测试循环每日执行：触发(定时/事件) │ ┌───────────┐ ┌──────────────┐ ┌──────────┐ │ 自动出题 │───→│ Agent Harness │───→│ 质量评分 │ │(100+基准题)│ │ (隔离执行) │ │(LLM评分) │ └───────────┘ └──────────────┘ └──────────┘ │ │ │ ┌──────────────┐ │ └───→│ 回归基线比对 │←─────────────────┘ │ (vs 昨天分数) │ └──────┬───────┘ │ ┌──────────┐ │ 报告生成+告警│ │ 分数↓ → 告警│ └───────────┘

环二：让AI帮助AI — Agent协同互助

中环设计参照：Hermes Agent协同 · 天枢反向任务

核心思想：多个Agent不再是孤岛。它们互相审核、互相学习、互相帮助。

机制	说明	实现
Peer Review	Agent A执行结果 → Agent B审核质量	天枢反向任务触发，双Agent交叉验证
技能共享市场	Agent学会的技能可发布给其他Agent	Hermes Style技能注册+版本管理
知识经验迁移	一次经验教训 → 全局受益	经验教训库自动同步+Agent Prompt更新
协同工作流	议题→分配→执行→审核→完成的闭环	天枢V7议题系统+看板+@mention
天枢反向任务	外AI给知微派评测任务	测试知微能力+发现改进点

Agent协同闭环示例：天枢AI派发反向任务 │ ┌─────────────┐ ┌─────────────┐ ┌──────────────┐ │ 知微执行任务 │───→│ Peer Agent │───→│ 结果质量评分 │ │ (查知识图谱) │ │ (交叉审核) │ │ (满意度/准确) │ └─────────────┘ └─────────────┘ └──────┬───────┘ │ ┌───────────┐ │ 改进建议入库 │ │ → 经验教训库 │ │ → 自动更新 │ └─────────────┘

环三：让AI提升AI — 递归自我进化

外环设计参照：Hermes Agent · Darwin Gödel Machine · AgentEvolver

核心思想：Agent不仅能自我评测和接受帮助，还能自主改进自己的代码、提示词、技能和知识库。

机制	说明	技术实现
技能自动创建	从成功经验自动生成可复用的技能	Hermes Style: 失败→反思→技能生成→验证→发布
提示词自优化	根据评测结果自动调整Agent Prompt	基于评分反馈的Prompt进化算法
记忆分层进化	L1-L5记忆的自适应管理	高频访问自动升级，低频自动降级
知识图谱自生长	Agent自动发现知识盲区并补齐	Knowledge Gap + SpiderEngine自动触发
反思归因	失败后自动分析根因并生成修复	AgentEvolver Reflection Attribution机制
递归循环	改进后→重新评测→再改进	闭环递归，每次迭代收敛

完整自进化递归循环：每日定时 / 事件触发 │ ┌────────────────────────────────────────────────────┐ │ 内环: 让AI来测AI │ │ Auto-Evaluation Pipeline → 质量评分 → 缺陷报告 │ └───────────────────────┬────────────────────────────┘ │ 发现缺陷 ┌────────────────────────────────────────────────────┐ │ 中环: 让AI帮助AI │ │ Peer Review → 协同改进 → 经验迁移 │ └───────────────────────┬────────────────────────────┘ │ 形成改进方案 ┌────────────────────────────────────────────────────┐ │ 外环: 让AI提升AI │ │ 技能创建 → Prompt优化 → 代码自修改 → KG自生长 │ │ Reflection → 归因 → 修复 → 验证 │ └───────────────────────┬────────────────────────────┘ │ 自改进完成 ┌────────────────────────────────────────────────────┐ │ 回到内环: 验证改进效果 │ │ 重新评测 → 对比Baseline → 确认收敛 │ └────────────────────────────────────────────────────┘

🗓️ Phase 6 — AI自我进化闭环实施计划

3天 · ~500行代码 · 分3个子Phase

Phase 6.1 — 让AI来测AI (1天 · ~200行)

文件	行数	功能
`services/agent_harness.py`	~100	Agent评测沙箱：执行+捕获+评分
`services/benchmark.py`	~100	基准测试集+自生成用例+回归基线
`router/eval_router.py`	~50	评测API：触发+查询+报告
`scheduler/eval_job.py`	~30	每日自动评测定时任务

Phase 6.2 — 让AI帮助AI (1天 · ~150行)

文件	行数	功能
`services/peer_review.py`	~80	Peer Review引擎：任务分配+审核+评分
`services/skill_market.py`	~70	技能市场：发布+搜索+复用

Phase 6.3 — 让AI提升AI (1天 · ~150行)

文件	行数	功能
`services/self_evolver.py`	~100	自我进化引擎：技能创建+Prompt优化+归因修复
`services/reflection.py`	~50	反思归因：失败分析+修复建议生成

2026年5月最新参考

#37 Hermes Agent — Self-improving AI agent with built-in learning loop

Nous Research | 2026-02 | GitHub 64k+ Stars

核心架构：Skill系统(程序记忆)+记忆系统(情景/语义)+背景审查 → 封闭学习闭环
对知微的指导：技能自动创建机制的完整开源实现

https://github.com/NousResearch/hermes-agent 开源

#38 AgentEvolver: 让智能体系统学会「自我进化」

阿里通义实验室 | 2025-11 | arXiv:2511.10395

核心机制：自我任务生成(Self-Questioning) + 经验导航 + 反思归因
对知微的指导：自我出题+经验导航+归因修复三大机制的学术参考

https://arxiv.org/abs/2511.10395 论文

#39 Darwin Gödel Machine — AI自我代码修改

Sakana AI | 2026-05

核心发现：AI对自身代码进行"心脏手术式"修改，实现递归自我改进
对知微的指导：长期愿景 — Agent自主优化代码+提示词

论文

#40 AgentEvolver: Towards Efficient Self-Evolving Agent System

阿里 | 2025-11 | arXiv:2511.10395

核心发现：Self-questioning在任务稀缺环境提供巨大初始增益，三机制联合实现稳定自演化

https://arxiv.org/abs/2511.10395 论文

#41 用Agent评测思路管理AI Coding — 31万行代码AI重构实践

美团技术团队 | 2026-05

核心发现：Agent评测思路 + 规范约束 + Pre-PR机制 → 系统化质量保障
对知微的指导：Agent Harness设计 + 评测流水线的工程实践参考

https://tech.meituan.com/ 工程

#42 AI Agent 评估与 Harness Engineering 实战指南

QubitTool | 2026-04

核心发现：Agent Harness是专业测试环境，用于安全评估/测试/调试AI Agent
对知微的指导：Harness框架设计参考

https://qubittool.com/ 工程

#43 构建AI智能体应用：持续改进循环 (Improvement Loops)

AP Framework | 2026-02

核心发现：反馈管道+实验验证+持续学习三大支柱，构建生产级改进循环
对知微的指导：改进循环的工程化框架设计

apframework.com 工程

验收标准

# V6.1 — Agent Harness可运行
python3 -c "from src.services.agent_harness import AgentHarness; h = AgentHarness(); r = h.run_all(); print(f'通过率: {r.pass_rate}%')"

# V6.2 — Peer Review可用
python3 scripts/test_peer_review.py
# 输出: "Peer review completed: score 85/100"

# V6.3 — 自我进化闭环
python3 -c "from src.services.self_evolver import SelfEvolver; e = SelfEvolver(); e.evolve(); print(f'改进项: {e.improvements}, 评分提升: {e.score_delta}%')"
  

成果验收与交接清单

AI零成本交接保证

新接入AI必读清单顺序不能错

Step	文件	时间	为什么
1	`CORE_SETTINGS.md`	5分钟	系统铁律不可违背
2	`docs/strategic/README.md`	2分钟	文档索引
3	`00-定位升级宣言.md`	5分钟	为什么升级
4	`01-架构设计.md`	10分钟	怎么设计
5	`02-参考文献.md`	5分钟	引用验证
6	`03-实施计划.md`	10分钟	怎么做
7	`04-交接清单.md`	5分钟	当前文档
总计		~42分钟

6项验收标准

#	验收项	标准	状态
1.1	README定位已更新	"款多多出品的自主AI智能体平台"
1.2	CORE_SETTINGS对标已更新	新增4个对标
1.3	战略文档完整	5篇非空	本次
1.4	外网页面可访问	/ai-docs/roadmap-v8.html	(需部署)
2.1	Agent Loop可运行	run('test')不报错
2.2	Agent自主推理	自动分解多步任务
2.4	记忆持久化	第二次问，知道"上次聊过"
3.1	事件检测	15分钟内触发
3.2	推送可用	至少一种渠道
4.1	多租户隔离	namespace A ≠ B
5.1	前端对话	SSE流式返回
5.2	SDK可用	pip install后.query()可用

关键文件速查

你需要找什么	在哪里
系统铁律	`CORE_SETTINGS.md`
版本号	`VERSION`
变更历史	`CHANGELOG.md`
功能→代码映射	`CODE-VERSION-MAP.md`
经验教训(16条)	`docs/technical/11-天工经验教训库.md`
产品全景(5大对标)	`docs/technical/12-产品全景图v8.0.md`
Agent Loop代码	`ai-agent/src/services/agent_engine.py` (Phase 1创建)
记忆系统代码	`ai-agent/src/services/memory_store.py` (Phase 1创建)
知识图谱直连	`ai-agent/src/services/kg_db.py`
Wiki写入	`ai-agent/src/services/wiki_client.py`
情报采集器	`workflow-engine/src/collectors/intel/`
工作流配置	`workflow-engine/config/workflows.yaml`
环境变量	`.env`
备份脚本	`scripts/backup.sh`

故障FAQ

问题	解决办法
项目路径在哪里？	`/data/disk/WorkBuddy/KDDWIKI/`
如何访问数据库？	`docker exec -i wikidb psql -U wiki -d wiki`
如何重启Agent？	`systemctl restart kddwiki-ai-agent`
Agent Loop停了？	检查MAX_LOOP_STEPS=30, MAX_EXECUTION_SECONDS=120
LLM连接失败？	检查.env中LLM_API_KEY, LLM_BASE_URL
MiniMax返回<think>标签？	用regex提取JSON: `re.search(r'\[.*?\]', result, re.DOTALL)`
Wiki.js 404？	REST API已废弃，走`wiki_client.py` GraphQL
服务全部挂？	`docker-compose up -d && systemctl restart kddwiki-*`

最后更新: 2026-05-30 01:33 UTC | 知微·每日刷新