MetaSearch - 深度迭代 Agent RAG 系统

MetaSearch 是什么？

MetaSearch 是一个基于Multi-Agent协作的下一代检索增强生成 (RAG) 系统。通过QueryPlanner、RetrievalAgent、EvaluatorAgent、GeneratorAgent四大智能体协同工作，实现智能规划、精准检索、质量评估和优质生成，提供全面且上下文丰富的答案。

🤖 Multi-Agent RAG 系统

四大智能体协同工作，重新定义RAG系统的智能化水平。从查询规划到答案生成，每个环节都由专门的Agent负责，实现前所未有的智能协作模式。

Agent协作架构图

用户查询

输入问题或需求

"明朝内阁制度的发展历程"

Multi-Agent 智能协作

四大专门智能体并行工作，协同优化

1

QueryPlanner

查询规划智能体

分析查询复杂度

制定检索策略

决策搜索深度

历史分析型 → 深度检索

2

RetrievalAgent

检索执行智能体

多策略检索

动态参数调整

轮次自适应

156个候选结果

3

EvaluatorAgent

质量评估智能体

智能质量评估

多维度分析

决策下一步

质量85% → 继续检索

4

GeneratorAgent

答案生成智能体

多轮信息整合

结构化组织

高质量生成

整合327个信息块

规划中

检索中

评估中

生成中

智能答案

高质量综合回答

明朝内阁制度起源于永乐年间，经历了从内阁大学士到首辅制度的发展演变，在张居正改革时期达到权力顶峰，成为明朝政治制度的重要组成部分...

📊 4轮检索 📚 327个信息源 ⏱️ 2.3秒响应 ✨ 95%质量评分

QueryPlannerAgent

查询规划智能体

🎯 核心职责

• 分析查询类型（事实型、分析型、比较型等）
• 评估查询复杂度和所需信息深度
• 制定最优的检索策略和参数配置
• 预估所需的检索轮次和资源消耗

⚡ 智能决策

根据查询"明朝内阁制度的发展历程"，Agent识别为历史分析型查询，建议使用深度迭代检索策略，预计需要3-5轮检索。

RetrievalAgent

检索执行智能体

🔍 检索策略

• 向量检索：语义相似度匹配
• 关键词检索：精确术语匹配
• 混合检索：策略融合优化
• 自适应参数调整

🔄 动态执行

第一轮检索返回156个候选结果，Agent自动调整参数，第二轮检索发现43个新信息块，触发继续检索决策。

EvaluatorAgent

质量评估智能体

📊 评估维度

• 信息覆盖度：是否全面回答问题
• 内容深度：信息的详细程度
• 一致性：信息间的逻辑关联
• 新颖性：新发现信息的价值

🎯 智能决策

评估结果：覆盖度85%，深度70%，建议继续检索"张居正改革"相关内容以提升信息深度。

GeneratorAgent

答案生成智能体

✨ 生成能力

• 多轮信息整合与去重
• 结构化内容组织
• 逻辑连贯的叙述生成
• 多种输出格式支持

🏆 优质输出

综合4轮检索的327个信息块，生成结构化答案：起源背景→发展历程→关键人物→历史影响，确保逻辑完整且信息准确。

Agent协作时序图 - 数据流详解

📥

用户输入

query: "明朝内阁制度的发展历程"

1

QueryPlanner

QueryPlannerAgent - 查询分析与规划

输入 (Input)

{
    "query": "明朝内阁制度的发展历程"
}

处理过程

类型识别: analytical

复杂度: medium

策略: hybrid

输出 (Output)

{
    "agent": "QueryPlannerAgent",
    "plan": {
        "query_type": "analytical",
        "complexity": "medium",
        "info_sources_needed": 8,
        "retrieval_strategy": "hybrid",
        "multi_round_needed": true,
        "max_rounds": 3,
        "sub_queries": ["明朝内阁起源", "内阁大学士", "张居正改革"],
        "confidence": 0.85
    },
    "original_query": "明朝内阁制度的发展历程"
}

2

RetrievalAgent

RetrievalAgent - 检索执行

输入 (Input)

{
    "current_query": "明朝内阁制度的发展历程",
    "plan": {...},  // QueryPlannerAgent的输出
    "retrieval_strategy": "hybrid",
    "top_k": 8,
    "current_round": 1
}

处理过程

向量检索: 156个

关键词检索: 89个

结果融合: 178个

取top-8

输出 (Output)

{
    "agent": "RetrievalAgent",
    "retrieved_content": "明朝内阁制度始建于永乐年间...",
    "source_ids": ["doc_1234", "doc_5678", ...],
    "raw_chunks": [
        {
            "content": "永乐年间，明成祖设立内阁...",
            "chunk_id": "chunk_1234_2",
            "score": 0.892
        }, ...
    ],
    "search_time": 1.23,
    "total_chunks": 8
}

3

EvaluatorAgent

EvaluatorAgent - 质量评估与决策

输入 (Input)

{
    "original_query": "明朝内阁制度的发展历程",
    "raw_chunks": [...],  // RetrievalAgent的输出
    "current_round": 1,
    "max_rounds": 3
}

处理过程

重排序: top-5

LLM评估

质量评分: 0.72

决策: 继续检索

输出 (Output)

{
    "agent": "EvaluatorAgent",
    "reranked_chunks": [...],  // 重排序后的chunks
    "evaluation_scores": {
        "coverage": 0.75,
        "depth": 0.68,
        "consistency": 0.82,
        "novelty": 0.65,
        "overall_quality": 0.725
    },
    "decision": {
        "action": "continue_search",
        "reason": "信息覆盖不够全面，缺少发展历程细节",
        "suggested_queries": ["内阁大学士制度", "张居正改革"]
    }
}

重复步骤2-3，共3轮检索

4

GeneratorAgent

GeneratorAgent - 答案生成

输入 (Input)

{
    "original_query": "明朝内阁制度的发展历程",
    "all_retrieved_content": [
        // 第1轮检索结果
        // 第2轮检索结果  
        // 第3轮检索结果
    ],
    "plan": {...}  // 原始规划信息
}

处理过程

内容整合: 23个

去重排序

结构化组织

LLM生成

输出 (Output)

{
    "agent": "GeneratorAgent",
    "final_answer": "明朝内阁制度的发展历程可以分为...",
    "generation_metadata": {
        "total_sources": 23,
        "generation_time": 3.45,
        "answer_length": 1247,
        "confidence_score": 0.91
    },
    "source_attribution": [
        {"source": "doc_1234", "contribution": 0.25},
        {"source": "doc_5678", "contribution": 0.18},
        ...
    ]
}

📤

最终输出给用户

明朝内阁制度的发展历程
明朝内阁制度起源于永乐年间，经历了从内阁大学士到首辅制度的演变过程。最初由明成祖设立，用以协助处理政务...

📊 3轮检索 📚 23个信息源 ⏱️ 总耗时 8.2秒 ✨ 91%置信度

核心源码实现

探索MetaSearch Agent系统的核心实现，了解每个智能体的代码架构和关键逻辑

BaseAgent - 基础智能体类

deepsearch/agents/base_agent.py

"""
Agent RAG 基础智能体类

定义了所有Agent的基础接口和通用功能
"""

import time
from abc import ABC, abstractmethod
from typing import Dict, List, Any, Optional
from .logger import get_agent_logger

class BaseAgent(ABC):
    """所有Agent的基础类"""
    
    def __init__(self, name: str, llm=None, tools: List = None, **kwargs):
        """初始化基础Agent
        
        Args:
            name: Agent名称
            llm: 大语言模型接口
            tools: 可用工具列表
            **kwargs: 其他配置参数
        """
        self.name = name
        self.llm = llm
        self.tools = tools or []
        self.config = kwargs
        
        # 获取统一日志器
        self.logger = get_agent_logger()
        
        # Agent状态
        self.is_active = False
        self.memory = []  # Agent记忆
        self.execution_count = 0
        
        # 性能统计
        self.performance_stats = {
            'total_executions': 0,
            'total_execution_time': 0.0,
            'average_execution_time': 0.0,
            'last_execution_time': 0.0,
            'success_count': 0,
            'error_count': 0
        }
    
    @abstractmethod 
    def execute(self, task: Dict) -> Dict:
        """执行任务的核心方法 - 必须由子类实现
        
        Args:
            task: 任务参数字典
            
        Returns:
            执行结果字典
        """
        pass
    
    def log_step(self, step: str, details: str = None):
        """记录执行步骤"""
        message = f"[{self.name}] {step}"
        if details:
            message += f" - {details}"
        self.logger.info(message)

QueryPlannerAgent - 查询规划智能体

deepsearch/agents/planner_agent.py

"""
查询规划智能体 (QueryPlannerAgent)

负责分析用户查询，制定检索策略和执行计划
"""

import json
import re
from typing import Dict, List, Any
from .base_agent import BaseAgent

class QueryPlannerAgent(BaseAgent):
    """查询规划智能体 - 分析查询复杂度并制定检索策略"""
    
    def __init__(self, name: str = "QueryPlannerAgent", **kwargs):
        super().__init__(name, **kwargs)
        
        # 查询类型模式匹配
        self.query_patterns = {
            'factual': [
                r'什么是', r'谁是', r'哪里', r'何时', r'定义', r'概念',
                r'what is', r'who is', r'where', r'when', r'definition'
            ],
            'analytical': [
                r'为什么', r'如何', r'怎样', r'原因', r'分析', r'解释',
                r'why', r'how', r'analyze', r'explain', r'reason'
            ],
            'comparative': [
                r'比较', r'对比', r'区别', r'不同', r'相同', r'优缺点',
                r'compare', r'difference', r'similarity', r'vs', r'versus'
            ]
        }
    
    def execute(self, task: Dict) -> Dict:
        """执行查询规划任务"""
        query = task.get('query', '')
        
        self.log_step("开始分析用户查询")
        
        # 基础查询分析
        basic_analysis = self._analyze_query_basic(query)
        self.log_step("基础分析完成", 
                     f"长度={basic_analysis['length']}, 词数={basic_analysis['word_count']}")
        
        # 查询类型识别
        query_type = self._identify_query_type(query)
        self.log_step("查询类型识别", f"类型={query_type}")
        
        # 制定检索策略
        strategy = self._plan_retrieval_strategy(query, query_type, basic_analysis)
        self.log_step("检索策略制定", 
                     f"策略={strategy['method']}, 预计轮次={strategy['max_iterations']}")
        
        return {
            'query_analysis': basic_analysis,
            'query_type': query_type,
            'retrieval_strategy': strategy,
            'agent_name': self.name
        }

RetrievalAgent - 检索执行智能体

deepsearch/agents/retrieval_agent.py

"""
检索执行智能体 (RetrievalAgent)

根据规划执行具体的检索任务，支持多种检索策略
"""

from typing import Dict, List, Any
from .base_agent import BaseAgent

class RetrievalAgent(BaseAgent):
    """检索执行智能体 - 执行具体的检索操作"""
    
    def __init__(self, name: str = "RetrievalAgent", searcher=None, **kwargs):
        super().__init__(name, **kwargs)
        self.searcher = searcher
        
        # 检索策略配置
        self.retrieval_methods = {
            'vector': self._vector_retrieval,
            'keyword': self._keyword_retrieval,
            'hybrid': self._hybrid_retrieval,
            'adaptive': self._adaptive_retrieval
        }
    
    def execute(self, task: Dict) -> Dict:
        """执行检索任务"""
        query = task.get('query', '')
        strategy = task.get('strategy', {})
        iteration = task.get('iteration', 1)
        
        self.log_step(f"开始第{iteration}轮检索", f"查询: {query[:50]}...")
        
        # 根据策略选择检索方法
        method = strategy.get('method', 'hybrid')
        retrieval_func = self.retrieval_methods.get(method, self._hybrid_retrieval)
        
        # 执行检索
        results = retrieval_func(query, strategy)
        
        # 结果后处理
        processed_results = self._process_results(results, strategy)
        
        self.log_step("检索完成", 
                     f"找到{len(processed_results)}个结果, "
                     f"平均相关度{self._calculate_avg_score(processed_results):.3f}")
        
        return {
            'results': processed_results,
            'iteration': iteration,
            'method': method,
            'total_found': len(processed_results),
            'agent_name': self.name
        }
    
    def _hybrid_retrieval(self, query: str, strategy: Dict) -> List[Dict]:
        """混合检索：结合向量检索和关键词检索"""
        # 向量检索
        vector_results = self.searcher.vector_search(
            query, 
            top_k=strategy.get('vector_candidates', 50)
        )
        
        # 关键词检索
        keyword_results = self.searcher.keyword_search(
            query,
            top_k=strategy.get('keyword_candidates', 50)
        )
        
        # 结果融合
        merged_results = self._merge_results(vector_results, keyword_results)
        
        return merged_results[:strategy.get('max_results', 20)]

EvaluatorAgent - 质量评估智能体

deepsearch/agents/evaluator_agent.py

"""
质量评估智能体 (EvaluatorAgent)

评估检索结果质量，决定是否继续检索或生成答案
"""

import json
from typing import Dict, List, Any
from .base_agent import BaseAgent

class EvaluatorAgent(BaseAgent):
    """质量评估智能体 - 评估信息质量并决策下一步"""
    
    def __init__(self, name: str = "EvaluatorAgent", ranker=None, **kwargs):
        super().__init__(name, **kwargs)
        self.ranker = ranker
        
        # 评估维度权重
        self.evaluation_weights = {
            'coverage': 0.25,      # 覆盖度
            'depth': 0.25,         # 深度
            'consistency': 0.25,   # 一致性
            'novelty': 0.25        # 新颖性
        }
    
    def execute(self, task: Dict) -> Dict:
        """执行质量评估任务"""
        original_query = task.get('original_query', '')
        current_results = task.get('current_results', [])
        accumulated_chunks = task.get('accumulated_chunks', set())
        iteration = task.get('iteration', 1)
        max_iterations = task.get('max_iterations', 3)
        
        self.log_step(f"开始第{iteration}轮质量评估")
        
        # 重排序优化结果
        if self.ranker and current_results:
            reranked_results = self._rerank_results(original_query, current_results)
        else:
            reranked_results = current_results
        
        # 多维度质量评估
        quality_scores = self._evaluate_quality(
            original_query, reranked_results, accumulated_chunks
        )
        
        # 决策下一步行动
        decision = self._make_decision(
            quality_scores, iteration, max_iterations, accumulated_chunks
        )
        
        self.log_step(f"评估完成", 
                     f"整体质量={quality_scores['overall']:.3f}, "
                     f"决策={decision['action']}")
        
        return {
            'reranked_results': reranked_results,
            'quality_scores': quality_scores,
            'decision': decision,
            'iteration': iteration,
            'agent_name': self.name
        }

GeneratorAgent - 答案生成智能体

deepsearch/agents/generator_agent.py

"""
答案生成智能体 (GeneratorAgent)

整合多轮检索结果，生成高质量的综合答案
"""

from typing import Dict, List, Any
from .base_agent import BaseAgent

class GeneratorAgent(BaseAgent):
    """答案生成智能体 - 整合信息并生成最终答案"""
    
    def __init__(self, name: str = "GeneratorAgent", **kwargs):
        super().__init__(name, **kwargs)
        
        # 生成模板
        self.generation_templates = {
            'factual': "基于检索到的信息，直接回答用户的事实性问题",
            'analytical': "深入分析检索结果，提供全面的解释和分析",
            'comparative': "对比不同观点和信息，提供平衡的比较分析",
            'procedural': "整理步骤信息，提供清晰的操作指南",
            'comprehensive': "综合所有信息，生成结构化的全面回答"
        }
    
    def execute(self, task: Dict) -> Dict:
        """执行答案生成任务"""
        original_query = task.get('original_query', '')
        final_results = task.get('final_results', [])
        query_type = task.get('query_type', 'comprehensive')
        total_iterations = task.get('total_iterations', 1)
        
        self.log_step("开始生成最终答案", 
                     f"基于{len(final_results)}个信息块, {total_iterations}轮检索")
        
        # 信息预处理和去重
        processed_info = self._preprocess_information(final_results)
        
        # 结构化组织信息
        organized_info = self._organize_information(processed_info, query_type)
        
        # 生成答案
        final_answer = self._generate_answer(
            original_query, organized_info, query_type
        )
        
        # 答案后处理
        polished_answer = self._polish_answer(final_answer)
        
        self.log_step("答案生成完成", f"长度={len(polished_answer)}字符")
        
        return {
            'final_answer': polished_answer,
            'information_sources': len(final_results),
            'query_type': query_type,
            'total_iterations': total_iterations,
            'agent_name': self.name
        }

核心特性

模块化 RAG 框架

遵循社区标准，学习使用清晰、模块化的架构构建 LLM 项目的最佳实践。

深度迭代检索

实现前沿的 RAG 算法，通过多轮搜索迭代深入探索信息。

混合检索融合

结合向量搜索、关键词搜索 (TF-IDF) 和知识图谱检索，实现更广泛的覆盖。

智能查询扩展

利用 LLM 动态生成子查询，实现知识探索的广度和深度。

自适应搜索控制

基于新发现信息的比例决定是否继续搜索，优化效率。

多样性重排序

利用最大边际相关性 (MMR) 平衡相关性和多样性，提供更全面的结果。

🚀 Multi-Agent 协作

基于智能体协作的RAG系统，规划、检索、评估、生成四大专门Agent协同工作。

🧠 智能质量评估

基于重排序的智能评估系统，自主决策下一步行动：深入检索、扩展搜索或生成答案。

📊 详细日志监控

Agent级别的详细日志记录，时间戳命名，每步决策过程可追踪，便于系统优化。

系统架构

核心组件

文档处理

将原始文档分割成带有上下文和摘要的可管理文本块。

索引构建

构建向量、TF-IDF 和知识图谱索引以实现高效检索。

检索模块

结合多种检索方法（向量、关键词、图谱）查找相关文档。

查询扩展

使用 LLM 基于检索到的信息生成新的子查询。

深度 RAG 编排器

协调迭代检索过程并综合生成最终答案。

工作流程

用户查询输入

初始检索 (混合)

生成子查询 (LLM)

迭代检索与扩展

重排序与综合

生成最终答案 (LLM)

项目目录结构

MetaSearch/
├── config/           # 配置文件 (YAML)
├── data/             # 数据目录 (原始, 处理后, 索引)
│   ├── raw/          # 原始数据
│   ├── processed/    # 处理后的数据
│   └── indexes/      # 索引文件
├── deepsearch/       # 核心库代码
│   ├── indexing/     # 索引逻辑 (向量, tfidf, 图谱)
│   ├── llm/          # LLM 接口封装
│   ├── preprocessing/# 文档解析与分块
│   ├── rag/          # RAG 流水线实现 (标准, 深度)
│   ├── retrieval/    # 检索策略与重排序
│   └── utils/        # 工具函数
├── scripts/          # 辅助脚本 (下载, 处理)
├── app.py            # 主应用入口点
├── requirements.txt  # 项目依赖
└── README.md         # 项目文档

快速开始指南

# 创建并激活 conda 环境
conda create -n metasearch python=3.10 -y
conda activate metasearch

# 安装依赖 (推荐 CUDA 11.8)
pip install -r requirements.txt
# 若需 CUDA 11.8 支持:
pip install torch==2.0.1+cu118 --extra-index-url https://download.pytorch.org/whl/cu118

编辑 config/config.yaml 设置模型路径、API 密钥等。

# 推荐: 下载 Embedding 和 Reranker 模型 (约 2.3GB)
python scripts/download_models.py --embedding --reranker

# 可选: 下载生成模型 (例如 Qwen, 需要更多资源)
# python scripts/download_models.py --llm qwen

# 或者, 下载所有配置的模型
# python scripts/download_models.py --all

确保 config.yaml 中的模型路径与下载位置匹配。

将您的文档 (例如 .txt, .md, .pdf) 放入 data/raw/ 目录。

# 处理单个文件
python scripts/process_documents.py --file data/raw/your_document.pdf

# 处理 raw 目录中的所有文件
python scripts/process_documents.py --dir data/raw/

处理后的块将保存在 data/processed/。

# 使用默认处理后的块文件构建所有配置的索引
python scripts/build_indexes.py --chunks data/processed/index_chunk.pkl

索引 (FAISS, TF-IDF 等) 将保存在 data/indexes/。

交互模式:

python app.py --interactive

在您的终端中启动一个类似聊天的界面。

单个查询:

python app.py --query "明朝内阁制度的作用是什么？"

运行单个查询并打印结果。

技术深潜

文档处理与分块

原始文档被解析并分割成重叠的块。每个块存储：

content: 块的主要文本。
chunk_id: 唯一标识符。
parent_content: 可选的更大上下文块。
abstract: LLM 生成的摘要 (可选)。
元数据: 源文档、页码等。

# 示例配置 (config/config.yaml)
processing:
  chunk_size: 512      # 每个块的目标大小
  overlap_size: 64     # 连续块之间的重叠大小
  generate_abstract: true # 是否生成摘要

混合索引

多个索引捕获数据的不同方面：

向量索引 (FAISS): 使用嵌入 (例如 BCE-Embedding) 进行语义相似性搜索。
TF-IDF 索引: 经典的基于关键词的检索，适用于特定术语。
知识图谱 (可选): 提取实体和关系以进行结构化查询。

检索模块融合来自已启用索引的结果。

查询扩展机制

迭代地扩展搜索范围：

LLM 从检索到的结果中提取关键搜索词/子问题。
计算潜在子查询与原始查询的相关性分数。
汇集所有迭代中的候选子查询。
根据相关性和发现新信息的潜力选择得分最高的 k 个子查询。
这些成为下一次检索迭代的输入。

深度迭代检索循环

核心引擎在一个循环中运行：

从初始用户查询开始。
执行标准 RAG (检索、重排序、生成响应片段)。
计算信息增长率 (IGR): `len(new_chunk_ids) / len(existing_chunk_ids)`。
如果 IGR < 阈值或达到最大迭代次数，则停止。
否则，使用查询扩展为下一个循环生成新的子查询。
最后，将所有收集到的知识综合成一个最终的、全面的答案。

# 示例配置 (config/config.yaml)
deepsearch:
  max_iterations: 3          # 最大检索循环次数
  growth_rate_threshold: 0.1 # 如果发现的新信息少于 10%，则停止
  extend_query_num: 3        # 每次迭代的子查询数量

工作流程示例: "明朝内阁制度"

迭代 1

输入查询: "明朝内阁制度"
- 初始知识库: 空
- 现有块 ID: 空集合
标准 RAG 执行:
- 检索相关块 (例如 ID: {101, 102, 103, 104, 105})。
- 生成初始响应片段: "明朝内阁起源于永乐年间..."
- 将片段添加到知识库。
- 更新现有 ID: {101, 102, 103, 104, 105}
计算 IGR: 5 (新) / 1 (总计，概念上) = 5.0。由于 5.0 > 0.1 (阈值)，继续。
扩展查询:
- LLM 分析片段，建议子查询: ["大学士", "内阁权力", "张居正改革", ...]。
- 为下次迭代选择前 3 个相关子查询: 例如 ["明朝大学士", "明朝内阁的演变", "内阁与皇权"]。

迭代 2

输入查询: ["明朝大学士", "明朝内阁的演变", "内阁与皇权"]
标准 RAG 执行 (针对每个子查询):
- 为每个查询检索块 (例如发现的新 ID: {201, 202, 203, 204})。
- 为每个子查询生成响应片段。
- 将片段添加到知识库。
- 更新现有 ID: {101, 102, ..., 105, 201, ..., 204} (总共: 9)
计算 IGR: 4 (新) / 5 (现有) = 0.8。由于 0.8 > 0.1，可能继续 (取决于最大迭代次数)。
扩展查询 (如果继续): 生成并选择下一组子查询。