DOCXSearchTool¶
实验性功能
我们仍在努力改进工具,因此未来可能会出现意外行为或更改。
介绍¶
DOCXSearchTool 是一个 RAG 工具,专为在 DOCX 文档中进行语义搜索而设计。它使使用者能够通过基于查询的搜索有效地从 DOCX 文件中查找和提取相关信息。该工具对于数据分析、信息管理和研究任务非常宝贵,简化了在大型文档集合中查找特定信息的过程。
安装¶
通过在终端中运行以下命令来安装 crewai_tools 包:
示例¶
以下示例演示了初始化 DOCXSearchTool 以在任意 DOCX 文件的内容中进行搜索或使用特定 DOCX 文件路径进行搜索。
from crewai_tools import DOCXSearchTool
# 初始化工具以在任意 DOCX 文件的内容中进行搜索
tool = DOCXSearchTool()
# 或者
# 使用特定 DOCX 文件初始化工具,这样 agent 只能搜索指定 DOCX 文件的内容
tool = DOCXSearchTool(docx='path/to/your/document.docx')
参数¶
docx: 可选的特定 DOCX 文档路径,你希望搜索的文档。如果在初始化时未提供,该工具允许稍后指定任意 DOCX 文件的内容路径进行搜索。
自定义模型和嵌入¶
默认情况下,该工具使用 OpenAI 进行嵌入和摘要。要自定义模型,你可以使用配置字典,如下所示:
tool = DOCXSearchTool(
config=dict(
llm=dict(
provider="ollama", # 或 google, openai, anthropic, llama2, ...
config=dict(
model="llama2",
# temperature=0.5,
# top_p=1,
# stream=true,
),
),
embedder=dict(
provider="google", # 或 openai, ollama, ...
config=dict(
model="models/embedding-001",
task_type="retrieval_document",
# title="Embeddings",
),
),
)
)