跳转至

Vision Tool

Description

此工具用于从图像中提取文本。当传递给代理时,它将从图像中提取文本,然后使用该文本生成响应、报告或其他任何输出。应将图像的URL或PATH传递给代理。

Installation

安装crewai_tools包

pip install 'crewai[tools]'

Usage

为了使用VisionTool,应在环境变量OPENAI_API_KEY中设置OpenAI API密钥。

from crewai_tools import VisionTool

vision_tool = VisionTool()

@agent
def researcher(self) -> Agent:
    return Agent(
        config=self.agents_config["researcher"],
        allow_delegation=False,
        tools=[vision_tool]
    )