平台介绍
指令教程

图片识别

2025-08-26 更新 浏览量:5

一、简介

图片识别指令让您的自动化流程具备"看懂"图片的能力。通过这个指令,您可以提取图片中的文字信息、识别图片内容,或将图片中的视觉信息转化为可处理的文本数据。无论是处理扫描文档、识别验证码,还是从图片中提取特定信息,这个指令都能帮您自动化完成这些任务。


二、指令输入

使用该指令时,您需要提供以下信息:

选择图片(必填):支持直接上传图片文件(JPG、JPEG、PNG格式),也可以使用图片变量,将之前流程中获取的图片传递到这里。

识别要求(必填):

  • 指定您希望从图片中重点识别什么内容
  • 可以帮助AI更精准地提取您需要的信息
  • 示例:"只识别图片中的数字"或"提取表格中的数据"

三、指令输出

指令执行后,您将获得:

  1. Img_Text变量
  • 类型:字符串
  • 内容:图片中被识别出的所有文字内容
  • 使用方式:可在后续指令中引用该变量进行进一步处理
  • 示例:将识别出的文字保存到文件或插入数据库
  1. 监控显示
  • 执行过程中显示"正在识别[文件名称]"
  • 同时显示被识别的图片、识别要求和最终识别结果
  • 提供可视化反馈,方便验证识别准确性

四、示例

示例1:发票信息提取

  • 选择图片:上传一张增值税发票照片
  • 识别要求:"提取发票号码、开票日期和金额"
  • 输出:AI会识别出发票上的关键信息,生成结构化文本


目录

  • 一、简介
  • 二、指令输入
    • 三、指令输出
    • 四、示例