WimTask学习中心-业务流程自动化教程与指南

平台介绍

WimTask微任务概述

下载安装

注册登录

授权使用

界面功能介绍

搭建一个发票识别工作流

指令教程

执行Python代码

获取天气

发票识别

创建Word

创建Excel

条件判断

AI分析

图片识别

HTTP请求

For循环

执行Sql语句

变量赋值

连接数据库

模板教程

服务包教程

应用场景

业务集成

常见问题

图片识别

2025-08-26 更新浏览量:5

一、简介

图片识别指令让您的自动化流程具备"看懂"图片的能力。通过这个指令，您可以提取图片中的文字信息、识别图片内容，或将图片中的视觉信息转化为可处理的文本数据。无论是处理扫描文档、识别验证码，还是从图片中提取特定信息，这个指令都能帮您自动化完成这些任务。

二、指令输入

使用该指令时，您需要提供以下信息：

选择图片（必填）：支持直接上传图片文件（JPG、JPEG、PNG格式），也可以使用图片变量，将之前流程中获取的图片传递到这里。

识别要求（必填）：

指定您希望从图片中重点识别什么内容
可以帮助AI更精准地提取您需要的信息
示例："只识别图片中的数字"或"提取表格中的数据"

三、指令输出

指令执行后，您将获得：

Img_Text变量

类型：字符串
内容：图片中被识别出的所有文字内容
使用方式：可在后续指令中引用该变量进行进一步处理
示例：将识别出的文字保存到文件或插入数据库

监控显示

执行过程中显示"正在识别[文件名称]"
同时显示被识别的图片、识别要求和最终识别结果
提供可视化反馈，方便验证识别准确性

四、示例

示例1：发票信息提取

选择图片：上传一张增值税发票照片
识别要求："提取发票号码、开票日期和金额"
输出：AI会识别出发票上的关键信息，生成结构化文本

一、简介

二、指令输入

三、指令输出

四、示例

目录