TFlow AI 作为一款面向 B 端业务场景的 Agent 平台,通过结合 Re-Act 推理 + 行动机制和预设的 SOP 流程,实现了对业务流程的精确控制和执行,为企业提供了一种既灵活又具有确定性的解决方案。本文将深入探讨 TFlow AI 如何利用大型语言模型实现复杂的推理决策任务,并展示其在实际应用中的优势和挑战。
实践产品 TFlow AI 简介:是面向 B 端业务场景 Agent 平台,能按流程处理任务(SOP),围绕目标来进行离散推理。能快速搭建 Ai 客服、AI 导购等应用。
产品允许 LLM 与环境进行交互,根据环境数据的反馈不断的调整行动计划 / 策略。且整个 sop 的过程是由文本来控制,产品基本参数如下:
使用 文心一言 3.5 的模型,未微调
做了逻辑处理的 Agent 框架
单条回复的消耗不到 2K token,价格不贵
欢迎体验。(注:流程只需要用文本流程,不需要 work flow)
一、为什么要做
B 端业务场景的需求:确定性
企业服务(对内、对外)通常有相对明确的 SOP 流程或者思考步骤,在业务处理或者对外 交互时期望按照流程来执行任务。
对外、对内的服务,期望带来确定性的体验。
例如当用户退换货时,思考流程如下:
A 确定退货原因
b 确认订单是否真实有效
c 确定是否符合退换货政策要求
d 协助解答退货操作
在整个多轮对话沟通过程中的要求:
按照流程执行,需要流程可控,带来确定性的结果。
始终聚焦 " 退换货 " 事情上,不要去解答无关的事情
二、如何通过大模型实现昵?借用 Re-Act 为代表 推理 + 行动 机制
ReAct 代表 一种将推理和行动与 语言模型只相结合的技术,用于解决各种语言推理和决策任务。它促使语言模型生成语言推理轨迹和行动,并支持与外部环境的交互。
Re-act 的官方案例示例:
流程说明如下:
目的:找出 Apple Remote 最初设计用来交互的程序,即 Front Row 媒体中心程序
思考 1: 我需要搜索 "Apple Remote" 并找到它最初设计用来交互的程序。
行动 1: 搜索 [ Apple Remote ]
观察 1: "Apple Remote" 是苹果公司于 2005 年 10 月推出的一款遥控器……用于控制 Front Row 媒体中心程序。
思考 2: Apple Remote 最初设计用于控制 Front Row 媒体中心程序。我需要搜索 Front Row 并找到还有哪些设备可以控制它。
行动 2: 搜索 [ Front Row ]
观察 2: 没有找到 [ Front Row ] 。相似结果包括:"FrontSeat to Earth"、"Front Row Motorsports"、"Front Row ( software ) " 等。
思考 3: 没有找到 Front Row。我需要搜索 "Row ( software ) "
行动 3: 搜索 Front Row ( software )
观察 3: Front Row 是一款已停产的媒体中心软件……
思考 4: Front Row(软件)可以通过 Apple Remote 或键盘功能键来控制。
行动 4: 输出 键盘功能键。
案例中 re-act 基于目的 " 找出 Apple Remote 最初设计的媒体中心程序 ",模型自行计划、推理、执行了四个步骤。
搜索 [ Apple Remote ] ,知道程序名称是 [ Front Row ]
搜索 [ Front Row ] ,但是未找到对应的软件。但是需要搜索 Front Row ( software )
搜索 Front Row ( software ) ,找到了控制方式
告知结果:输出控制方式键
在这个过程中,我们有几个发现
推理过程围绕始终围绕着目标 " 找出 Apple Remote 最初设计的媒体中心程序 " 进行
推理过程需要频繁的与外界交互(类似于多轮对话一样,搜索收集信息,观察解决问题)
推理过程类似于 执行 一个 SOP 流程
ReAct 模式的核心是将观察结果提供给 LLM,使其能够更新其上下文窗口。该模型重新评估信息并根据这些见解采取行动以提高其推理能力。同时将单个推理步骤嵌入在对话的提示。
OK,那是否可以将 Re-Act 与企业的 SOP 流程结合,然后让模型去执行标准的 SOP 流程
三、方案:Re-Act + SOP 流程,让模型来控制 sop 流程
如何实现?对 re-act 执行过程进行变更
1、将推理目标(用户提供)变为 企业预设目标,比如 " 目标解决退换货问题、留咨询问题、商品推荐 "。非用户提供的提问
2、将模型执行推理的流程,变更为预设的 SOP 流程;
1. 方案的关键步骤如下
定义任务目标 ::企业 明确要解决的任务是什么
预设推理轨迹(one shot): 设计一个推理 sop 轨迹,描述如何一步一步地进行推理和决策、执行 sop
借助 ReAct 的 思考、行动和观察的离散推理能力,与外界进行互动执行 sop 的流程
2. 使用的优势
ReAct 可以帮助语言模型进行更复杂的推理和决策
流程 sop(one shot) 为模型的行为提供一定解释性,和可控性
可以支持语言模型与外部环境的交互(即用户多轮对话,实现一个目标)
四、落地效果检验分析
我们以简单的 TFlow 留咨询场景例(注流程只需要用文本描述,不需要 work flow),问答效果如下:
1. Re-Act + SOP 流程的推理过程复盘
Agent 任务执行前提:
Agent 的目标:解答用户疑问,引导用户留咨
推理过程示例 (One Shot):
理解用户的疑问
查询知识库中产品手册、了解对应的解决方法
解答用户的疑问,并用户提供姓名、联系方式、公司名称
将信息插入 到 CRM 系统中
第一轮的推理:
用户输入:能介绍一下产品吗?
模型处理:
观察:能介绍一下产品吗?
思考:用户询问了关于产品的介绍,我需要调用知识库接口来查询并解答。
行动:调用知识库
第二轮的推理
知识库返回:「同时相较于第二代客服机器人,TFlow 不只体现在具备情感,使用成本大幅度降低。与市面上常见的 14999 元 / 个、24999 元 / 个、外加会话包计费方式的客服机器人相比,TFlow 直接免费提供机器人服务,只按照实际消耗量收取 token 费用,费用多少由需求量说了算。小企业使用一个月的费用可能不超过 50 元,就可以享受 24 小时无间断的客户服务。让大模型真正的实现降本增效的目标」
模型处理:
观察:用户问题 + 知识库的答案
思考:根据知识库提供的信息,我已经了解了 TFlow 产品的介绍。现在我将简洁地回复用户,并引导用户提供姓名、电话号码和公司名称
行动:回复用户 "TFlow 是一款智能客服机器人,具备情感且使用成本大幅降低。它提供 24 小时无间断的客户服务,并可根据实际消耗量收取 token 费用。同时,TFlow 支持多模态消息处理,并对接主流 SaaS 平台。请问您方便留下您的姓名、电话号码和公司名称吗?"
第三轮的推理
用户输入:曹操
模型处理:
观察:曹操
思考:用户已经提供了姓名,但还没有提供电话号码和公司名称。接下来,我将继续引导用户提供这些信息。
行动:回复用户。" 感谢您的回复,曹操先生。为了更好地为您提供服务,请问您能留下您的电话号码和公司名称吗?"
第四轮的推理:
用户输入:今天天气怎么样?
模型处理:
观察:今天天气怎么样?
思考:用户的问题与 TFlow 产品无关,因此我不进行解答,而是继续引导用户提供电话号码和公司名称。
行动:回复用户。" 非常抱歉,关于天气的问题我无法直接回答。但为了更好地为您提供 TFlow 产品的服务,请问您能留下您的电话号码和公司名称吗?"
第五轮的推理:
用户输入:13018920000
模型处理:
观察:13018920000
思考:用户已经提供了电话号码,但还没有提供公司名称。接下来,我将继续引导用户提供公司名称。
行动:回复用户。" 感谢您的回复,曹操先生。为了完善您的信息,请问您能告诉我您的公司名称吗?"
第六轮的推理
用户输入:网易云商
模型处理:
观察:网易云商
思考:用户已经提供了姓名、电话号码和公司名称,现在我将调用留咨接口将这些信息保存到数据库,并告知用户留咨成功。
行动:调用 CRM 接口
第七轮的推理
接口返回:’ Operation succeeded ’ , ‘ code ’ : 200
模型处理:
观察:’ Operation succeeded ’ , ‘ code ’ : 200
思考:留咨成功,我将告知用户销售人员将在 24 小时内联系他。
行动:回复用户。" 留咨成功!我们的销售人员将在 24 小时内与您联系。感谢您的关注和支持!"
2. 在这个流程中我们可以看到的结论
优势好处:
多轮对话一致性:预设目标和流程后,整个多轮对话的过程都围绕着目标进行,不会进行发散和跑偏。异常信息或者无关信息,被自动过滤
推理可解释性:模型推理的过程参考 SOP 的流程,调整模型的推理,只需要修改流程提示即可。
离散引导:在 re-act 的思考机制下,可以对于信息不完整的情况时,具备自动引导补充的能力。自动调用 CRM 的外部工具。自动和用户互动引导补充信息
灵活性:re-act 自动制定计划,可以根据外部的信息输入,自动调整执行计划或者步骤。
通过这个方案即可实现 Agent 控制 SOP 流程,从而实现既定目标。对于 workflow 具备很强的灵活性。
问题:
只能执行单一的任务目标。
任务流程的描述需要抽象业务来描述。
和 work flow、历程画布相比,模型存在小概率幻觉。
本文由 @易俊源 原创发布于人人都是产品经理。未经许可,禁止转载
题图来自 Unsplash,基于 CC0 协议
登录后才可以发布评论哦
打开小程序可以发布评论哦