概述#
Colang 是一种事件驱动的交互建模语言,由 Python 运行时解释。NeMo Guardrails 的初始版本 0.1
到 0.7
使用 Colang 1.0。从 0.8 版本开始,NeMo Guardrails 引入了对 Colang 2.0 的支持,同时保持 Colang 1.0 为默认版本,直到 Colang 完成其 beta 阶段。
NeMo Guardrails |
Colang |
---|---|
0.1-0.7 |
1.0 |
0.8 |
2.0-alpha |
>= 0.9 |
2.0-beta |
动机#
大型语言模型 (LLM) 越来越多地用于不同类型的对话和交互式系统中,例如基于聊天的助手、语音助手、多模态交互式头像、游戏中的非玩家角色以及完全自主的代理。这些应用程序使用 LLM 不仅仅是为了生成文本响应。它们需要触发操作并遵循复杂的业务流程。

为实现此目的而广泛采用的方法包括
在沙箱环境中生成和执行代码(例如,生成 Python 代码)。
使用特定模板生成响应,这使得更容易解析 Bot 响应和应采取的操作(例如,“思维链”模式)。
对于支持函数调用的模型,可以使用函数调用和约束输出生成(例如,JSON 模式)。
检索增强生成 (RAG) 通过将应用程序级和用户特定的上下文集成到生成中,发挥着至关重要的作用。用于 LLM 的综合护栏工具包应无缝适应所有这些交互模式。
Colang 1.0#
当提到 Colang 时,既指语言本身,也指其运行时环境。最初的 Colang 1.0 语言和运行时存在一些限制。
语言限制
主要支持基于文本的交互,并为用户和 Bot 消息提供专门的结构。
对自然语言指令的支持有限,例如提取用户提供的值或 Bot 消息指令。
缺乏对并发执行多个操作或启动多个交互流程的支持。
不允许对并行交互流进行建模,例如交互式头像系统中的同步聊天和头像姿势调整。
缺乏正式的语言描述。
运行时限制
没有显式的状态对象来管理持续交互。
随着事件数量的增加,性能会下降。
Colang 2.0#
Colang 2.0 代表了对语言和运行时的全面改进。主要增强功能包括
Colang 2.0-alpha#
更强大的流引擎,支持多个并行流和对事件流的高级模式匹配。
用于简化 Bot 开发的标准库。
更小的核心抽象集:流、事件和动作。
通过 main 流的显式入口点和流的显式激活。
异步动作执行。
采用类似于 Python 的术语和语法,以降低新开发人员的学习曲线。
Colang 2.0-beta#
用于标准库的导入机制,以进一步简化开发。
新的
...
。独立的和流参数表达式求值。
当前限制(将在 NeMo Guardrails v0.10.0 中修复)
护栏库尚不能从 Colang 2.0 中使用。
不支持生成选项,例如,日志激活的导轨等。
从 alpha 版本迁移到 beta 版本#
你可以使用以下命令将你的 Colang 2.0-alpha Bot 迁移到 2.0-beta
nemoguardrails convert "path/to/2.0-alpha/version/bots" --from-version "2.0-alpha"
此外,你可以添加--validate
标志来检查迁移后的文件是否没有引发任何 Colang 语法错误。
请参阅“从 alpha 版本到 beta 版本的重大更改”部分,查看详细更改。
交互模型#
虽然 Colang 1.0 和 Colang 2.0 之间的语法和底层机制有很多变化,但值得强调的是,一个核心要素保持不变:交互模型。
在 Colang 1.0 和 Colang 2.0 中,应用程序(或用户)与 LLM 之间的交互都是事件驱动的。事件示例包括:用户说了些什么、LLM 生成响应、触发动作、动作的结果、检索附加信息、触发护栏等。换句话说,系统的演变被建模为一系列事件,护栏层负责识别和执行流中的模式。下图描述了事件流作用的简化版本(黄色背景的框代表事件)。

这种事件驱动的交互模型是使 Colang 成为一种强大的建模语言的部分原因,它能够描述任何类型的交互(基于文本、基于语音、多模态、代理、多代理等),并为其添加护栏。