[RFC] 054 - OpenAI Compatible Runtime 兼容不同 Stream 提取模式 #3361
arvinxx
started this conversation in
RFC | 特性开发
Replies: 1 comment 4 replies
-
Spark function call result:
|
Beta Was this translation helpful? Give feedback.
4 replies
Sign up for free
to join this conversation on GitHub.
Already have an account?
Sign in to comment
-
背景
Minimax 和 Spark 是两个比较奇葩的provider 实现。他们的接口虽然兼容了 OpenAI 的格式,但他们的抛错不是直接 throw 错误码,而是在 stream 中输出错误状态。
Spark:
目前 OpenAI Compatible Factory 并不支持 自定义 Stream 模块的提取逻辑,因此使得 Minimax 的 provider 是拷贝了代码重写的:
#2087
但单纯为了一个错误状态而重新写一个 Provider Runtime 实现明显不优雅。因此这个 RFC 对 OpenAI Compatible Runtime 需要提供的扩展点做一个通盘梳理,基于此来实现 Spark 的错误处理,并重构 Minimax 实现。
思路
基于 插件四期 中的实现思路,我们目前已经具备了修改 Stream 的能力,因此只需要提供 Stream 的扩展点,使得其他 Provider 可以扩展 stream chunk 的提取逻辑即可。
进展
Beta Was this translation helpful? Give feedback.
All reactions