[RFC] 086 - 模型内置联网功能集成 #6308
arvinxx
started this conversation in
RFC | 特性开发
Replies: 1 comment
-
使用ollama本地部署的qwen2.5:14b模型是支持模型内联网搜索的但是开启不了,只有用云服务上的才能使用模型内搜索,能不能支持一下本地部署的模型啊 |
Beta Was this translation helpful? Give feedback.
0 replies
Sign up for free
to join this conversation on GitHub.
Already have an account?
Sign in to comment
Uh oh!
There was an error while loading. Please reload this page.
Uh oh!
There was an error while loading. Please reload this page.
-
背景
接 #6277 RFC,本 RFC 拆解模型内置联网功能的实现。
针对模型内置联网也存在两类划分,
一类是内置在模型推理过程中的,例如 pplx 的sora 和 jina 的 deep-research 模型。这一类的特点是模型内置联网,无需外部配置。但这一类相对来说更少一些。
第二类是 gemini/qwen/OpenRouter 等主流模型厂商的方案,即提供 model 级别原生的 web-search 特性,作为一个内置 tool 或者参数供开发者开启,返回的结果中已经包含搜索后的内容。
第三类是 minimax 这样的,需要通过 Function Calling 才能使用。
由于这几种模式的兼容形式不一样,因此需要分开来讨论。
设计思路
模型原生类
这类模型对于原有应用没有什么太大的兼容成本,只需要应用能对特定格式的渲染做兼容即可。
其中渲染格式也有差异, pplx 和 jina 用的是两种不同思路。
pplx 是在返回流中加入了一个特定的 citation 字段,在这个字段中返回了网址数组。
Jina 则是采用了标准的 md 脚注格式规范,相对兼容度会更高。
模型特殊字段/内置工具类
现在的 search 不同的 provider 处理不一样
比如 qwen 是加
enable_search:true
,google 是加tools: [{ googleSearch: {} }]
, OpenRouter 是model: xxx:online
模型 Function Calling 类
由于目前诉求不多,暂时忽略。
进展
Beta Was this translation helpful? Give feedback.
All reactions