
Cheap Model 为什么把多模态接入当作平台问题,而不是一组彼此割裂的接口清单。
文本模型通常是最熟悉的起点,但真实产品很少停留在那里。团队最终会需要图像生成、视频工作流、语音、转写或数据工具,而每增加一种能力,往往就会多出一条新的接入分支。
问题不只是 API 数量变多。每一种模态都会带来自己的定价模式、提供商差异和质量预期,时间一长,平台就会越来越难被团队整体理解。
当文本、图像、视频和音频工作负载都落在同一个运营模型里时,团队就能用同一套语言比较它们:成本、路由策略、fallback 行为,以及是否适合生产。
Agent 很少只停留在单一模态里。它们会搜索、生成、总结、说话,有时还会触发外部工具。如果仍然按供应商一套套分开接入,这种演化会比应有的更困难。
我们希望 Cheap Model 更像是一层连贯的控制面,而不是一堆互不相干的接口集合,尤其是对那些正在跨模态构建产品的团队来说。
加入我们的社区
订阅邮件列表,及时获取最新消息和更新