Tag: Routing
All the articles with the tag "Routing".
-
A Unified Approach to Routing and Cascading for LLMs
本文通过理论分析推导出最优的路由和级联策略,并提出级联路由这一统一框架,在成本预算内显著提升大型语言模型的输出质量,尤其在质量估计准确的场景下性能提升明显。
All the articles with the tag "Routing".
本文通过理论分析推导出最优的路由和级联策略,并提出级联路由这一统一框架,在成本预算内显著提升大型语言模型的输出质量,尤其在质量估计准确的场景下性能提升明显。