Tag: Human-AI Interaction
All the articles with the tag "Human-AI Interaction".
-
Vectors from Larger Language Models Predict Human Reading Time and fMRI Data More Poorly when Dimensionality Expansion is Controlled
本文通过控制维度扩展发现,大型语言模型(LLMs)在预测人类阅读时间和脑成像数据时,随着模型规模增加,训练过程的贡献反而减少,揭示了模型与人类句子处理机制的潜在错位。
-
A Unified Approach to Routing and Cascading for LLMs
本文通过理论分析推导出最优的路由和级联策略,并提出级联路由这一统一框架,在成本预算内显著提升大型语言模型的输出质量,尤其在质量估计准确的场景下性能提升明显。
-
Lost in Transmission: When and Why LLMs Fail to Reason Globally
本文提出BAPO模型量化大型语言模型(LLMs)内部通信带宽限制,理论证明与实验验证了LLMs在高带宽需求任务上的失败,并展示链式思维(CoT)可降低带宽需求以缓解部分问题。
-
The Avengers: A Simple Recipe for Uniting Smaller Language Models to Challenge Proprietary Giants
本文提出*Avengers*框架,通过无训练的嵌入、聚类、评分和投票操作,整合多个小型开源语言模型的集体智能,在15个多样化数据集上平均性能超越GPT-4.1,展现了开源模型挑战专有巨头的潜力。
-
RM-R1: Reward Modeling as Reasoning
本文提出RM-R1,一种通过将奖励建模转化为推理任务并结合蒸馏和强化学习训练的推理奖励模型(REASRMS),在多个基准测试上取得了最先进性能,同时显著提升了可解释性。