Tag: Human-AI Interaction
All the articles with the tag "Human-AI Interaction".
-      本文通过提出位置 ID 操纵的 PFT 方法,揭示并解决了 LLM 在角色分离学习中依赖捷径的问题,提高了模型的鲁棒性和安全性,同时保持了性能。 
-   From System 1 to System 2: A Survey of Reasoning Large Language Models本文综述了从基础LLMs向推理LLMs的演进,通过整合System 2技术提升AI的逐步推理能力,并在基准测试中展示了显著性能改进。 
-   Learning to Plan Before Answering: Self-Teaching LLMs to Learn Abstract Plans for Problem Solving本文提出LEPA自训练算法,通过训练LLM生成预期计划作为抽象元知识来提升问题解决泛化能力,并在多个推理基准上显著优于现有方法。 
-   Racing Thoughts: Explaining Contextualization Errors in Large Language Models本文提出‘LLM Race Conditions Hypothesis’解释大型语言模型的上下文化错误,通过机械可解释性技术验证了关键窗口和上下文化顺序对模型性能的影响,并探索了推理时干预措施来缓解问题。 
-   Efficient Single-Pass Training for Multi-Turn Reasoning本文提出了一种通过响应令牌复制和自定义注意力掩码来实现多轮推理对话单次前向传递训练的方法,显著提高了训练效率,同时维护了推理可见性和位置一致性。