Tag: Code Generation
All the articles with the tag "Code Generation".
-
1bit-Merging: Dynamic Quantized Merging for Large Language Models
1bit-Merging提出了一种动态模型合并框架,通过1位量化任务向量和任务特定路由,在保持94.53%性能的同时将存储需求降至55.02%,在通用知识、数学推理和代码生成任务上优于传统和动态合并方法。
-
R1-Code-Interpreter: Training LLMs to Reason with Code via Supervised and Reinforcement Learning
本文提出 R1-Code-Interpreter 框架,通过监督微调和强化学习训练大型语言模型动态生成和执行代码,在 144 个推理和规划任务上显著提升准确率,R1-CI-14B 达到 64.1%,接近 GPT-4o+Code Interpreter 的性能。
-
Less is More: Towards Green Code Large Language Models via Unified Structural Pruning
本文提出Flab-Pruner,一种结合词汇、层和FFN剪枝的统一结构剪枝方法,通过KL散度优化和自定义微调策略,在减少代码LLM参数的同时保持高性能和效率。
-
PennyLang: Pioneering LLM-Based Quantum Code Generation with a Novel PennyLane-Centric Dataset
本文提出 PennyLang 数据集和 RAG/GraphRAG 框架,通过提升 LLM 在 PennyLane 量子代码生成中的准确性和正确性,填补了 AI 辅助量子编程的空白。
-
Paper2Code: Automating Code Generation from Scientific Papers in Machine Learning
本文提出PaperCoder框架,通过多代理LLM的多阶段管道自动从机器学习论文生成高质量代码仓库,提升了研究的可复现性,并在基准测试中显著优于现有方法。