通义千问发布全新代码专家模型CodeQwen1.5
通义千问发布全新代码专家模型CodeQwen1.5
通义千问于昨晚公开了其全新的代码专家模型CodeQwen1.5,这一模型建立在Qwen语言模型的基础上,拥有70亿参数,采用先进的GQA架构,并经过大约3万亿个代码词元的预训练。值得一提的是,CodeQwen1.5支持多达92种编程语言,且能处理长度高达64K的上下文输入。
在多个关键领域,包括代码生成、长序列建模、代码修改及SQL应用能力上,CodeQwen1.5均展现了出色的表现,为开发者带来了更高的工作效率,同时简化了软件开发的流程。
特别在代码生成领域,CodeQwen1.5的性能已经超越了众多规模更大的模型,显著缩小了与GPT-4等顶尖模型在编码能力上的差距。通过HumanEval和MBPP的严格评估,CodeQwen1.5在各项性能指标上均获得了优异的成绩。
此外,根据LiveCodeBench的评估结果显示,CodeQwen1.5在解决LeetCode、AtCoder和CodeForces等编程竞赛平台上的问题时,展现出了强大的泛化能力,尽管其训练数据中包含了LeetCode的内容。
除了精通Python,CodeQwen1.5还支持多种其他编程语言。在涵盖8种主流语言的MultiPL-E评估中,CodeQwen1.5的多语言编程能力得到了充分验证。对于代码模型而言,长序列处理能力至关重要,而CodeQwen1.5通过专门设计的长序列代码数据训练,成功实现了对最长64K输入序列的支持。
在实际应用中,CodeQwen1.5在SWE Bench测试中的卓越表现尤为引人注目。它能够深入理解代码库,并生成能够通过单元测试的代码,从而有效解决了实际软件开发中遇到的难题。
在代码修改方面,CodeQwen1.5同样展现出了卓越的能力。在CodeEditorBench的四个维度——调试、转换、切换和润色上,均取得了最佳效果。
作为一个智能的SQL专家,CodeQwen1.5能够通过自然语言直接查询数据库,大大降低了非专业编程人员与高效数据交互的学习难度。在Spider和Bird这两个广受欢迎的文本到SQL基准测试中,CodeQwen1.5的性能与GPT-4不相上下,充分体现了其在SQL领域的强大实力。
作为Qwen1.5开源家族的重要成员,CodeQwen1.5目前已兼容多种平台和工具,包括Transformers、vLLM、llama.cpp和Ollama等。开源社区对CodeQwen1.5的发布充满了期待,相信它将在代码助手、Code Agent等方面为社区做出重要贡献,并在未来的代码智能化建设中扮演关键角色,成为名副其实的AI程序员。
ai工具箱
ai导航
免费aigc导航
aigc工具
免费ai工具