CodeGeeX模型详解:本地部署、性能评测与新功能
模型相关
1. 我是否也可以下载CodeGeeX模型在本地?
CodeGeeX模型在Github上全部开源,希望学习和研究大模型的用户都可以下载。截止7月,CodeGeeX在Github上获得16,326个Star好评。最新一代模型的Github项目地址:https://github.com/THUDM/CodeGeeX4
2. CodeGeeX2代模型评测结果怎么样?
我们使用CodeGeeX2-6B(截止7.26日的开源版本)在一些学术评测集(HumanEval,HumanEval-X)上做了测试,在没有数据泄漏的情况下,这些评测集可以反映模型的基础能力,实际体验还是需要以具体场景为准。
在 HumanEval 评测中,CodeGeeX2-6B的表现全面超越了参数规模更大的 StarCoder 模型以及 OpenAI 的 Code-Cushman-001 模型(GitHub Copilot 曾使用的模型)。
在多语言方面,新版 CodeGeeX 2 模型在 HumanEval-X 数据集评测中表现优异。相较于第一代,CodeGeeX2 的Pass@1 指标在各个语言上的平均表现提升了 107%。其中,Rust 语言的性能提升显著,提升了 321%;C++ 和 JavaScript 语言上的表现也提升了 70% 以上。
3. 如何使用最新版的第三代CodeGeeX模型?
目前VSCode 中的CodeGeeX插件已经接入最新的第三代CodeGeeX模型。在VSCode插件市场搜索“CodeGeeX”,免费下载安装 v2.3.1 之后的版本,可以随时体验最新模型能力。
4. 第三代CodeGeeX模型能力如何?
一、第三代模型性能全面提升
CodeGeeX第三代模型正式发布,基础能力全面提升。
针对Python、Java、JavaScript、C++、Golang五种主流编程语言,代码生成准确率提升200%。
二、自定义系统指令
CodeGeeX 3代模型中,用户可以根据不同开发场景和习惯,自定义系统指令。这种方式在不用模型微调的情况下,代码注释匹配度提升20%、代码修复准确率提升20%、单元测试通过率提升40%,使同一模型在不同使用场景下的泛化能力大幅提升。
三、RAG检索增强
CodeGeeX 3代模型引入RAG算法,构建流行公有仓库和私有仓库的代码向量数据库,缓解代码生成模型幻觉性问题。包括:避免生成错误的私有函数调用、让模型拥有最新的代码仓库知识、对私有代码仓库建立知识库等。
基于CodeGeeX第三代模型能力的全面提升,插件产品推出多项全新功能。
更多建议: