代码模型的相关内容 - 漫话开发者

2024-07-17 talkingdev

Codestral Mamba：Mistral培训出的超高性能代码模型

Mistral最近成功训练出了一个名为Mamba 2的代码模型，该模型在长文本环境下具有极高的性能，而且在HumanEval上的表现也达到了75%。Mamba 2的出现，标志着Mistral在人工智能和机器学习领域取得了重大突破，这也为未来...

2024-06-19 talkingdev

IBM最近在GitHub上发布了Granite代码模型，这些开放模型具有最先进的代码性能，能够进行深度升级以初始化更大的模型。与许多其他代码模型不同，这些模型还擅长修复代码、解释代码以及评估改进空间。这些模型的开放性...

2024-05-29 talkingdev

Mistral是一家专注于开发人工智能技术的创业公司，最近推出了Codestral，这是一种全新的代码模型。Codestral使用深度学习技术，能够对代码进行理解和分析。与传统的代码分析工具不同，Codestral不仅可以识别代码的语...

2024-05-14 talkingdev

IBM近日宣布，将其Granite代码模型开源，以便更好地服务于开源社区，推动各平台的编程工作更为轻松和高效。这些模型的参数量在3亿到340亿之间，并覆盖了多种编程任务。这一举动，对于开发者们来说无疑是一大福音，他...

2024-04-10 talkingdev

谷歌近期成功训练了一套名为Gemma的代码模型和循环Gemma模型。这些新模型展现出了与现有技术相媲美的性能，并且已经集成了FIM（查找插入记忆）功能。值得注意的是，循环Gemma模型在运行速度和内存效率方面都有显著提...

2024-02-26 talkingdev

Phind的70B代码模型在人类评估中获得83%的高分，与GPT-4表现相当。关键是它拥有显著较少的慵懒回应和拒绝。34B模型即将发布，更大的70B模型也将在未来发布。

2023-08-28 talkingdev

封闭源代码模型如Claude或GPT-4之所以令人印象深刻，是因为它们在推理能力和通用语言能力方面表现出色。许多开放的替代方案专注于极其狭窄的技能领域，而忽视了其他方面。OpenLemur项目的目标是在许多不同的任务中平...

2023-08-28 talkingdev

近日，WizardLM团队利用他们的Evol instruct技术显著提升了Llama代码的性能，甚至击败了Phind模型。此次成果尽管受到一些质疑，因为他们生成的指令直接提升了评估分数，而未使用固定的数据集，也没有把评估视为固定...

2023-06-21 talkingdev

AI模型的训练数据质量对于获得良好性能非常重要。在代码模型中，数据去重往往非常重要。对于文本而言，目前尚不清楚它是否同样重要。然而，无论如何，本博客介绍了用于去重文本样式数据的技术。

2023-06-15 talkingdev

近日，一种开源代码模型在编码任务中表现超越ChatGPT等语言模型。封闭模型之所以强大，是因为它们实际上是伪装成语言模型的代码模型。很多开放式语言模型表现不佳，因为它们无法从大规模的代码预训练中获得推理能力...