漫话开发者 - UWL.ME 精选全球AI前沿科技和开源产品
2024-01-16 talkingdev

Sleeper Agents:如何训练具有持久性的LLMs

Anthropic发布了一项非常有趣的研究,该研究有意将语言模型中的“睡眠短语”进行有害污染。研究发现,它无法将这种模型与用于生产模型的强大系统进行“对齐”。也就是说,一旦模型被污染,就无法使用当前的工具消除不良...

Read More
2024-01-16 talkingdev

论文:采用潜在一致性模型实现快速可控图像生成

PixArt一直是流行的Stable Diffusion图像生成模型的并行研究方向。本研究采用潜在一致性模型实现更快的生成速度,并采用ControlNet样式提示实现更好的控制。

Read More
2024-01-16 talkingdev

论文:自我指涉的元语言测试,为语言模型带来新挑战

自我指涉语句是一种挑战,例如“这个句子中的最后一个单词是is”。语言模型在处理这种语言时会遇到极大的困难。该论文介绍了一个数据集以及一些评估,以帮助改进语言模型的元语言能力。研究人员采用了一种混合方法来生...

Read More
2024-01-15 talkingdev

开放式精调模型Nous Research完成500万美元的种子轮融资

Nous Research是最好的开放式精细调整模型的创建者。最近,该公司完成了500万美元的种子轮融资,以继续构建模型。该公司的模型可用于各种应用程序,包括语音识别、自然语言处理和计算机视觉。

Read More
2024-01-15 talkingdev

核矩阵的频谱特性

本文探讨了不同核矩阵的特征值如何改变以及它对学习属性的影响。核矩阵是机器学习中常用的矩阵,用于描述数据的相似性。在本文中,我们将分析核矩阵的频谱特性,即特征值的变化,这对机器学习模型的性能有很大的影响...

Read More
2024-01-15 talkingdev

33B参数的网络安全领域语言模型发布

近日,一种33B参数的网络安全语言模型发布,该模型同时具备进攻性和防御性。这是一种通用编码模型,可以协助网络安全任务。这意味着,您可以使用它来保护您的网络,并学习如何防范不同的黑客攻击和漏洞。该模型的发...

Read More
2024-01-15 talkingdev

MiniMA项目开源:高效压缩的语言模型

MiniMA项目致力于将大型语言模型压缩成小型学生模型的挑战。研究人员发现了不同学生模型的一致最优容量差,并利用这一发现创建了MiniMA,它是从一个7B教师模型中压缩出来的3B模型。MiniMA在效率和性能方面创造了新的...

Read More
2024-01-15 talkingdev

如何通过简单语言提升代码翻译效果

最近的一项研究表明,为代码添加简单语言解释显著提高了语言模型在19种不同编程语言之间的翻译效果,特别是对于复杂代码的翻译。这项研究由GitHub和OpenAI共同完成,GitHub在其代码库中添加了简单语言解释,并使用这...

Read More
  1. Prev Page
  2. 305
  3. 306
  4. 307
  5. Next Page