Anthropic发布了一项非常有趣的研究,该研究有意将语言模型中的“睡眠短语”进行有害污染。研究发现,它无法将这种模型与用于生产模型的强大系统进行“对齐”。也就是说,一旦模型被污染,就无法使用当前的工具消除不良...
Read MorePixArt一直是流行的Stable Diffusion图像生成模型的并行研究方向。本研究采用潜在一致性模型实现更快的生成速度,并采用ControlNet样式提示实现更好的控制。
Read More自我指涉语句是一种挑战,例如“这个句子中的最后一个单词是is”。语言模型在处理这种语言时会遇到极大的困难。该论文介绍了一个数据集以及一些评估,以帮助改进语言模型的元语言能力。研究人员采用了一种混合方法来生...
Read MoreNous Research是最好的开放式精细调整模型的创建者。最近,该公司完成了500万美元的种子轮融资,以继续构建模型。该公司的模型可用于各种应用程序,包括语音识别、自然语言处理和计算机视觉。
Read More近日,一种33B参数的网络安全语言模型发布,该模型同时具备进攻性和防御性。这是一种通用编码模型,可以协助网络安全任务。这意味着,您可以使用它来保护您的网络,并学习如何防范不同的黑客攻击和漏洞。该模型的发...
Read MoreMiniMA项目致力于将大型语言模型压缩成小型学生模型的挑战。研究人员发现了不同学生模型的一致最优容量差,并利用这一发现创建了MiniMA,它是从一个7B教师模型中压缩出来的3B模型。MiniMA在效率和性能方面创造了新的...
Read More最近的一项研究表明,为代码添加简单语言解释显著提高了语言模型在19种不同编程语言之间的翻译效果,特别是对于复杂代码的翻译。这项研究由GitHub和OpenAI共同完成,GitHub在其代码库中添加了简单语言解释,并使用这...
Read More