漫话开发者 - UWL.ME 精选全球AI前沿科技和开源产品
2024-01-21 talkingdev

DoraemonGPT:基于LLM的AI系统在视频理解方面迈出重要一步

最近,一种名为DoraemonGPT的新型AI系统基于大型语言模型取得了重要进展,它聚焦于视频任务,提升了对于动态现实场景的理解。DoraemonGPT将视频转换为符号记忆,以进行高效的时空查询,并利用专门的工具和新颖的规划...

Read More
2024-01-16 talkingdev

Sleeper Agents:如何训练具有持久性的LLMs

Anthropic发布了一项非常有趣的研究,该研究有意将语言模型中的“睡眠短语”进行有害污染。研究发现,它无法将这种模型与用于生产模型的强大系统进行“对齐”。也就是说,一旦模型被污染,就无法使用当前的工具消除不良...

Read More
2024-01-16 talkingdev

论文:自我指涉的元语言测试,为语言模型带来新挑战

自我指涉语句是一种挑战,例如“这个句子中的最后一个单词是is”。语言模型在处理这种语言时会遇到极大的困难。该论文介绍了一个数据集以及一些评估,以帮助改进语言模型的元语言能力。研究人员采用了一种混合方法来生...

Read More
2024-01-15 talkingdev

33B参数的网络安全领域语言模型发布

近日,一种33B参数的网络安全语言模型发布,该模型同时具备进攻性和防御性。这是一种通用编码模型,可以协助网络安全任务。这意味着,您可以使用它来保护您的网络,并学习如何防范不同的黑客攻击和漏洞。该模型的发...

Read More
2024-01-15 talkingdev

MiniMA项目开源:高效压缩的语言模型

MiniMA项目致力于将大型语言模型压缩成小型学生模型的挑战。研究人员发现了不同学生模型的一致最优容量差,并利用这一发现创建了MiniMA,它是从一个7B教师模型中压缩出来的3B模型。MiniMA在效率和性能方面创造了新的...

Read More
2024-01-15 talkingdev

如何通过简单语言提升代码翻译效果

最近的一项研究表明,为代码添加简单语言解释显著提高了语言模型在19种不同编程语言之间的翻译效果,特别是对于复杂代码的翻译。这项研究由GitHub和OpenAI共同完成,GitHub在其代码库中添加了简单语言解释,并使用这...

Read More
2024-01-15 talkingdev

论文:语言模型对提示词敏感研究

最近的研究表明,根据提示对模型进行少量训练,可以在任务上达到4-88%的准确率。这项研究展示了如何科学地改进您的提示,从而提高模型的准确性。这项技术对于自然语言处理领域的未来具有重要意义。

Read More
2024-01-15 talkingdev

谷歌云推出新AI工具,为零售商提供更好的在线购物体验

谷歌推出了一套新的工具,使用生成式人工智能技术,旨在增强在线购物体验和零售运营。该套件包括一个基于生成式AI技术的聊天机器人,可用于网站和移动应用程序,提供个性化的产品推荐。此外还有一个大型语言模型功能...

Read More
  1. Prev Page
  2. 115
  3. 116
  4. 117
  5. Next Page