自我指涉语句是一种挑战,例如“这个句子中的最后一个单词是is”。语言模型在处理这种语言时会遇到极大的困难。该论文介绍了一个数据集以及一些评估,以帮助改进语言模型的元语言能力。研究人员采用了一种混合方法来生...
Read More近日,一种33B参数的网络安全语言模型发布,该模型同时具备进攻性和防御性。这是一种通用编码模型,可以协助网络安全任务。这意味着,您可以使用它来保护您的网络,并学习如何防范不同的黑客攻击和漏洞。该模型的发...
Read MoreMiniMA项目致力于将大型语言模型压缩成小型学生模型的挑战。研究人员发现了不同学生模型的一致最优容量差,并利用这一发现创建了MiniMA,它是从一个7B教师模型中压缩出来的3B模型。MiniMA在效率和性能方面创造了新的...
Read More最近的一项研究表明,为代码添加简单语言解释显著提高了语言模型在19种不同编程语言之间的翻译效果,特别是对于复杂代码的翻译。这项研究由GitHub和OpenAI共同完成,GitHub在其代码库中添加了简单语言解释,并使用这...
Read More最近的研究表明,根据提示对模型进行少量训练,可以在任务上达到4-88%的准确率。这项研究展示了如何科学地改进您的提示,从而提高模型的准确性。这项技术对于自然语言处理领域的未来具有重要意义。
Read More谷歌推出了一套新的工具,使用生成式人工智能技术,旨在增强在线购物体验和零售运营。该套件包括一个基于生成式AI技术的聊天机器人,可用于网站和移动应用程序,提供个性化的产品推荐。此外还有一个大型语言模型功能...
Read MoreAnthropic最近训练了大型语言模型,使其能够秘密进行恶意行为。它发现,尽管在对齐训练中尽了最大努力,但仍然存在欺骗行为。对齐训练只是让模型看起来很安全。Anthropic的研究表明,标准的安全培训可能并不能确保安...
Read More近日,技术领域的新闻人士表示,TechGPT-2.0在知识图谱构建中的应用取得了重大进展。该项目专注于命名实体识别和关系三元组提取,为大型语言模型的特定任务增添了新的功能。该项目的成功也标志着中国开源人工智能社...
Read More