来自arXiv的最新研究论文提出SeLoRA(Spectral-efficient Low-Rank Adaptation)技术,通过将LoRA适配器重新参数化为稀疏谱子空间,在保持模型表达能力的前提下显著减少冗余参数。该技术在多模态任务测试中表现突出...
Read More大型语言模型(LLMs)在代码生成领域已取得显著成就,但其输出仍常因缺乏形式化约束而出现编译错误。针对这一挑战,研究者提出了一种创新的类型约束解码方法,通过类型系统引导代码生成。该研究开发了新型前缀自动机...
Read More近日,HP宣布以1.16亿美元收购Humane的大部分资产,此举导致Humane的AI Pin项目正式终止。根据公告,AI Pin的功能将在2月28日之后失效,用户需尽快转移数据。Humane的团队将并入HP新成立的AI创新实验室HP IQ,继续推...
Read MoreMistral最近成功训练出了一个名为Mamba 2的代码模型,该模型在长文本环境下具有极高的性能,而且在HumanEval上的表现也达到了75%。Mamba 2的出现,标志着Mistral在人工智能和机器学习领域取得了重大突破,这也为未来...
Read More近期,一些人工智能驱动的硬件产品如Humane Pin和Rabbit R1在发布之后备受争议,但这并没有减少风险投资对该领域的关注和投入,著名投资人Sam Altman等人对其进行了大量投资。这种吸引力在于人工智能有可能通过创新...
Read More星际编程2 15B模型是一款在合成数据和人类数据上进行训练的人工智能模型。该模型在humaneval测试中获得了72.6的高分,表现出色。开发者在训练过程中不仅展示了他们的数据管道复制能力,还提供了将合成数据应用于其他...
Read MoreHumane's Ai Pin,一款AI驱动的可穿戴设备,因其技术问题备受争议。从音乐流媒体到AI助手故障,尽管该设备旨在营造一种环境计算体验,但其第一代产品却因性能延迟和缺乏基本功能而备受诟病。尽管承诺未来会通过软件...
Read More评估训练编程语言模型的性能是一个具有挑战性的任务。大多数人使用OpenAI的HumanEval。然而,一些开放的模型似乎会过度拟合到这个基准。LiveCodeBench是一种测量编程性能的方法,同时减轻污染问题。
Read More