Mistral.rs是一款基于Rust的推理框架,其最新版本已经上线。这款框架在最新的版本中实现了性能的重大提升,增加了GGUF支持,并带来了更多其他改进。Mistral.rs是专为机器学习和人工智能研究者设计的一款强大工具,其...
Read More斯坦福大学人类中心人工智能研究院(Stanford HAI)发布了最新版本的基础模型透明度指数,对包括OpenAI和Google在内的14家主要人工智能开发商的透明度进行了评估。这些公司披露了之前未向公众公开的新信息,标志着在...
Read MorexAI近期公开发布了Grok-1模型的权重和架构。Grok-1是一种混合专家模型,拥有3140亿参数。发布的模型是Grok-1预训练阶段的原始基础模型检查点,这意味着它并未针对任何特定应用进行精调。该模型是由xAI使用自定义训练...
Read MoreBuzz是一个创新型的数据集,它在预训练中融合了偏好数据。该数据集的研究者们还发布了几个利用这些数据训练的模型。他们发现,这些模型在许多人类偏好任务上表现出色。Buzz数据集的出现,无疑为人工智能研究提供了新...
Read More在当今的人工智能研究领域,对模型的评估分数进行可视化是至关重要的。然而,许多图表在传达预期信息方面表现得并不好。这个GitHub项目展示了一些优秀的图表,并附带了在可视化结果时应该做什么和不应该做什么的建议...
Read More近期,科技界发起了一项名为BabyLM的挑战,旨在推动研究人员和开发者在极度有限的数据条件下,训练出性能卓越的文本和视觉模型。这一挑战的核心理念是模仿人类婴儿在成长初期所接触到的数据量,大约为1000万个token...
Read MoreDeepMind创始人戴密斯·哈萨比斯目前领导着谷歌统一的人工智能研究部门,致力于通过AlphaGo和AlphaFold等突破性成果保持科技巨头在人工智能领域的领先地位。尽管取得了成功,但将AI集成到实际产品中以及来自OpenAI的C...
Read More研究人员发现,当涉及到复杂的任务时,使用更多的代理人可以显着提高LLMs的性能。这项研究的结果表明,LLMs的性能随着代理人数量的增加而线性扩展。这是因为更多的代理人可以提供更多的观察和决策,使LLMs更好地理解...
Read More近期,人工智能研究公司Anthropic成功开发出一种破解长文本模型的技术。该技术通过对长文本模型进行破解,可以获取模型的内部信息。为了防范此类攻击,Anthropic已经与其他组织分享了这项发现,并对自身的安全措施进...
Read More苹果公司的人工智能研究人员开发了一种新型系统ReALM,该系统通过考虑屏幕上的内容、对话中的实体以及背景信息,增强了Siri理解上下文的能力。在基准测试中,ReALM系统的性能超过了ChatGPT 4.0。这一突破性的技术进...
Read More