Together Compute一直在探索不同的Transformer替代方案。最近,他们发布了一款检索模型,该模型的表现优于许多闭源嵌入式模型,适用于检索任务。该模型命名为Monarch Mixer 32k。它是一个基于深度神经网络的模型,可...
Read MoreMamba的创建者(以及许多其他模型)发布了一篇很专业的博客文章,概述了基本的序列混合架构,相对于标准Transformer,可以获得相当大的速度提升。该团队的新模型使用了这种混合方法,并且获得了非常好的性能。这种新...
Read More手绘一个大致的轮廓,让机器人完成你想要的任务,这是一种新颖的沟通方式,对于标准的拾取和放置任务来说,这种方式非常有效。斯坦福大学的研究人员发现,通过一个简单的交互界面,让用户手绘任务的轮廓,机器人可以...
Read More斯坦福、麻省理工和普林斯顿的一组研究人员开发了一个透明度指数,用于评估商业基础模型的透明度水平。这个指数被称为基础模型透明度指数(FMTI),评估了透明度的100个不同方面,结果表明,在主要的基础模型公司中...
Read More斯坦福人工智能与人类中心研究所(Stanford HAI)最新发布的“基础模型透明度指数”显示,主要的AI基础模型开发者在社会影响方面提供的信息不足。虽然Meta的Llama 2在透明度方面得分最高,为54%,其次是BloomZ和OpenAI...
Read More斯坦福大学的一个研究小组几个月前凭借他们完全模拟的村庄和逼真的居民生活引起了轰动。现在,这段代码已经开源。最有趣的部分可能是他们如何精心设计每个人和整个系统,以便与非状态保留的API(如gpt-3.5-turbo)合...
Read More从头开始训练基础模型是一项具有挑战性的任务。斯坦福大学的语言模型团队发布了一个在Jax上的框架,使这个过程更加简化。它提供了多种数据和模型并行策略,简化了编程过程。
Read MoreUC圣迭戈健康中心、UW健康中心和斯坦福医疗保健正在测试一种工具,该工具使用OpenAI的GPT阅读患者信息并从他们的医生那里起草回复。这个试点计划旨在验证AI是否可以减少医务人员回复患者在线查询的时间。初步反应需...
Read More