MosaicFusion是一款神奇的工具,可以创建许多对象的新图片,而无需任何先前的学习。它分两步完成:首先制作图片,然后创建一个遮罩,显示每个对象的位置。
Read MoreMemGPT允许开发者创建带有自我编辑记忆的永久聊天机器人。它智能地管理LLMs中的不同记忆层,以有效地提供扩展上下文。MemGPT知道何时将关键信息购买到向量数据库中,以及何时在聊天中检索它,从而实现永久对话。该存...
Read More研究人员使用预训练的扩散模型在较小的图像上进行训练,以生产大尺寸的高质量图像。他们发现在更大的图像中存在重复模式的问题,并将问题指向了模型结构的有限感知能力。
Read More如果你的模拟器是生成式AI,它可以实现零-shot迁移机器人策略!DeepMind和同事的这项工作解决了强化学习通常无法推广到训练环境之外的挑战。如果我们把所有东西都作为训练环境,那么就没有必要进行推广了。
Read More研究人员开发了一种新技术,将声音信息和语言数据结合起来,纠正自动语音识别系统中的错误。该技术基于交叉模态融合,使用视觉和语言信息来提供更准确的识别结果。此外,该技术还可以提供更好的语音合成能力。研究人...
Read MoreCleanLab作为一个开源软件包在MIT诞生后,现在已经发展成为一款企业级无代码工具,为工业级ML数据管道提供高质量数据的筛选和清理。该公司最近获得了3000万美元的融资,以加速产品开发和扩展市场。
Read More近日,由一群开发者共同开发的开源系统OpenLLMetry正式发布。OpenLLMetry基于OpenTelemetry,旨在提供对LLMs的观测性能分析。LLMs是轻量级的微服务,可以在边缘设备上运行,OpenLLMetry的发布将为开发人员提供更好的...
Read More人工智能驱动软件的下一步演变并非聊天机器人,而是利用LLMs来完成实际工作的应用。AI基础设施联盟的此篇电子书全面覆盖了此领域的各个方面,包括Prompt工程、LLM逻辑和推理、主要框架如LlamaIndex、LangChain、Hays...
Read More在3D场景中检测和命名新物体一直是一个艰巨的挑战。然而,最近一个名为CoDA的项目提出了一种新的解决方法。该方法通过智能猜测新物体可能出现的位置,然后将这些物体的特征与图片和文本进行匹配,所有这些操作都在一...
Read More