LlamaIndex发布了0.7.0版本,旨在改进库的模块化和可定制性。新版本包括独立的OpenAI、HuggingFace和PaLM LLM抽象,允许用户独立使用响应合成模块,并为文档/节点对象提供了增强的元数据管理。此更新旨在增强LLM应用...
Read More这项研究提出了一种名为滤波引导扩散(FGD)的方法,可以在不需要额外训练或更改底层模型的情况下增强图像翻译。FGD根据先前步骤调整扩散过程,并在结构指导和性能方面提供了显著的改进。
Read MoreAudiocraft推出MusicGen,这是一种简化和增强音乐生成的模型。这种单阶段的自回归Transformer模型不需要像之前的方法那样进行自监督语义表示,通过并行预测所有码本,它更高效地生成音乐,从而每秒音频的步骤更少。
Read MoreXrayGPT是一种开创性的人工智能模型,可以以对话的方式解释胸部X射线,并回答相关问题。它将视觉理解与文本知识相结合,并通过真实放射学报告的摘要进行增强。XrayGPT为自动化X射线分析提供了新的可能性。
Read MoreClip2Protect项目引入了一种创新的两步方法,以确保面部隐私,特别是在强大的人脸识别系统的时代。它创建了看起来自然,但能欺骗人脸识别软件的'化妆'脸,相比之前的隐私增强方法,显示出更好的性能。
Read MoreSeal是一个新的系统,使用先进的视觉识别模型来更好地解释各种类型的车辆传感器数据,使其更高效和适应性。在测试中,与标准方法相比,它提高了近37%的传感器数据解释能力,显示了改善未来汽车安全和导航系统的巨大...
Read More这家中国巨头已经从NVIDIA购买了约10万个GPU,用于不同的人工智能项目。这些订单是在对GPU出口进行监管限制之前下达的。这是又一家通过计算能力增强其人工智能努力的公司。
Read More