漫话开发者 - UWL.ME 精选全球AI前沿科技和开源产品
2023-07-07 talkingdev

LlamaIndex 0.7.0:更好地支持自底向上的LLM应用开发

LlamaIndex发布了0.7.0版本,旨在改进库的模块化和可定制性。新版本包括独立的OpenAI、HuggingFace和PaLM LLM抽象,允许用户独立使用响应合成模块,并为文档/节点对象提供了增强的元数据管理。此更新旨在增强LLM应用...

Read More
2023-07-06 talkingdev

论文:增强视觉-语言零样本学习技术提升AI性能

这项研究提出了一种通过关注细节和关键词来改进AI对图像文本任务的理解的技术,提高了性能,特别是在面对未知情况时。

Read More
2023-07-03 talkingdev

Filtered Guided Diffusion:高效的图生成图方法(GitHub仓库)

这项研究提出了一种名为滤波引导扩散(FGD)的方法,可以在不需要额外训练或更改底层模型的情况下增强图像翻译。FGD根据先前步骤调整扩散过程,并在结构指导和性能方面提供了显著的改进。

Read More
2023-06-30 talkingdev

MusicGen: 简化音乐生成的一种新方法开源

Audiocraft推出MusicGen,这是一种简化和增强音乐生成的模型。这种单阶段的自回归Transformer模型不需要像之前的方法那样进行自监督语义表示,通过并行预测所有码本,它更高效地生成音乐,从而每秒音频的步骤更少。

Read More
2023-06-30 talkingdev

XrayGPT:一种用于放射图像分析的对话式医疗AI开源

XrayGPT是一种开创性的人工智能模型,可以以对话的方式解释胸部X射线,并回答相关问题。它将视觉理解与文本知识相结合,并通过真实放射学报告的摘要进行增强。XrayGPT为自动化X射线分析提供了新的可能性。

Read More
2023-06-21 talkingdev

Clip2Protect项目:保护面部隐私的一种方法(GitHub仓库)

Clip2Protect项目引入了一种创新的两步方法,以确保面部隐私,特别是在强大的人脸识别系统的时代。它创建了看起来自然,但能欺骗人脸识别软件的'化妆'脸,相比之前的隐私增强方法,显示出更好的性能。

Read More
2023-06-19 talkingdev

Seal:增强车辆视觉感知的框架(GitHub资源库)

Seal是一个新的系统,使用先进的视觉识别模型来更好地解释各种类型的车辆传感器数据,使其更高效和适应性。在测试中,与标准方法相比,它提高了近37%的传感器数据解释能力,显示了改善未来汽车安全和导航系统的巨大...

Read More
2023-06-19 talkingdev

字节跳动订购10亿美元的GPU

这家中国巨头已经从NVIDIA购买了约10万个GPU,用于不同的人工智能项目。这些订单是在对GPU出口进行监管限制之前下达的。这是又一家通过计算能力增强其人工智能努力的公司。

Read More
  1. Prev Page
  2. 73
  3. 74
  4. 75
  5. Next Page