漫话开发者 - UWL.ME 精选全球AI前沿科技和开源产品
2023-07-25 talkingdev

微软的BingChat向Chrome和Safari用户开放

微软的AI聊天机器人,Bing Chat,正在向非微软浏览器用户扩展。这次扩展将使微软的ChatGPT类AI聊天机器人可以服务于更广泛的用户群体,因为它之前只在微软的产品中,比如Bing移动应用和Microsoft Edge浏览器中向用户...

Read More
2023-07-20 talkingdev

引人注目的手部物体接触数据集开源

估计手部与物体接触的时机对于增强现实/虚拟现实和机器人技术来说是一项关键挑战。在深度学习领域,数据就是女王。这个新的大规模数据集包含了数百万帧的标注数据,可用于执行各种任务,如手部重构、模拟物体运动等...

Read More
2023-07-12 talkingdev

Anthropic发布新模型Claude 2:提供更强大的性能和扩展响应

Anthropic公司最近发布了其最新模型Claude 2。Claude 2提供了改进的性能,扩展的响应,并可通过API和beta站点进行访问。Claude 2拥有增强的推理,编码和数学能力,可以处理每个提示中多达100K的令牌,使其能够处理复...

Read More
2023-07-10 talkingdev

无需强化学习环节的逆向强化学习:快速且稳健

逆向强化学习有时被称为行为克隆或专家模仿。它通过引入一个内部强化学习环路,将监督调优的简单任务变得复杂。然而,如果我们去掉这个环路,我们可以获得强化学习探索的许多优势,同时避免了函数近似问题的挑战。这...

Read More
2023-07-07 talkingdev

LlamaIndex 0.7.0:更好地支持自底向上的LLM应用开发

LlamaIndex发布了0.7.0版本,旨在改进库的模块化和可定制性。新版本包括独立的OpenAI、HuggingFace和PaLM LLM抽象,允许用户独立使用响应合成模块,并为文档/节点对象提供了增强的元数据管理。此更新旨在增强LLM应用...

Read More
2023-07-06 talkingdev

论文:增强视觉-语言零样本学习技术提升AI性能

这项研究提出了一种通过关注细节和关键词来改进AI对图像文本任务的理解的技术,提高了性能,特别是在面对未知情况时。

Read More
2023-07-03 talkingdev

Filtered Guided Diffusion:高效的图生成图方法(GitHub仓库)

这项研究提出了一种名为滤波引导扩散(FGD)的方法,可以在不需要额外训练或更改底层模型的情况下增强图像翻译。FGD根据先前步骤调整扩散过程,并在结构指导和性能方面提供了显著的改进。

Read More
2023-06-30 talkingdev

MusicGen: 简化音乐生成的一种新方法开源

Audiocraft推出MusicGen,这是一种简化和增强音乐生成的模型。这种单阶段的自回归Transformer模型不需要像之前的方法那样进行自监督语义表示,通过并行预测所有码本,它更高效地生成音乐,从而每秒音频的步骤更少。

Read More
  1. Prev Page
  2. 68
  3. 69
  4. 70
  5. Next Page