漫话开发者 - UWL.ME 精选全球AI前沿科技和开源产品
2024-03-05 talkingdev

Smooth Diffusion-增强文本到图像扩散模型的潜在空间平滑度

一种名为Smooth Diffusion的新方法解决了文本到图像扩散模型的潜在空间平滑度挑战。该方法确保在输入微小调整时,图像呈现出一致和逐渐的变化。

Read More
2024-03-05 talkingdev

GPT-4只能成功完成14%的Agent任务

社区对代理在处理各种数字工作负载方面的潜力非常兴奋。然而,即使是最好的通用模型也难以完成人类70%以上成功的任务。显然,我们可能需要专门针对这些任务进行训练的模型

Read More
2024-03-05 talkingdev

OpenAI与Figure合作,让人形机器人更加智能化

不久的将来,人形机器人将会与人类制造工人一起工作。在这个领域中占据重要地位的Figure公司最近筹集了6.75亿美元,并与OpenAI达成协议,为其机器人开发下一代人工智能模型。这笔资金超过了Figure最初设定的金额150...

Read More
2024-03-05 talkingdev

特斯拉CEO马斯克起诉OpenAI

特斯拉CEO马斯克起诉OpenAI,声称GPT-4构成AGI,不再受限于与微软的协议。他还主张更多的透明度和公开性。OpenAI是人工智能研究公司,由马斯克等人创立。该公司的GPT-3模型在自然语言处理领域取得了重要进展,但也引...

Read More
2024-03-05 talkingdev

AI领域再次掀起高潮,Anthropic公司的Claude 3声称具有“接近人类”能力

Anthropic的Claude 3似乎在一系列认知任务上树立了新的行业标准。该公司声称,在某些情况下,它接近于“人类水平”的能力。Claude 3有三个模型:Claude 3 Haiku,Claude 3 Sonnet(为Claude.ai聊天机器人提供动力)和C...

Read More
2024-03-04 talkingdev

静态KV缓存实现HF推理速度2倍提升

如何加速推理是许多人关注的话题。本代码分享介绍了如何通过静态KV缓存提高Hugging Face框架上Llama模型的推理速度。

Read More
2024-03-04 talkingdev

Drive-WM让自动驾驶更安全

Drive-WM可以生成高质量的多视角视频,预测未来情景,从而使自动驾驶汽车做出更安全、更高效的驾驶决策。该技术可以根据车辆周围的环境生成准确的预测模型,为自动驾驶汽车提供更高质量的输入数据。此外,Drive-WM还...

Read More
2024-03-04 talkingdev

扩散蒸馏的悖论

扩散模型将困难问题(比如图像生成)拆分成多个小问题(比如从图像中去除微小的噪点)。单步扩散生成已经得到了很多努力,但似乎这并不符合初衷。本文探讨了扩散蒸馏的悖论,并概述了许多可供研究的方向。

Read More
  1. Prev Page
  2. 268
  3. 269
  4. 270
  5. Next Page