漫话开发者 - UWL.ME 精选全球AI前沿科技和开源产品
2024-04-10 talkingdev

使用Colab在H100上训练超过20万上下文窗口的新梯度累积卸载技术

Longcontext Alpaca训练技术最近取得了重大突破,通过在H100硬件上使用新的梯度累积卸载技术,成功训练了超过200,000个上下文窗口。这种创新方法使得大规模深度学习模型的训练变得更加高效,显著提高了计算资源的利...

Read More
2024-04-10 talkingdev

戴密斯·哈萨比斯能否挽救谷歌?

DeepMind创始人戴密斯·哈萨比斯目前领导着谷歌统一的人工智能研究部门,致力于通过AlphaGo和AlphaFold等突破性成果保持科技巨头在人工智能领域的领先地位。尽管取得了成功,但将AI集成到实际产品中以及来自OpenAI的C...

Read More
2024-04-10 talkingdev

AI技术如何影响游戏配音行业:道德与权益的较量

知名配音艺术家Cissy Jones共同创立了Morpheme,旨在提供符合道德规范的AI语音建模服务。该平台确保演员同意并为AI生成的语音内容获得适当报酬。然而,随着游戏行业对AI技术的广泛采用,人类配音艺术家可能会被边缘...

Read More
2024-04-10 talkingdev

英特尔发布Gaudi 3 AI处理器,性能超越英伟达H100

英特尔公司近日宣布推出新一代Gaudi 3 AI处理器,该处理器在性能上实现了重大突破。据官方数据显示,Gaudi 3在训练性能上提升高达1.7倍,推理性能提升50%,同时在效率上也比英伟达的H100处理器高出40%,而成本却更低...

Read More
2024-04-10 talkingdev

Visual Autoregressive Models:图像生成高分辨率解决方案

Visual Autoregressive Models是一个新的GitHub项目,它将图像生成视为逐步预测更高分辨率的过程。该代码库包含了用于下一分辨率预测工作的推理脚本和演示笔记本。虽然训练代码将很快公开,但目前该项目已经引起了技...

Read More
2024-04-10 talkingdev

SqueezeAttention技术助力LLM优化,内存使用降低30%至70%

近日,开发者社区GitHub上出现了一项名为SqueezeAttention的新技术,该技术针对大型语言模型(LLMs)的键值缓存进行了优化。通过SqueezeAttention,内存使用量能够显著降低30%至70%,同时吞吐量也得到了翻倍提升。这...

Read More
2024-04-10 talkingdev

人工智能数据竞赛的四个关键看点

人工智能的发展,尤其是像GPT-3这样的大型语言模型,严重依赖于大量数据。随着高质量在线数据可能在2026年耗尽,科技公司如Meta和Google正竞相收集更多数据。这些科技巨头采用有争议的方法来推动他们的AI进步,包括...

Read More
2024-04-10 talkingdev

Meta即将发布全新大型语言模型Llama 3

Meta公司近日确认,其最新一代大型语言模型Llama 3将于下月推出。Llama 3是Meta为其生成式人工智能助手而开发的先进技术,旨在提供更加精准、自然的对话体验。该模型经过深入的优化和升级,预计将为用户带来更加丰富...

Read More
  1. Prev Page
  2. 83
  3. 84
  4. 85
  5. Next Page