漫话开发者 - UWL.ME 精选全球AI前沿科技和开源产品
2024-01-09 talkingdev

AI现状及2024年预测

本文分享了关于AI现状的思考,以及对该技术发展方向的一些预测。文章主要关注AI模型的产品、市场和人才现状,而并未涉及AI架构和基础设施的技术细节。今年,开源模型将赶上专有模型,并帮助推动边缘设备的推理。

Read More
2023-12-26 talkingdev

如何让大型语言模型运行更快

本文提供了一份长而广泛的调查,介绍了让大型语言模型运行更快的不同方法。列表不是完全穷尽的,但可以用作学习有趣主题的跳板。在可能的情况下,它包括相关论文和博客文章的链接。本文介绍了不同的方法来优化大型语...

Read More
2023-12-22 talkingdev

谷歌公布850+人联合论文,阐述Gemini语言模型的研究成果

Google的Gemini语言模型项目已经发表了一篇850多位作者的论文。该论文详细阐述了Gemini语言模型的研究成果,但缺乏关键的架构和数据集细节。该论文还提供了有关归因和评估的详细信息。

Read More
2023-12-20 talkingdev

斯坦福发布新序列混合器

Mamba的创建者(以及许多其他模型)发布了一篇很专业的博客文章,概述了基本的序列混合架构,相对于标准Transformer,可以获得相当大的速度提升。该团队的新模型使用了这种混合方法,并且获得了非常好的性能。这种新...

Read More
2023-12-12 talkingdev

StripedHyena模型:新AI模型让上下文长度变更长

近来,Transformer模型在AI领域占据统治地位。它们是强大的序列学习器,但也存在一些缺点。这项新工作基于状态空间模型,展示了新的架构可以带来巨大的好处,如增加上下文长度。

Read More
2023-12-11 talkingdev

谷歌推出Cloud TPU v5p和AI超级计算机,助力下一代AI工作负载

谷歌宣布推出Cloud TPU v5p,这是目前谷歌最强大、可扩展和灵活的AI加速器。TPU用于训练和提供AI产品。谷歌还宣布推出AI超级计算机,这是一种超级计算机架构,采用性能优化硬件、开放软件、领先的ML框架和灵活的消费...

Read More
2023-12-07 talkingdev

DiffiT:基于扩散的视觉转换器生成高分辨率图像

该项目探索了视觉转换器在基于扩散的生成学习中的有效性,揭示了Diffusion Vision Transformers(DiffiT)。该模型将U形编码器-解码器架构与新型时变自注意模块相结合。DiffiT可以生成高分辨率的图像,具有非常好的...

Read More
2023-12-06 talkingdev

MotionEditor-新扩散模型可实现动效视频编辑

MotionEditor是一种专为视频运动编辑而设计的扩散模型,巧妙地平衡了运动操作和原始内容保护。它引入了一种内容感知运动适配器和一个独特的双分支架构,注入注意力,使得编辑后的运动无缝集成,同时保持原始背景和主...

Read More
  1. Prev Page
  2. 130
  3. 131
  4. 132
  5. Next Page