漫话开发者 - UWL.ME 精选全球AI前沿科技和开源产品
2025-03-17 talkingdev

[论文推荐] 无需归一化的Transformer模型

Transformer模型在自然语言处理和其他领域取得了显著的成功,而其核心之一是层归一化(Layer Normalization)。然而,最新的研究提出了一种替代方案:通过精心设计的tanh函数,可以在不依赖层归一化的情况下保持模型...

Read More
2025-03-17 talkingdev

Baseten推出生产级AI推理平台,助力AI初创企业规模化应用

在大规模运行推理任务时,将AI转化为产品的过程中,这既是最大的挑战,也是最关键的一环。Baseten通过结合软件、专业知识和研究成果,推出了一个全面的推理平台,为生产级AI原生产品提供所需的一切支持。该平台涵盖...

Read More
2025-03-14 talkingdev

Nous Research推出API,为开发者提供OpenAI和Anthropic未构建的AI模型访问权限

Nous Research近日推出了Inference API,旨在为开发者和研究人员提供其个性化的、无限制的语言模型访问权限。该API支持两种模型:Hermes 3 Llama 70B和DeepHermes-3 8B Preview,并通过候补名单系统管理需求,增加其...

Read More
2025-03-14 talkingdev

[开源] Open Sora项目发布代码与模型权重,低成本训练成果引人瞩目

Open Sora项目自模型首次发布以来,一直在积极推进,并以低于20万美元的成本训练出了一个具有竞争力的模型。此次,项目团队全面公开了所有代码和模型权重,旨在帮助研究人员和开发者复现其实验结果。尽管模型的动态...

Read More
2025-03-14 talkingdev

Genies推出AIGC驱动系统,革新游戏资产创作流程

Game Art Forge近期推出的AI生成模板系统,旨在优化游戏资产创作的流程,提升开发者的速度、扩展性和创作控制力。该系统不仅支持高度定制化,还能保持设计一致性,为独立开发者及大型团队提供强有力的支持。通过结合...

Read More
2025-03-14 talkingdev

Camunda分享AI实操指南:如何通过流程编排实现AI驱动的自动化

AI的价值不仅取决于其技术本身,更在于其背后的流程设计与实施。缺乏有效的流程编排,AI项目可能难以释放真正的商业潜力。Camunda最新发布的点播网络研讨会深入探讨了如何将AI与业务流程相结合,实现高效自动化。该...

Read More
2025-03-14 talkingdev

[开源]统一视觉解码:REF-VLM革新多模态大模型任务

近日,GitHub上发布了一个名为REF-VLM的开源项目,该项目通过引入基于三元组的结构化表示,统一了多模态大语言模型(LLMs)中的视觉解码任务。多模态LLMs是当前人工智能领域的前沿技术,能够在处理视觉和文本信息时...

Read More
2025-03-14 talkingdev

[开源] Audio Flamingo 2:基于Qwen的最先进音频理解模型

Audio Flamingo 2 是一个基于Qwen架构构建的最新音频理解模型,其独特之处在于几乎完全使用了合成数据进行训练。这一突破性进展不仅提升了模型在音频处理和理解任务中的表现,还展示了合成数据在AI训练中的巨大潜力...

Read More
  1. Prev Page
  2. 262
  3. 263
  4. 264
  5. Next Page