漫话开发者 - UWL.ME 精选全球AI前沿科技和开源产品
2025-04-04 talkingdev

[开源]Nebius推出Kvax:基于JAX的Flash Attention优化实现,助力长上下文训练

Nebius近日开源了Kvax项目,这是一个基于JAX框架的Flash Attention实现,专门针对长上下文训练场景进行了优化。Kvax通过创新的上下文并行技术和高效的文档掩码计算,实现了更快的训练速度和更高的数据密度压缩,在性...

Read More
2025-03-28 talkingdev

[论文推荐]Guidance-Free Training:无需分类器引导的视觉生成模型训练新方法

近日,一项名为Guidance-Free Training(GFT)的技术突破引发计算机视觉领域关注。该技术通过完全消除对Classifier-Free Guidance(CFG)的依赖,在保持生成质量的同时显著降低计算成本。与传统基于蒸馏的方法不同,...

Read More
2025-02-13 talkingdev

ESM2蛋白质折叠模型在Equinox GitHub仓库中发布

ESM2是一款卓越的蛋白质折叠模型,现已在广受欢迎的Jax包中发布了维护良好的版本。该模型利用先进的机器学习技术,能够高效预测蛋白质的三维结构,为生物医学研究和药物开发提供了强大的工具。此次发布的版本经过优...

Read More
2024-05-06 talkingdev

Penzai:JAX库的新成员,让模型操作和理解变得更简单

近日,JAX库的新成员Penzai亮相。Penzai通过具有可读性的功能Pytree结构,使得对训练模型的操纵和理解变得更加容易。这个库包含了丰富多样的工具,可以用于模型的可视化、调试以及组成部分分析。Penzai的安装和使用...

Read More
2024-05-06 talkingdev

苹果Ajax LLM技术升级iOS18 Siri AI 功能,Safari和Spotlight Search新增AI增强功能

苹果公司即将在iOS 18中,为Safari、Spotlight Search和Siri增强AI相关功能。Safari的其中一个关键功能是文本摘要。 Siri也将获得类似的更新,使其能够以简化的方式生成响应来传递消息的内容。苹果的AI模型将完全在...

Read More
2024-04-30 talkingdev

深度揭秘Jax框架内部运作

近日,一篇名为《Autodidax》的教程引起了广大技术爱好者的关注,该教程深度解析了日益崭露头角的Jax框架的内部原理。Jax框架因其强大的功能和灵活性,已经逐渐成为技术社区的热门话题。本教程不仅深入剖析了Jax框架...

Read More
2024-04-28 talkingdev

MaxText:谷歌开源高性能机器学习模型

MaxText是一个高性能、高可扩展性的开源低级机器学习模型(LLM),完全使用Python/Jax编写,目标是在Google Cloud的TPUs和GPUs上进行训练和推理。这个项目在GitHub上公开,充分展示了其强大的功能和优秀的性能。MaxTex...

Read More
2024-04-21 talkingdev

Penzai: 用于构建、编辑和可视化神经网络的JAX研究工具包

在人工智能领域,神经网络是一种非常重要的模型。为了提高神经网络的性能,研究人员需要使用高效的工具来构建、编辑和可视化这些网络。近日,谷歌发布了名为Penzai的JAX研究工具包,旨在帮助研究人员更轻松地完成这...

Read More
  1. 1
  2. 2
  3. 3
  4. Next Page