漫话开发者 - UWL.ME 精选全球AI前沿科技和开源产品
2025-10-21 talkingdev

BERT竟是单步文本扩散?谷歌DeepMind新研究揭示语言模型本质关联

近日,谷歌DeepMind团队发布的Gemini Diffusion实验性语言模型引发学界关注。该模型突破传统GPT逐词生成范式,采用扩散模型技术通过逐步去噪的方式直接生成完整文本块。研究人员在研读《大语言扩散模型》论文时发现...

Read More
2025-10-17 talkingdev

论文推荐|ScaleRL:大型语言模型强化学习计算扩展的首个系统性研究框架

来自大规模实验的研究团队发布了名为ScaleRL的创新框架,这是首个针对大型语言模型强化学习计算扩展的系统性研究方法。该研究通过超过40万GPU小时的实验数据,构建了可预测的S型计算-性能曲线,揭示了RL训练中算法改...

Read More
2025-10-15 talkingdev

表征自编码器革新扩散Transformer:多模态预训练模型驱动图像生成质量突破

近期发布的表征自编码器(RAE)技术为潜在扩散模型带来重大升级。该技术通过使用DINO、SigLIP或MAE等预训练编码器替代传统变分自编码器(VAE),结合学习型解码器构建高维潜在空间。实验表明,这种新型架构能显著提...

Read More
2025-10-02 talkingdev

谷歌发布Tunix:基于JAX的LLM后训练工具库,加速大模型生产部署

谷歌开发者博客最新推出开源项目Tunix,这是一个基于JAX框架原生设计的专业化工具库,致力于简化大型语言模型从预训练到完全对齐、生产就绪的完整流程。该库为开发者提供了一套全面且友好的工具集,支持大规模模型对...

Read More
2025-08-24 talkingdev

深度解析:Claude Code为何成为代码生成领域的性能标杆

近期,AI研究机构MinusX发布的技术分析报告《Decoding Claude Code》引发开发者社区广泛关注。该报告通过逆向工程和架构分析揭示了Anthropic公司开发的Claude代码生成模型的核心技术优势。报告指出,Claude采用创新...

Read More
2025-08-13 talkingdev

AI2发布MolmoAct:首个支持3D空间推理的动作理解模型

艾伦人工智能研究所(AI2)近日开源了MolmoAct模型,这是首个基于Molmo框架构建的、专注于三维空间推理的动作理解系统。该模型通过创新的三维空间表征学习方法,实现了对复杂指令的精准环境交互能力,在SpatialQA等...

Read More
2025-08-11 talkingdev

Grok V7升级版完成预训练,原生多模态支持音视频处理

马斯克旗下xAI团队开发的Grok模型即将迎来重大更新,内部版本号V7已完成预训练。此次升级的核心突破在于原生多模态能力的实现,模型可直接处理音频和视频输入,标志着通用人工智能在跨模态理解领域迈出关键一步。值...

Read More
2025-07-09 talkingdev

AI2发布全开源语言模型OLMo 2系列,32B版本超越GPT-3.5 Turbo

艾伦人工智能研究所(AI2)近日推出OLMo 2全开源语言模型家族,标志着大模型开源生态取得重大突破。该系列包含32B、13B、7B和1B四种参数规模,其中旗舰型号OLMo 2 32B成为首个在主流基准测试中同时超越GPT-3.5 Turbo...

Read More
  1. 1
  2. 2
  3. 3
  4. Next Page