漫话开发者 - UWL.ME 精选全球AI前沿科技和开源产品
2025-04-29 talkingdev

Valeo AI推出VaViM和VaVAM:生成式视频模型革新自动驾驶轨迹预测

Valeo AI最新发布了两项突破性技术:VaViM自回归视频模型和VaVAM驾驶轨迹预测模型。VaViM通过时空令牌序列预测技术,实现了对连续视频帧的高精度建模;而VaVAM则创新性地将学习到的视频表征通过模仿学习转化为可执行...

Read More
2025-04-28 talkingdev

开源AI模型Dia-1.6B:以小体积实现超越巨头的情绪语音合成

Nari Labs最新发布的Dia-1.6B开源AI模型在情绪语音合成领域取得突破性进展。这款仅1.6B参数的微型模型在测试中展现出超越ElevenLabs和Sesame等行业领导者的表现,尤其擅长模拟极端情绪状态,如歇斯底里的恐怖尖叫。...

Read More
2025-04-28 talkingdev

Pippo开源:单张图生成高分辨率多视角3D模型

Meta研究院推出的Pippo项目突破传统三维重建技术限制,开发了一套无需预训练模型的虚拟人体生成系统。该系统仅需输入单张二维人像,即可输出具有高保真细节的多视角3D人体表征,其核心技术可能涉及神经辐射场(NeRF...

Read More
2025-04-28 talkingdev

DeepSeek发布2025年新一代AI模型R2,引领大语言模型技术革新

DeepSeek公司近日宣布将于2025年正式推出新一代人工智能模型DeepSeek-R2,这一重大进展标志着大语言模型技术进入全新发展阶段。根据官方技术博客透露,R2模型将采用创新的混合架构设计,整合了稀疏专家模型(MoE)与密...

Read More
2025-04-27 talkingdev

[开源] 开发者成功在复古IBM ThinkPad上运行自研32位操作系统RetrOS-32

开发者Joe Bayer近日宣布其个人项目RetrOS-32操作系统成功在IBM经典ThinkPad设备上完成实机部署。这款针对i386架构开发的操作系统具备图形界面、多任务处理、网络功能等现代特性,并创新性地集成了32位C语言编译器。...

Read More
2025-04-27 talkingdev

MILS开源-无需训练即可实现视觉与听觉感知

Facebook研究团队近日在GitHub开源了MILS项目代码,其核心突破在于证明大型语言模型(LLMs)无需额外训练即可具备跨模态感知能力。该项目论文《LLMs can see and hear without any training》提出创新方法,通过重构...

Read More
2025-04-27 talkingdev

[开源] Stuffed-Na(a)N:为NaN填充数据的创新JavaScript库

近日,GitHub上出现了一个名为Stuffed-Na(a)N的开源项目,该项目旨在解决JavaScript中NaN(Not a Number)值的处理问题。NaN在数值计算中经常出现,但传统的处理方法往往不够灵活。Stuffed-Na(a)N通过提供一种创新的...

Read More
2025-04-26 talkingdev

GCC 15.1正式发布:开源编译器迎来重大更新

GNU编译器集合(GCC)15.1版本已正式发布,标志着这一开源编译器工具链的重要里程碑。作为Linux生态系统的基础组件,GCC的更新将直接影响全球数百万开发者的工作流程。本次更新包含了对C++23标准的全面支持、Rust语...

Read More
  1. Prev Page
  2. 36
  3. 37
  4. 38
  5. Next Page