漫话开发者 - UWL.ME 精选全球AI前沿科技和开源产品
2025-12-02 talkingdev

开源|ViBT:20B参数视觉桥接Transformer,高效图像与视频编辑新突破

近日,GitHub上开源了一个名为ViBT(Vision Bridge Transformer)的项目,该项目将布朗桥模型(Brownian Bridge Models)扩展至高达200亿参数规模,专门用于高效的图像与视频条件生成任务。ViBT的核心创新在于其采用...

Read More
2025-12-02 talkingdev

开源|苹果发布STARFlow与STARFlow-V:基于Transformer自回归流的图像与视频生成新突破

苹果公司在Hugging Face平台开源了STARFlow与STARFlow-V模型,标志着图像与视频生成领域迎来了一项重要的技术进展。STARFlow是一种创新的Transformer自回归流模型,其核心在于巧妙地将自回归模型强大的表达能力与归...

Read More
2025-12-02 talkingdev

NVIDIA发布全球首个开源自动驾驶推理模型Alpamayo-R1,推动物理AI开放生态

在NeurIPS 2024大会上,NVIDIA发布了一系列面向数字与物理世界AI开发的新工具,其中最引人注目的是推出了全球首个面向移动出行领域的开源、工业级推理视觉语言动作模型——NVIDIA DRIVE Alpamayo-R1。该模型专为自动驾...

Read More
2025-12-02 talkingdev

开源|Ghostty 终端编译为 WASM,实现与 xterm.js API 兼容

近日,一个名为 Ghostty 的终端模拟器项目推出了其 Web 版本,该项目通过 WebAssembly 技术将 Ghostty 编译为可在浏览器中运行的格式,并实现了与业界广泛使用的 xterm.js 终端 API 的兼容性。这一进展意味着开发者...

Read More
2025-12-01 talkingdev

开源|Exposed by Default:你的浏览器正在泄露多少隐私?

近日,一个名为'Exposed by Default'的开源项目网站引发科技界与隐私安全领域的广泛关注。该网站通过实时检测,直观展示了用户浏览器在未经明确授权的情况下自动暴露的庞大数据量,这些数据共同构成了一个高度独特的...

Read More
2025-12-01 talkingdev

开源|ENACT基准发布:以第一人称世界模型评估具身认知能力

近日,一个名为ENACT的新型基准测试在人工智能与认知科学交叉领域引发关注。该基准旨在通过第一人称视角的世界建模来系统评估智能体的具身认知能力。具身认知理论认为,智能体的认知过程与其物理身体及与环境的实时...

Read More
2025-12-01 talkingdev

开源|从GitHub迁移至Codeberg:一位开发者的实践体验与深度思考

近日,一篇关于开发者将代码仓库从GitHub迁移至开源平台Codeberg的实践分享引发了技术社区的广泛关注。作者详细记录了迁移过程中的技术细节、面临的挑战以及最终体验,为关注代码托管平台选择、开源生态可持续性及数...

Read More
2025-12-01 talkingdev

开源|LLVM-MOS项目:Clang/LLVM编译器现已支持经典6502处理器

近日,一个名为LLVM-MOS的开源项目引起了编译器和复古计算社区的广泛关注。该项目是著名Clang/LLVM编译器工具链的一个分支,专门针对经典的MOS 6502微处理器进行优化和适配。6502处理器是上世纪70-80年代众多标志性...

Read More
  1. Prev Page
  2. 2
  3. 3
  4. 4
  5. Next Page