开源的相关内容 - 漫话开发者

2025-12-02 talkingdev

开源|ViBT：20B参数视觉桥接Transformer，高效图像与视频编辑新突破

近日，GitHub上开源了一个名为ViBT（Vision Bridge Transformer）的项目，该项目将布朗桥模型（Brownian Bridge Models）扩展至高达200亿参数规模，专门用于高效的图像与视频条件生成任务。ViBT的核心创新在于其采用...

2025-12-02 talkingdev

苹果公司在Hugging Face平台开源了STARFlow与STARFlow-V模型，标志着图像与视频生成领域迎来了一项重要的技术进展。STARFlow是一种创新的Transformer自回归流模型，其核心在于巧妙地将自回归模型强大的表达能力与归...

2025-12-02 talkingdev

在NeurIPS 2024大会上，NVIDIA发布了一系列面向数字与物理世界AI开发的新工具，其中最引人注目的是推出了全球首个面向移动出行领域的开源、工业级推理视觉语言动作模型——NVIDIA DRIVE Alpamayo-R1。该模型专为自动驾...

2025-12-02 talkingdev

近日，一个名为 Ghostty 的终端模拟器项目推出了其 Web 版本，该项目通过 WebAssembly 技术将 Ghostty 编译为可在浏览器中运行的格式，并实现了与业界广泛使用的 xterm.js 终端 API 的兼容性。这一进展意味着开发者...

2025-12-01 talkingdev

近日，一个名为'Exposed by Default'的开源项目网站引发科技界与隐私安全领域的广泛关注。该网站通过实时检测，直观展示了用户浏览器在未经明确授权的情况下自动暴露的庞大数据量，这些数据共同构成了一个高度独特的...

2025-12-01 talkingdev

近日，一个名为ENACT的新型基准测试在人工智能与认知科学交叉领域引发关注。该基准旨在通过第一人称视角的世界建模来系统评估智能体的具身认知能力。具身认知理论认为，智能体的认知过程与其物理身体及与环境的实时...

2025-12-01 talkingdev

近日，一篇关于开发者将代码仓库从GitHub迁移至开源平台Codeberg的实践分享引发了技术社区的广泛关注。作者详细记录了迁移过程中的技术细节、面临的挑战以及最终体验，为关注代码托管平台选择、开源生态可持续性及数...

2025-12-01 talkingdev

近日，一个名为LLVM-MOS的开源项目引起了编译器和复古计算社区的广泛关注。该项目是著名Clang/LLVM编译器工具链的一个分支，专门针对经典的MOS 6502微处理器进行优化和适配。6502处理器是上世纪70-80年代众多标志性...