漫话开发者 - UWL.ME 精选全球AI前沿科技和开源产品
2025-04-26 talkingdev

[开源] 开发者成功在复古IBM ThinkPad上运行自研32位操作系统RetrOS-32

开发者Joe Bayer近日宣布其个人项目RetrOS-32操作系统成功在IBM经典ThinkPad设备上完成实机部署。这款针对i386架构开发的操作系统具备图形界面、多任务处理、网络功能等现代特性,并创新性地集成了32位C语言编译器。...

Read More
2025-04-26 talkingdev

MILS开源-无需训练即可实现视觉与听觉感知

Facebook研究团队近日在GitHub开源了MILS项目代码,其核心突破在于证明大型语言模型(LLMs)无需额外训练即可具备跨模态感知能力。该项目论文《LLMs can see and hear without any training》提出创新方法,通过重构...

Read More
2025-04-25 talkingdev

[开源] Magnitude:基于视觉大模型的Web应用测试框架,开源发布

开发者Anders和Tom近日在Hacker News上宣布推出Magnitude,一个完全开源的、基于视觉大模型(VLM)的端到端Web应用测试框架。该框架旨在解决传统浏览器代理测试工具速度慢、成本高且结果不一致的问题。Magnitude采用...

Read More
2025-04-21 talkingdev

[开源]ZeroSumEval Benchmark:多智能体对抗框架重塑大语言模型评估标准

Meta旗下Facebook Research团队推出的ZeroSumEval Benchmark在GitHub开源,这一动态评估框架通过竞争性多智能体模拟,为大语言模型(LLM)在推理、知识储备和规划任务等核心能力维度建立了全新测试范式。该框架创新...

Read More
2025-04-21 talkingdev

[开源]REVERSE项目:VLM自检与修正幻觉的新训练推理框架(GitHub Repo)

GitHub开源项目REVERSE提出的创新性解决方案,为视觉语言模型(VLM)的幻觉问题提供了突破性进展。该项目构建了一个完整的训练与推理管道,使VLM能够自主检测并修正其输出中的幻觉内容。该技术通过建立内部一致性验...

Read More
2025-04-21 talkingdev

[开源]VistaDPO通过分层优化实现视频文本对齐,提升多维度偏好学习

VistaDPO项目通过创新的分层优化方法,在视频与文本对齐领域取得重要突破。该项目构建了一个包含7200个样本的全新数据集,专门用于优化空间和时间维度的偏好学习。其核心技术在于采用分层次的优化策略,能够同时处理...

Read More
2025-04-20 talkingdev

Turing-Drawings:探索算法艺术与计算美学的边界

近日,一种名为Turing-Drawings的算法艺术形式引发技术圈广泛关注。该项目通过模拟图灵机原理,将数学计算与视觉艺术相结合,生成极具抽象美感的数字绘画作品。其核心在于利用确定性有限状态自动机的规则集控制像素...

Read More
2025-04-18 talkingdev

[开源]DeepSpeed团队推出DeepCompile:基于torch compile的分布式训练加速方案

微软DeepSpeed团队在GitHub开源了DeepCompile项目,通过引入编译技术显著提升分布式训练性能。该项目针对训练过程中的瓶颈操作进行深度优化,采用改进版的torch compile实现算子融合与代码生成,实测可使关键操作获...

Read More
  1. Prev Page
  2. 6
  3. 7
  4. 8
  5. Next Page