开源的相关内容 - 漫话开发者

2025-03-14 talkingdev

[开源] Open Sora项目发布代码与模型权重，低成本训练成果引人瞩目

Open Sora项目自模型首次发布以来，一直在积极推进，并以低于20万美元的成本训练出了一个具有竞争力的模型。此次，项目团队全面公开了所有代码和模型权重，旨在帮助研究人员和开发者复现其实验结果。尽管模型的动态...

2025-03-14 talkingdev

近日，GitHub上发布了一个名为REF-VLM的开源项目，该项目通过引入基于三元组的结构化表示，统一了多模态大语言模型（LLMs）中的视觉解码任务。多模态LLMs是当前人工智能领域的前沿技术，能够在处理视觉和文本信息时...

2025-03-14 talkingdev

Audio Flamingo 2 是一个基于Qwen架构构建的最新音频理解模型，其独特之处在于几乎完全使用了合成数据进行训练。这一突破性进展不仅提升了模型在音频处理和理解任务中的表现，还展示了合成数据在AI训练中的巨大潜力...

2025-03-14 talkingdev

近日，GitHub上开源了一个名为Agent S的计算机使用系统，其强大的功能引起了广泛关注。Agent S在浏览器、桌面系统甚至移动设备任务处理方面均表现出色，达到了行业领先水平。作为一个开源项目，Agent S不仅提供了高...

2025-03-14 talkingdev

近日，一款名为Bubbles的网页游戏在技术社区中引起了广泛关注。这款游戏完全基于vanilla JavaScript开发，无需依赖任何外部框架或库，展示了JavaScript在游戏开发中的强大能力。Bubbles的核心玩法简单而富有挑战性，...

2025-03-13 talkingdev

Hugging Face 团队近日发布了其 DeepSeek 推理模型的开源复制项目 OpenR1 的最新更新。此次更新揭示了一个有趣的发现：当针对竞争性编程进行专门调优时，小型模型的表现可以超越更大规模的模型。这一发现不仅挑战了...

2025-03-13 talkingdev

PromptPex是一个创新的开发者工具，它将AI模型中的提示词（prompts）视为函数，并自动生成测试输入，从而实现对AI模型提示词的系统化单元测试。这一工具的诞生标志着AI开发工具链的进一步完善，尤其是在提示工程（Pr...

2025-03-13 talkingdev

近日，Luma Labs在GitHub上开源了一个名为感应矩匹配（Inductive Moment Matching, IMM）的项目，该项目通过一种新的矩匹配框架，为连续数据的扩散模型提供了一种统一且简化的解决方案。这一技术不仅显著减少了生成...