漫话开发者 - UWL.ME 精选全球AI前沿科技和开源产品
2025-05-14 talkingdev

[开源]UCGM:统一框架实现连续生成模型的训练与采样

加州大学团队在GitHub开源了UCGM项目,为生成式AI领域带来突破性技术框架。该项目创新性地构建了统一架构,可同时支持多步(如扩散模型)和少步(如流模型)连续生成模型的训练与采样流程。通过数学层面的抽象整合,...

Read More
2025-05-14 talkingdev

视觉自回归方法EAR开源:无需量化的连续空间生成技术

近期GitHub开源项目EAR提出了一种突破性的视觉自回归生成方法,通过采用严格适当评分规则(如能量评分)绕过了传统量化步骤,直接在连续数据空间中进行生成。该技术摒弃了传统概率建模的约束,通过数学上严谨的评分...

Read More
2025-05-13 talkingdev

HelixDB:基于Rust构建的开源图向量数据库,专为RAG和AI应用设计

HelixDB是一款基于Rust构建的开源图向量数据库,专为RAG(检索增强生成)和AI应用设计。它原生整合了图和向量数据类型,无需牺牲性能。HelixDB的初始目标是为RAG提供支持,其基准测试显示,在向量查询方面与Pinecone...

Read More
2025-05-13 talkingdev

[开源]LLMs在多轮对话中表现显著下降(GitHub仓库)

最新研究发现,大型语言模型(LLMs)在多轮对话任务中的表现存在显著缺陷。根据微软在GitHub上公开的研究项目数据显示,由于模型可靠性和早期错误假设问题,LLMs在多轮对话中的任务表现平均下降了39%。这一发现对当...

Read More
2025-05-13 talkingdev

UniVLA-开源通用机器人策略框架,无标注视频学习

OpenDriveLab团队在GitHub开源了UniVLA框架,这项突破性技术通过推断任务中心的潜在动作,实现了从无标注视频中学习跨机器人平台的通用策略。该框架采用先进的视觉-语言-动作联合建模方法,能自适应不同机械结构的机...

Read More
2025-05-12 talkingdev

[开源]FastVLM:苹果发布高效视觉语言模型视觉编码方案,CVPR 2025论文实现

苹果公司近日在GitHub开源了CVPR 2025论文《FastVLM: Efficient Vision Encoding for Vision Language Models》的官方实现代码库。该项目提出了一种高效的视觉编码方法,旨在优化视觉语言模型(VLM)中的视觉信息处...

Read More
2025-05-11 talkingdev

开源纯C语言轻量级TODO应用,仅27KB

开发者Efeckc17近日在GitHub上开源了一个名为simple-todo-c的轻量级Windows待办事项应用程序。该项目完全使用纯C语言和Win32 API开发,没有依赖任何外部框架,最终生成的可执行文件仅27KB大小。这一成就展示了原生开...

Read More
2025-05-11 talkingdev

Scraperr开源–自托管的网页抓取工具

近日,GitHub上出现了一款名为Scraperr的自托管网页抓取工具,引发了开发者和技术爱好者的广泛关注。该项目由开发者jaypyles创建,旨在为用户提供一个灵活、可定制的网页抓取解决方案。与传统的云端抓取服务不同,Sc...

Read More
  1. 1
  2. 2
  3. 3
  4. Next Page