漫话开发者 - UWL.ME 精选全球AI前沿科技和开源产品
2025-09-02 talkingdev

Meta考虑在Llama 5开发期间临时整合谷歌和OpenAI模型

据路透社报道,Meta正在采取一项战略性临时措施:在开发下一代大语言模型Llama 5期间,计划将谷歌和OpenAI的AI模型集成到其产品生态中。这一决策反映了当前AI军备竞赛中技术迭代与产品化需求之间的平衡策略。值得注...

Read More
2025-08-31 talkingdev

AI模型需要虚拟机:编程语言研究社区提出下一代AI系统架构新范式

ACM SIGPLAN博客最新发布的观点文章指出,当前AI模型运行环境存在严重碎片化问题,研究者提出应为AI模型构建类似Java虚拟机的标准化运行时环境。该方案能解决模型跨平台部署、资源管理和版本兼容等核心痛点,通过抽...

Read More
2025-08-21 talkingdev

开源|Luminal:基于搜索的开源GPU编译器,可自动为AI模型生成高性能内核

Luminal是由开发者Joe及其团队构建的一款创新型开源GPU编译器,专门针对AI模型自动生成高度优化的GPU内核。与传统机器学习库不同,Luminal采用搜索式编译方法:它将高级模型代码(如PyTorch格式)转换为底层GPU代码...

Read More
2025-08-17 talkingdev

OpenAI开源模型gpt-oss-120b性能测试报告:不同托管平台表现差异显著

近日,Artificial Analysis发布了一项针对OpenAI开源大语言模型gpt-oss-120b的性能基准测试报告。该测试聚焦于同一模型在不同托管服务提供商环境中的表现差异,结果显示各平台间的性能存在明显波动。作为当前参数规...

Read More
2025-08-15 talkingdev

开源|YAMS:专为LLM设计的高效持久内存存储系统

YAMS(Yet Another Memory System)是一款专为大型语言模型(LLMs)及其他应用设计的持久内存工具,采用内容寻址存储技术,具备多项先进特性。该系统通过去重和压缩技术优化存储效率,支持全文检索与语义搜索功能,...

Read More
2025-08-15 talkingdev

Baseten推出高性能开源大模型API服务,支持Kimi K2、GPT-OSS等前沿模型

Baseten近日推出其Model APIs服务,旨在为开发者提供高性能的开源大语言模型部署解决方案。该服务支持包括Kimi K2、GPT-OSS、DeepSeek、Qwen 3等在内的多款前沿开源模型,承诺提供行业领先的性能表现和极具竞争力的...

Read More
2025-08-14 talkingdev

苹果开源Embedding Atlas:交互式大模型嵌入可视化工具

苹果公司近日在GitHub开源了Embedding Atlas项目,这是一款专为大规模嵌入数据设计的交互式可视化工具。该工具通过WebGPU加速实现高性能渲染,支持自动数据聚类标注、实时交叉筛选和元数据搜索三大核心功能。其技术...

Read More
2025-08-13 talkingdev

开源AI路由器Nexus发布:聚合、治理并保护你的AI技术栈

Nexus是一款功能强大的开源AI路由器,旨在优化AI代理与多种MCP工具及大型语言模型(LLM)的交互方式。作为中央枢纽,Nexus不仅能够聚合多个MCP服务器,还提供智能的LLM路由、安全防护和治理功能。这一创新解决方案显...

Read More
  1. 1
  2. 2
  3. 3
  4. Next Page