漫话开发者 - UWL.ME 精选全球AI前沿科技和开源产品
2026-06-02 talkingdev

英伟达发布Cosmos 3:物理AI开源基础模型,融合视觉推理与多模态生成

英伟达今日正式发布Cosmos 3,这是一款面向物理AI的开源世界基础模型,标志着AI在理解与生成物理世界能力上的重大突破。Cosmos 3采用了创新的混合专家变换器(Mixture-of-Transformers)架构,将视觉推理、世界生成...

Read More
2026-06-02 talkingdev

重新定义搜索:Perplexity 提出“搜索即代码”,让AI模型直接操控搜索流程

Perplexity AI 在其最新研究论文中提出了一种名为“搜索即代码”(Search as Code,简称 SaC)的全新搜索架构范式。该方案通过提供一个软件开发工具包(SDK),赋予大语言模型对搜索流程的直接编程控制权。与传统将搜...

Read More
2026-06-02 talkingdev

视频智能体模型是下一波浪潮 — xAI Grok Imagine 负责人 Ethan He 深度解读

在生成式AI的激烈竞争中,视频生成与世界模型正成为下一个前沿战场。Ethan He,这位曾领导NVIDIA Cosmos世界模型项目的核心人物,在加入xAI后仅用三个月便主导构建了Grok Imagine图像生成系统。在一篇长达98分钟的深...

Read More
2026-06-02 talkingdev

Qwen3.7-Plus发布:统一视觉与语言的通用多模态智能体模型

阿里巴巴通义千问团队近日发布了其最新的多模态智能体模型Qwen3.7-Plus,标志着通用人工智能在感知与行动融合层面迈出了重要一步。该模型将视觉识别与语言理解能力深度融合,构建了一个单一、通用的多模态智能体基础...

Read More
2026-06-01 talkingdev

开源|odysseus:私人AI工作空间,自主代理自动化复杂任务

在云端AI服务日益普及的今天,数据隐私和自主可控成为了技术爱好者与专业团队关注的焦点。GitHub上名为“Odysseus”的开源项目应运而生,它定位为一款自托管的、注重隐私的AI工作空间。该项目由社区开发者pewdiepie-ar...

Read More
2026-06-01 talkingdev

开源|ECC:多智能体工作流性能优化系统,集成技能、记忆与安全扫描,助力AI开发工具链升级

在AI开发工具日益多元化的今天,如何让Claude Code、Codex、OpenCode、Cursor等不同智能体高效协同工作,成为一个关键的技术挑战。GitHub上开源的ECC项目提供了一套全面的解决方案,它被设计为一个“代理工具性能优化...

Read More
2026-06-01 talkingdev

开源|pi-dynamic-workflows:让AI助手动态编排子任务,引爆代码审计与大规模重构效率

开源项目pi-dynamic-workflows为Pi智能助手引入了一项强大的动态工作流扩展能力,它允许助手编写精简的JavaScript脚本,将复杂工作高效分派给大量隔离的“子代理”(subagents)并行处理,并最终完成结果合成。相较于...

Read More
2026-06-01 talkingdev

MiniMax M3开源模型:融合编码与智能体前沿,百万Token超长上下文

MiniMax 最新发布的开源权重模型 M3 在编码和智能体(Agentic)任务上达到前沿水平。该模型不仅支持图像和视频输入,还可以直接操作桌面计算机。技术上,M3 引入了一种新的注意力架构,支持上下文缩放,并能够处理多...

Read More
  1. 1
  2. 2
  3. 3
  4. Next Page