漫话开发者 - UWL.ME 精选全球AI前沿科技和开源产品
2026-06-02 talkingdev

英伟达发布Cosmos 3:物理AI开源基础模型,融合视觉推理与多模态生成

英伟达今日正式发布Cosmos 3,这是一款面向物理AI的开源世界基础模型,标志着AI在理解与生成物理世界能力上的重大突破。Cosmos 3采用了创新的混合专家变换器(Mixture-of-Transformers)架构,将视觉推理、世界生成...

Read More
2026-06-02 talkingdev

重新定义搜索:Perplexity 提出“搜索即代码”,让AI模型直接操控搜索流程

Perplexity AI 在其最新研究论文中提出了一种名为“搜索即代码”(Search as Code,简称 SaC)的全新搜索架构范式。该方案通过提供一个软件开发工具包(SDK),赋予大语言模型对搜索流程的直接编程控制权。与传统将搜...

Read More
2026-06-02 talkingdev

视频智能体模型是下一波浪潮 — xAI Grok Imagine 负责人 Ethan He 深度解读

在生成式AI的激烈竞争中,视频生成与世界模型正成为下一个前沿战场。Ethan He,这位曾领导NVIDIA Cosmos世界模型项目的核心人物,在加入xAI后仅用三个月便主导构建了Grok Imagine图像生成系统。在一篇长达98分钟的深...

Read More
2026-06-02 talkingdev

Qwen3.7-Plus发布:统一视觉与语言的通用多模态智能体模型

阿里巴巴通义千问团队近日发布了其最新的多模态智能体模型Qwen3.7-Plus,标志着通用人工智能在感知与行动融合层面迈出了重要一步。该模型将视觉识别与语言理解能力深度融合,构建了一个单一、通用的多模态智能体基础...

Read More
2026-06-01 talkingdev

开源|ECC:多智能体工作流性能优化系统,集成技能、记忆与安全扫描,助力AI开发工具链升级

在AI开发工具日益多元化的今天,如何让Claude Code、Codex、OpenCode、Cursor等不同智能体高效协同工作,成为一个关键的技术挑战。GitHub上开源的ECC项目提供了一套全面的解决方案,它被设计为一个“代理工具性能优化...

Read More
2026-06-01 talkingdev

MiniMax M3开源模型:融合编码与智能体前沿,百万Token超长上下文

MiniMax 最新发布的开源权重模型 M3 在编码和智能体(Agentic)任务上达到前沿水平。该模型不仅支持图像和视频输入,还可以直接操作桌面计算机。技术上,M3 引入了一种新的注意力架构,支持上下文缩放,并能够处理多...

Read More
2026-05-29 talkingdev

Dropbox内部AI智能体平台揭秘:代码生成只是开始,工程生产力迎来新变革

在AI辅助编程工具日益普及的背景下,Dropbox提出了一种更具前瞻性的观点:AI的真正价值不在于加速代码生成,而在于重新定义整个工程交付流程。随着代码生成速度的提升,瓶颈已经从编写代码转移到了代码审查、持续集...

Read More
2026-05-28 talkingdev

OpenAI 推出 Secure MCP Tunnel:安全连接私有 MCP 服务器的突破性方案

OpenAI 近日发布了一项名为 Secure MCP Tunnel 的新功能,旨在解决企业级用户将私有或本地 MCP 服务器与 OpenAI 产品安全连接的核心痛点。该技术通过一个仅支持出站连接的隧道(outbound-only tunnel),允许用户在...

Read More
  1. Prev Page
  2. 4
  3. 5
  4. 6
  5. Next Page