架构的相关内容 - 漫话开发者

2026-06-02 talkingdev

英伟达发布Cosmos 3：物理AI开源基础模型，融合视觉推理与多模态生成

英伟达今日正式发布Cosmos 3，这是一款面向物理AI的开源世界基础模型，标志着AI在理解与生成物理世界能力上的重大突破。Cosmos 3采用了创新的混合专家变换器（Mixture-of-Transformers）架构，将视觉推理、世界生成...

2026-06-02 talkingdev

Perplexity AI 在其最新研究论文中提出了一种名为“搜索即代码”（Search as Code，简称 SaC）的全新搜索架构范式。该方案通过提供一个软件开发工具包（SDK），赋予大语言模型对搜索流程的直接编程控制权。与传统将搜...

2026-06-02 talkingdev

在生成式AI的激烈竞争中，视频生成与世界模型正成为下一个前沿战场。Ethan He，这位曾领导NVIDIA Cosmos世界模型项目的核心人物，在加入xAI后仅用三个月便主导构建了Grok Imagine图像生成系统。在一篇长达98分钟的深...

2026-06-02 talkingdev

阿里巴巴通义千问团队近日发布了其最新的多模态智能体模型Qwen3.7-Plus，标志着通用人工智能在感知与行动融合层面迈出了重要一步。该模型将视觉识别与语言理解能力深度融合，构建了一个单一、通用的多模态智能体基础...

2026-06-01 talkingdev

在AI开发工具日益多元化的今天，如何让Claude Code、Codex、OpenCode、Cursor等不同智能体高效协同工作，成为一个关键的技术挑战。GitHub上开源的ECC项目提供了一套全面的解决方案，它被设计为一个“代理工具性能优化...

2026-06-01 talkingdev

MiniMax 最新发布的开源权重模型 M3 在编码和智能体（Agentic）任务上达到前沿水平。该模型不仅支持图像和视频输入，还可以直接操作桌面计算机。技术上，M3 引入了一种新的注意力架构，支持上下文缩放，并能够处理多...

2026-05-29 talkingdev

在AI辅助编程工具日益普及的背景下，Dropbox提出了一种更具前瞻性的观点：AI的真正价值不在于加速代码生成，而在于重新定义整个工程交付流程。随着代码生成速度的提升，瓶颈已经从编写代码转移到了代码审查、持续集...

2026-05-28 talkingdev

OpenAI 近日发布了一项名为 Secure MCP Tunnel 的新功能，旨在解决企业级用户将私有或本地 MCP 服务器与 OpenAI 产品安全连接的核心痛点。该技术通过一个仅支持出站连接的隧道（outbound-only tunnel），允许用户在...