Anthropic近日正式发布其最新旗舰级模型Claude Opus 4.8,这是对其Opus系列的一次重要升级。该模型在编码、智能体任务和专业工作等多个维度上展现出更强的性能,并显著提升了处理长时间复杂工作的一致性。除了核心能...
Read More当大家都在为如何配置AI Agent(提示词、MCP服务器、运行框架参数)而焦头烂额时,一个新的开源语言——OpenProse提出了一个颠覆性的想法:忘掉“怎么配”,专注于“要什么”。OpenProse是一种面向AI会话的新语言,它允许...
Read More在Google I/O大会上,Google正式发布了其最新一代大语言模型系列——Gemini 3.5。这一版本是Gemini系列的重大升级,首款推出的模型为超快速的3.5 Flash版本,专为在Google搜索等应用中直接处理复杂任务而优化。在多项...
Read More艾伦人工智能研究所(Ai2)最新发布的OlmoEarth v1.1模型家族,在遥感智能分析领域实现了显著的成本突破。该系列模型通过创新的序列长度优化技术,将处理遥感数据的计算成本最高降低至原来的三分之一(即3倍效率提升...
Read More一项最新研究揭示了语言模型在预训练过程中的一个惊人现象:它们并非平稳地提升能力,而是在“模仿”和“智能行为”之间突然切换,研究人员将其称为“模式跳跃”。这种非连续性的行为转变无法通过标准的优化技术(如调整学...
Read More一项针对阿里通义千问Qwen3.5-9B模型的最新逆向分析揭示,该模型的政治审查并非根植于其预训练阶段获取的事实性知识,而是在知识层之上附加的一层独立、可识别甚至可移除的注意力电路。研究人员发现,模型本身并未“...
Read More阿里巴巴通义千问团队近日在Arena平台上发布了Qwen3.7预览版,涵盖文本和视觉两大核心能力。据悉,Qwen3.7 Max Preview在文本竞技场中位列第13名,而Qwen3.7 Plus Preview则在视觉竞技场中排名第16,显示出阿里在大...
Read MoreOpenAI 近日详细披露了其 Codex 功能在 Windows 系统上运行背后的工程挑战与解决方案。为了在保证安全性的前提下,让编程 AI 代理能够高效地在本地开发者机器上执行任务,OpenAI 构建了一套高度受限的“Windows 沙箱”...
Read More