阿里巴巴最新开源的Qwen3-235B思维模型在技术领域取得重大突破,该模型在AIME25数学竞赛中达到92.3%的准确率,与OpenAI的O4-mini性能相当,并在编码基准测试中以74.1%的LiveCodeBench得分实现超越。这一2350亿参数的...
Read MoreCollabLLM是一个开源框架,旨在训练语言模型提出战略性问题和引导对话,而非做出假设。该框架采用了一种名为'多轮感知奖励'的创新机制,该机制基于对话结果的长期影响而非即时帮助性来评估响应。这一方法标志着对话...
Read MoreGitHub项目AgenticSeek推出了一款完全本地运行的AI助手,具备语音交互、自主网页浏览、代码编写及任务规划能力。该项目定位为Manus AI的开源替代方案,强调隐私性与独立性——无需依赖云端API或支付高额月费,仅需电力...
Read More近日,全球首个完全由AI自主组织的活动成功举办,标志着人工智能在复杂组织任务自动化方面迈出了重要一步。该活动由四个AI代理共同策划,目标为“撰写一个故事并邀请100人线下庆祝”。在数周的准备过程中,AI独立完成...
Read More本案例研究深入探讨了Anthropic公司内部多个团队(从法律到工程部门)如何运用Claude Code这一先进工具来实现任务自动化、弥补技能差距并加速复杂项目的开发进程。作为人工智能领域的重要参与者,Anthropic通过Claud...
Read MoreMeta近日宣布任命ChatGPT联合创始人赵盛佳(Shengjia Zhao)为其新成立的超级智能实验室(Superintelligence Lab)的首席科学家,以加强其在人工智能领域的布局。赵盛佳将负责主导实验室的研究方向,并与Meta首席执...
Read MoreRunway Research最新发布的Aleph视频模型标志着视频生成与编辑技术的重要突破。该模型具备上下文感知能力,可在视频中进行对象操作、视角转换、风格迁移和光照调整等高保真度编辑任务。其核心技术在于实现了对视频内...
Read MoreAnthropic公司最新发布的Claude Code彻底改变了开发者与AI编程代理的交互模式。该工具通过深度理解整个项目结构,无需手动选择上下文即可实现精准的代码操作。其核心技术突破在于:1)跨文件协同编辑能力,确保修改...
Read More