一项突破性的研究提出了一种无需任何人工偏好标注即可训练视觉语言模型评判者的全新框架。该框架的核心在于通过自我合成数据实现迭代式自训练,从而摆脱了对昂贵且易过时的人工标注的依赖。其工作流程分为三个阶段:...
Read More近日,付费版ChatGPT用户报告称在对话中看到了标记为“购买家居和杂货”的提示,引发了关于OpenAI是否开始在聊天界面中植入广告的广泛讨论与担忧。针对这一事件,OpenAI高层迅速做出回应。ChatGPT负责人明确表示,网络...
Read More根据AI模型聚合平台OpenRouter发布的最新年度研究报告,通过对过去一年内超过100万亿个令牌(tokens)的实证分析,揭示了当前AI模型使用格局的重大转变。报告指出,以Claude 3.5 Sonnet、GPT-4o和o1系列为代表的“推...
Read More英伟达在混合专家模型(Mixture-of-Experts,MoE)的扩展性能方面取得了重大突破。根据官方公布的数据,其最新的GB200 Blackwell NVL72服务器配置,在MoE AI模型上的性能表现相比上一代的Hopper HGX200架构实现了高...
Read More近日,GitHub开源项目Better Agents推出了一款专注于AI智能体开发领域的CLI工具及标准化体系。该工具通过交互式命令行界面,逐步引导开发者选择编程语言、智能体框架、编码助手、大语言模型供应商及API密钥配置,显...
Read MoreOpenAI联合创始人兼首席科学家Ilya Sutskever在最新访谈中提出重大行业判断:人工智能发展正在经历从‘规模扩张时代’到‘研究驱动时代’的战略转向。他指出当前大语言模型存在根本性局限——‘这些模型在泛化能力上远逊于...
Read More过去三年间,大语言模型(LLM)的扩展技术经历了显著的技术路线调整。早期以ChatGPT Plugins和模型上下文协议(MCP)为代表的复杂扩展方案,由于模型本身的能力限制和实现复杂度,逐渐被更简洁高效的解决方案取代。...
Read MoreGemini 3的发布标志着人工智能领域的重要转折——从基础对话系统升级为具备自主行动能力的智能体模型。该模型已能独立完成复杂编程任务、设计用户界面及开展学术研究,其能力达到博士级研究水平。虽然仍需人类指导,但...
Read More