模型的相关内容 - 漫话开发者

2025-09-10 talkingdev

训练自主AI模型已成企业核心竞争力

随着人工智能技术的快速发展，行业领先的AI公司正将自主训练模型视为战略要务。技术门槛的急剧降低成为关键推动力——模型蒸馏、精细调优和后训练优化等技术手段正以月为单位加速成熟，使得企业自建模型从高成本投入转...

2025-09-10 talkingdev

英伟达正式推出全新Rubin CPX GPU，该芯片专为处理超过100万token的超长上下文窗口而设计，标志着人工智能推理基础设施迈向新阶段。采用“分解式推理”架构理念，Rubin CPX针对视频生成、复杂软件开发等长序列上下文任...

2025-09-09 talkingdev

最新技术研究显示，当前AI编程代理存在三大核心缺陷：代码生成过程中的token使用效率低下、缺乏对数据库上下文的持续理解能力，以及面对复杂代码库时容易发生语境腐化。这些问题源于现有模型仅具备表面级的代码理解...

2025-09-09 talkingdev

根据最新行业分析，强化学习即服务（RLaaS）正在成为人工智能领域更具竞争力的发展模式。该模式通过云端提供专业化的强化学习能力，相比追求通用人工智能（AGI）的传统路径具有显著优势：RLaaS已证明在实际应用中能...

2025-09-06 talkingdev

人工智能公司Anthropic近日同意支付15亿美元，就与图书作者的版权侵权集体诉讼达成和解。这一案件被视为AI训练数据版权争议的标志性事件，涉及生成式AI模型使用受版权保护内容的核心法律问题。和解金额创下同类案件...

2025-09-05 talkingdev

据《金融时报》报道，OpenAI已与美国芯片巨头博通达成合作，双方将共同设计专用于人工智能计算的芯片，并计划于2025年投入生产。OpenAI已承诺投入100亿美元用于芯片订单，这些芯片将完全用于其内部AI模型训练与推理...

2025-09-04 talkingdev

清华大学团队开源AgentScope框架，为大型语言模型应用开发提供全新范式。该框架采用智能体导向编程（Agent-Oriented Programming）设计理念，显著提升LLM应用的透明度和实时可控性。其核心特性包括工具管理、长时记...

2025-09-04 talkingdev

GitHub上最新开源项目“Awesome Agentic LLM+RL Papers”系统性地整理了大语言模型（LLM）与强化学习（RL）结合的智能体研究领域的关键论文资源。该资源库聚焦于Agentic AI这一前沿方向，涵盖了LLM作为决策核心与RL训...