漫话开发者 - UWL.ME 精选全球AI前沿科技和开源产品
2025-10-17 talkingdev

递归语言模型:突破上下文限制的新范式

斯坦福大学研究人员提出的递归语言模型(RLMs)实现了突破性的推理架构创新。该模型通过REPL环境将输入上下文分解为可交互变量,实现了对无限长上下文的递归处理。在OOLONG基准测试中,基于GPT-5-mini构建的RLMs模型...

Read More
2025-10-17 talkingdev

论文推荐|ScaleRL:大型语言模型强化学习计算扩展的首个系统性研究框架

来自大规模实验的研究团队发布了名为ScaleRL的创新框架,这是首个针对大型语言模型强化学习计算扩展的系统性研究方法。该研究通过超过40万GPU小时的实验数据,构建了可预测的S型计算-性能曲线,揭示了RL训练中算法改...

Read More
2025-10-17 talkingdev

OpenAI推出团队共享ChatGPT提示功能,加速企业级AI协作

OpenAI正在为ChatGPT团队工作空间开发名为‘Prompts’的共享提示功能,专为组织协作场景设计。该功能允许团队成员创建可复用的提示模板库,支持自定义指令设置和变量集成,并能通过内置工具将复杂多步骤任务打包为单一...

Read More
2025-10-17 talkingdev

Anthropic推出Claude Skills:模块化技能包重塑AI工作流

人工智能公司Anthropic正式发布Claude Skills功能,通过模块化技能包体系实现AI工作流程的深度定制。该技术将特定任务所需的指令集、脚本和资源封装为独立技能单元,仅在任务触发时动态加载相关上下文,显著提升Clau...

Read More
2025-10-17 talkingdev

Gemini 3.0通过A/B测试意外曝光:SVG生成质量成关键指标

近日,开发者通过Google AI Studio的A/B测试功能,意外捕捉到尚未正式发布的Gemini 3.0模型踪迹。该测试以SVG矢量图形生成作为核心评估标准,通过对比不同版本模型的输出质量,间接验证了新一代模型在复杂结构化数据...

Read More
2025-10-17 talkingdev

Cloudflare推出边缘网络沙盒SDK,安全执行代码环境

Cloudflare近日正式发布Sandbox SDK,该技术允许开发者在全球边缘网络中安全运行沙盒化代码环境。作为边缘计算领域的重要突破,该SDK通过基于WebAssembly的隔离技术实现代码执行环境的安全隔离,有效防止潜在恶意代...

Read More
2025-10-16 talkingdev

代码量≠代码质量:Claude Haiku 4.5生成代码量超Sonnet 62%但评分反降16%

最新技术测试显示,Anthropic公司新推出的Claude Haiku 4.5模型在WebSocket重构任务中表现出令人深思的现象。该模型虽然生成了比其他模型更多的代码量,但其代码质量评分却显著低于同系列的Claude Sonnet 4.5模型。...

Read More
2025-10-16 talkingdev

Anthropic发布Claude Haiku 4.5:小模型实现前沿性能突破

人工智能公司Anthropic正式推出新一代小型AI模型Claude Haiku 4.5,该模型在保持成本效益与运行速度优势的同时,实现了接近前沿大模型的性能表现。据官方披露,这款模型在多项基准测试中不仅超越了前代版本,更在计...

Read More
  1. Prev Page
  2. 7
  3. 8
  4. 9
  5. Next Page