漫话开发者 - UWL.ME 精选全球AI前沿科技和开源产品
2025-10-20 talkingdev

阿里云发布Aegaeon GPU池化系统,声称可降低82%英伟达GPU用量

阿里云最新推出的Aegaeon GPU池化技术系统在AI算力领域实现重大突破,通过创新的资源调度机制将大模型推理所需的英伟达GPU数量从1192片缩减至213片,降幅达82%。该系统目前已在阿里云模型市场完成beta测试,其核心技...

Read More
2025-10-17 talkingdev

递归语言模型:突破上下文限制的新范式

斯坦福大学研究人员提出的递归语言模型(RLMs)实现了突破性的推理架构创新。该模型通过REPL环境将输入上下文分解为可交互变量,实现了对无限长上下文的递归处理。在OOLONG基准测试中,基于GPT-5-mini构建的RLMs模型...

Read More
2025-10-17 talkingdev

论文推荐|ScaleRL:大型语言模型强化学习计算扩展的首个系统性研究框架

来自大规模实验的研究团队发布了名为ScaleRL的创新框架,这是首个针对大型语言模型强化学习计算扩展的系统性研究方法。该研究通过超过40万GPU小时的实验数据,构建了可预测的S型计算-性能曲线,揭示了RL训练中算法改...

Read More
2025-10-15 talkingdev

论文推荐|LLM通过语义相似性复现人类消费意图,准确率高达90%

一项发表于arXiv的前沿研究显示,大型语言模型(LLM)通过创新的语义相似性评分方法,在57种个人护理产品的消费选择预测中成功复现了人类决策模式,达到人类测试重测可靠性的90%。传统调研方法依赖数值评分易导致数...

Read More
2025-10-14 talkingdev

语言模型突破字符级文本处理瓶颈,GPT-5与Claude 4.5展现算法理解力跃升

最新研究表明,新一代大语言模型在字符级文本处理任务上取得显著突破。相比早期版本,GPT-5和Claude Sonnet 4.5等模型在字符计数、字符替换、密码解码等需要精细化文本操作的任务中表现出色。这一进步表明模型正在从...

Read More
2025-10-13 talkingdev

论文推荐|ReasoningBank:基于推理记忆实现智能体自我进化的突破性框架

清华大学与斯坦福大学联合研究团队近日发布突破性研究成果ReasoningBank,该框架通过构建推理记忆系统解决长期困扰大语言模型智能体的历史经验复用难题。传统智能体在持续执行现实任务时,往往将每次交互视为独立事...

Read More
2025-10-13 talkingdev

OpenRouter:统一API集成500+主流AI模型,开启智能路由新纪元

近日,AI模型集成平台OpenRouter推出突破性技术方案,通过单一API接口整合GPT、Claude、Gemini、Llama、Mistral等500余个主流人工智能模型。该平台实现了请求级别的模型动态切换能力,支持根据实时价格、响应延迟等...

Read More
2025-10-10 talkingdev

开源|Jetski:零代码改造为MCP服务器集成认证与分析功能

近日,GitHub开源项目Jetski为模型上下文协议(MCP)服务器生态带来突破性解决方案。该平台通过零代码修改即可为MCP服务器注入企业级身份认证与深度分析能力,支持最新OAuth2.1标准和动态客户端注册(DCR)协议。其...

Read More
  1. 1
  2. 2
  3. 3
  4. Next Page