漫话开发者 - UWL.ME 精选全球AI前沿科技和开源产品
2025-10-20 talkingdev

阿里云发布Aegaeon GPU池化系统,声称可降低82%英伟达GPU用量

阿里云最新推出的Aegaeon GPU池化技术系统在AI算力领域实现重大突破,通过创新的资源调度机制将大模型推理所需的英伟达GPU数量从1192片缩减至213片,降幅达82%。该系统目前已在阿里云模型市场完成beta测试,其核心技...

Read More
2025-10-15 talkingdev

论文推荐|LLM通过语义相似性复现人类消费意图,准确率高达90%

一项发表于arXiv的前沿研究显示,大型语言模型(LLM)通过创新的语义相似性评分方法,在57种个人护理产品的消费选择预测中成功复现了人类决策模式,达到人类测试重测可靠性的90%。传统调研方法依赖数值评分易导致数...

Read More
2025-10-14 talkingdev

大语言模型突破字符级文本处理瓶颈,GPT-5与Claude 4.5展现算法理解力跃升

最新研究表明,新一代大语言模型在字符级文本处理任务上取得显著突破。相比早期版本,GPT-5和Claude Sonnet 4.5等模型在字符计数、字符替换、密码解码等需要精细化文本操作的任务中表现出色。这一进步表明模型正在从...

Read More
2025-10-13 talkingdev

OpenRouter:统一API集成500+主流AI模型,开启智能路由新纪元

近日,AI模型集成平台OpenRouter推出突破性技术方案,通过单一API接口整合GPT、Claude、Gemini、Llama、Mistral等500余个主流人工智能模型。该平台实现了请求级别的模型动态切换能力,支持根据实时价格、响应延迟等...

Read More
2025-10-10 talkingdev

仅需250份样本即可毒害任意规模大语言模型,Anthropic研究揭示数据投毒攻击风险

Anthropic联合英国AI安全研究所与艾伦·图灵研究所的最新研究表明,大语言模型面临严重的数据投毒威胁。实验发现,仅需在训练数据中插入250份被篡改的文档(仅占训练总量的0.00016%),就能在参数规模从6亿到130亿不...

Read More
2025-10-10 talkingdev

论文推荐|BlockRank:生成式模型实现可扩展上下文排序,效率提升4.7倍

近日,信息检索领域迎来突破性进展——基于生成式模型的上下文排序(ICR)技术实现规模化应用。传统ICR方法通过将任务描述、候选文档和查询直接输入大语言模型(LLM)来识别相关文档,虽效果显著但存在计算效率瓶颈:...

Read More
2025-10-10 talkingdev

开源|Sora MCP:为大型语言模型接入Sora视频生成能力

近日GitHub平台出现名为Sora MCP的开源项目,该项目通过构建MCP(模型控制协议)服务器,首次实现大型语言模型直接调用Sora视频生成API的技术突破。该工具使LLMs具备创建Sora视频、实时查询生成状态、将生成视频下载...

Read More
2025-10-07 talkingdev

OpenAI发布ChatGPT应用开发框架Apps SDK,加速AI应用生态构建

OpenAI正式推出Apps SDK开发框架,为开发者提供构建ChatGPT专属应用的核心工具链。该框架通过标准化接口封装了对话管理、上下文控制和多模态交互能力,支持快速集成知识库检索、工作流编排等企业级功能。技术文档显...

Read More
  1. 1
  2. 2
  3. 3
  4. Next Page