Model Context Protocol (MCP) 规范自2025年3月26日上一版本发布以来,迎来了多项重要更新。此次变更包括移除了对JSON-RPC批处理的支持,新增了对结构化工具输出的支持,并在授权规范中进一步明确了安全注意事项和最...
Read More一项发表于arXiv的突破性研究提出新型端到端变分编码器架构,通过自动学习韵律特征替代传统手工设计的音高输入,显著提升生成式口语语言模型的自然度表现。该技术摒弃了人工特征工程,直接对语义语音标记与韵律特征...
Read More最新研究表明,通过StochasTok训练方法可显著提升大语言模型对子词结构的理解能力。该创新技术采用随机分解标记的策略,在训练过程中让模型以多种拆分形式接触词汇(如将'strawberry'随机拆分为'straw|berry'、'str|...
Read More随着AI技术的快速普及,新的研究表明大多数安全防护措施仍处于追赶阶段。这份由Wiz.io发布的研究报告深入剖析了企业如何在云环境中保障AI安全,揭示了AI应用与安全防护之间的差距。报告显示,AI的采用速度已远超安全...
Read More传统大型语言模型(LLM)系统普遍存在硬件利用率低下的问题,主要源于GPU内核的序列化启动及跨设备通信开销。一支研究团队创新性地开发出专用编译器,可将LLM推理过程自动编译为单一megakernel(超级内核),通过三大...
Read More首份关于大语言模型(LLM)服务经济学的综合模型揭示,随着AI公司竞相部署高token消耗的推理模型和智能体,当前扩展推理能力的方法比预期更快遭遇瓶颈。研究发现,网络延迟而非带宽成为主要瓶颈,阻碍了公司通过简单...
Read More在大型语言模型(LLM)时代,推荐与搜索系统正经历从传统物品ID到丰富'语义ID'(Semantic IDs)的重大转型。这一变革引入了生成式检索和多模态嵌入技术,显著提升了系统处理冷启动覆盖、长尾内容发现的能力,并实现...
Read More开发者Maciek-roboblog近日在GitHub开源了Claude-Code-Usage-Monitor项目,该工具能实时监控Claude代码生成服务的使用量并预测是否会在会话结束前达到上限。由于Claude对代码生成有严格的使用限制,许多开发者在编程...
Read More