艾伦人工智能研究所(Allen Institute for AI)近日开源了Genesys项目,这是一个基于分布式进化系统的创新框架。该系统利用大型语言模型(LLM)作为智能体,通过遗传编程技术自动探索和发现更优的语言模型架构。这一...
Read More知名科技分析师Ben Thompson在其最新分析中指出,若大型语言模型(LLM)技术真正实现变革性突破,而扎克伯格近期的人才争夺战略未能奏效,Meta恐将成为AI时代的"MySpace",面临被淘汰的风险。Thompson认为,尽管微软...
Read More强化学习(RL)作为一种让AI模型通过试错而非简单模仿人类示例进行学习的技术,正展现出其在复杂任务处理中的独特优势。最新行业动态显示,科技公司正在采用两种创新方法大幅扩展训练数据规模:一是利用AI模型相互评...
Read More传统大型语言模型(LLM)系统普遍存在硬件利用率低下的问题,主要源于GPU内核的序列化启动及跨设备通信开销。一支研究团队创新性地开发出专用编译器,可将LLM推理过程自动编译为单一megakernel(超级内核),通过三大...
Read More在大型语言模型(LLM)时代,推荐与搜索系统正经历从传统物品ID到丰富'语义ID'(Semantic IDs)的重大转型。这一变革引入了生成式检索和多模态嵌入技术,显著提升了系统处理冷启动覆盖、长尾内容发现的能力,并实现...
Read MoreSakana AI研究团队开发出一项突破性技术——Text-to-LoRa(T2L)系统,该系统仅需文本描述即可即时定制大型语言模型,无需传统方法所需的训练数据或耗时微调过程。该技术的核心创新在于将数百个LoRA适配器(一种高效轻...
Read MoreKV(键值)缓存是大型语言模型(LLM)推理过程中的关键技术,通过存储注意力计算的中间结果显著提升生成效率。以逐词生成"Time flies fast"为例,传统方式需在每个步骤重复计算"Time"和"flies"的注意力权重,而采用K...
Read MoreNanonets-OCR-s是一款前沿的图像转Markdown OCR模型,其能力远超传统文本提取技术。该模型通过智能内容识别和语义标记,能够将文档转化为结构化的Markdown格式。它不仅理解文档结构和内容上下文,还能输出智能格式化...
Read More