近日,AI模型聚合平台OpenRouter发布了一份名为《State of AI》的深度实证研究报告。该研究基于对超过100万亿(100T)真实世界大语言模型交互令牌的分析,覆盖了不同任务类型、地理区域和时间跨度,为当前AI技术的实...
Read More据《麻省理工科技评论》报道,OpenAI正在测试一种新颖的方法,旨在让大语言模型(LLMs)能够主动“坦白”或“自我报告”其内部运作过程。这项研究探索如何训练模型不仅输出最终答案,还能生成“自白书”,详细描述其完成任...
Read More在大型语言模型推理优化领域,Prompt缓存技术正成为提升服务效率、降低计算成本的关键前沿技术。本文深入解析了Prompt缓存的核心工作原理,特别聚焦于vLLM框架中创新的Paged Attention机制及其实现的自动前缀缓存。...
Read More开发者gavrielc基于谷歌最新Gemini 3 Pro Image模型(代号Nano Banana)推出开源CLI工具Nano PDF,实现了通过自然语言指令直接编辑PDF文档的技术突破。该工具将指定PDF页面转换为图像,结合用户文本提示调用多模态AI...
Read More中国AI初创公司深度求索(DeepSeek)最新发布的DeepSeekMath-V2数学模型在国际数学奥林匹克竞赛(IMO)2025及中国数学奥林匹克2024中达到金牌级水平,标志着AI在复杂数学推理领域的重大突破。该模型通过创新的推理架...
Read More近日,开源社区迎来一款突破性的图数据库FalkorDB,该数据库底层采用GraphBLAS技术实现稀疏邻接矩阵图表示,展现出卓越的性能表现。作为专门针对大语言模型优化的知识图谱解决方案,FalkorDB旨在为GraphRAG(图检索...
Read More近日,GitHub开源项目Better Agents推出了一款专注于AI智能体开发领域的CLI工具及标准化体系。该工具通过交互式命令行界面,逐步引导开发者选择编程语言、智能体框架、编码助手、大语言模型供应商及API密钥配置,显...
Read More最新行业分析指出,尽管OpenAI和Anthropic等前沿大语言模型开发商将持续进行模型训练,但其训练成本的爆炸式增长并非永久态势。当前这些企业因巨额训练投入处于严重亏损状态,但关键转折点在于年度训练支出增速的放...
Read More