LLM的相关内容 - 漫话开发者

2025-12-05 talkingdev

OpenRouter发布《AI现状》报告：基于超100万亿真实交互令牌的深度洞察

OpenRouter平台近期发布了一份名为《AI现状》的实证研究报告，该研究标志着大语言模型（LLM）在实际应用中的一个关键转折点。报告指出，过去一年，该领域已从传统的单次模式生成，迅速转向多步骤的深思熟虑式推理。...

2025-12-05 talkingdev

近日，AI模型聚合平台OpenRouter发布了一份名为《State of AI》的深度实证研究报告。该研究基于对超过100万亿（100T）真实世界大语言模型交互令牌的分析，覆盖了不同任务类型、地理区域和时间跨度，为当前AI技术的实...

2025-12-04 talkingdev

据《麻省理工科技评论》报道，OpenAI正在测试一种新颖的方法，旨在让大语言模型（LLMs）能够主动“坦白”或“自我报告”其内部运作过程。这项研究探索如何训练模型不仅输出最终答案，还能生成“自白书”，详细描述其完成任...

2025-12-01 talkingdev

在大型语言模型推理优化领域，Prompt缓存技术正成为提升服务效率、降低计算成本的关键前沿技术。本文深入解析了Prompt缓存的核心工作原理，特别聚焦于vLLM框架中创新的Paged Attention机制及其实现的自动前缀缓存。...

2025-11-30 talkingdev

在《麻省理工科技评论》的深度访谈中，谷歌DeepMind诺奖得主John Jumper揭示了AlphaFold超越传统蛋白质结构预测的突破性应用。这位2017年刚获得理论化学博士学位的科学家，如今正引领团队探索AlphaFold在药物设计、...

2025-11-29 talkingdev

近日，开源社区迎来一款突破性的图数据库FalkorDB，该数据库底层采用GraphBLAS技术实现稀疏邻接矩阵图表示，展现出卓越的性能表现。作为专门针对大语言模型优化的知识图谱解决方案，FalkorDB旨在为GraphRAG（图检索...

2025-11-26 talkingdev

最新行业分析指出，尽管OpenAI和Anthropic等前沿大语言模型开发商将持续进行模型训练，但其训练成本的爆炸式增长并非永久态势。当前这些企业因巨额训练投入处于严重亏损状态，但关键转折点在于年度训练支出增速的放...

2025-11-25 talkingdev

过去三年间，大语言模型（LLM）的扩展技术经历了显著的技术路线调整。早期以ChatGPT Plugins和模型上下文协议（MCP）为代表的复杂扩展方案，由于模型本身的能力限制和实现复杂度，逐渐被更简洁高效的解决方案取代。...