LLM的相关内容 - 漫话开发者

2025-06-30 talkingdev

PyTorch与vLLM深化集成，提升大语言模型推理效率

PyTorch与vLLM近日宣布深化技术整合，新增支持量化、注意力机制定制及异构硬件加速等关键功能。这一合作标志着两大开源框架在优化大语言模型（LLM）推理性能方面取得重要突破：量化技术可降低模型计算资源消耗达4-8...

2025-06-30 talkingdev

vLLM是一款开源的大语言模型推理引擎，近日其团队发布了全新的V1架构。本文深入剖析了vLLM V1架构如何通过OpenAI兼容API服务器和核心引擎高效处理推理请求，实现业界领先的文本生成性能。该架构优化了推理请求的处理...

2025-06-30 talkingdev

艾伦人工智能研究所（Allen Institute for AI）近日开源了Genesys项目，这是一个基于分布式进化系统的创新框架。该系统利用大型语言模型（LLM）作为智能体，通过遗传编程技术自动探索和发现更优的语言模型架构。这一...

2025-06-28 talkingdev

ExtensityAI团队在GitHub开源了SymbolicAI项目，这是一个基于神经符号系统（Neuro-Symbolic）架构设计的组合式可微分编程库，旨在为大语言模型（LLMs）提供结构化推理能力。该项目通过将符号逻辑与神经网络梯度优化...

2025-06-27 talkingdev

谷歌近日发布了具有重大意义的新开源权重模型Gemma 3n，该模型采用多模态设计，专为设备端优化。Gemma 3n能够接受文本、图像和音频作为输入，展现了强大的跨模态处理能力。为推广该模型，谷歌与AMD、Axolotl、Docker...

2025-06-25 talkingdev

人工智能架构因其输出的概率性特征，常常导致环境不可预测，这为系统监控和性能优化带来了挑战。可观测性技术在此背景下显得尤为重要，它不仅能够帮助检测潜在的偏见，理解模型的局限性，还能及时发现可能存在的问题...

2025-06-25 talkingdev

知名科技分析师Ben Thompson在其最新分析中指出，若大型语言模型（LLM）技术真正实现变革性突破，而扎克伯格近期的人才争夺战略未能奏效，Meta恐将成为AI时代的"MySpace"，面临被淘汰的风险。Thompson认为，尽管微软...

2025-06-24 talkingdev

本文深入探讨了长上下文问答系统的评估方法，包括指标设计、数据集构建以及人工或大语言模型(LLM)评估技术。文章重点分析了该领域面临的四大核心挑战：信息过载问题、证据分散现象、多跳推理需求以及幻觉生成风险。...