LLM的相关内容 - 漫话开发者

2025-09-08 talkingdev

《智能体系统指南》开源：全面指导构建生产级AI编程助手

《智能体系统系列》正式发布，这是一本专注于构建生产环境可用AI编程助手的权威指南。该著作系统性地涵盖了从基础概念到企业级协作系统实现的全套知识体系，特别对Amp、Claude Code等真实生产系统进行了深度技术解析...

2025-09-04 talkingdev

清华大学团队开源AgentScope框架，为大型语言模型应用开发提供全新范式。该框架采用智能体导向编程（Agent-Oriented Programming）设计理念，显著提升LLM应用的透明度和实时可控性。其核心特性包括工具管理、长时记...

2025-09-04 talkingdev

GitHub上最新开源项目“Awesome Agentic LLM+RL Papers”系统性地整理了大语言模型（LLM）与强化学习（RL）结合的智能体研究领域的关键论文资源。该资源库聚焦于Agentic AI这一前沿方向，涵盖了LLM作为决策核心与RL训...

2025-09-03 talkingdev

提示注入攻击正成为大型语言模型面临的新型安全威胁，这种攻击通过操纵自然语言处理能力来利用系统漏洞，其原理类似于传统的SQL注入攻击。研究人员最新提出了六种核心设计模式来强化AI智能体的安全防护：行动选择器...

2025-09-03 talkingdev

随着Model Context Protocol（MCP）迅速成为连接大语言模型与外部工具数据的核心标准，其安全风险正引发行业高度关注。Wiz最新发布的研究指南指出，尽管MCP能显著提升LLM与外部系统的集成效率，但许多团队在缺乏明确...

2025-09-01 talkingdev

当前深度学习训练规模不断扩大，如何高效利用多GPU资源成为关键挑战。最新技术分析揭示了并行化策略的核心在于设备网格（Device Mesh）的智能架构设计。设备网格作为PyTorch和JAX框架的核心抽象，将GPU集群组织为N维...

2025-09-01 talkingdev

最新研究通过机制可解释性方法深入解析了基于Transformer架构的大语言模型(LLM)的工作原理。研究表明，LLM并非简单的统计预测器，而是通过形成涌现电路结构来实现复杂任务处理。这些电路整合了学习统计规律、信息传...

2025-08-29 talkingdev

近日，GitHub上开源项目oLLM引发开发者社区广泛关注。该项目是一个专为大上下文语言模型推理设计的轻量级Python库，其核心突破在于仅需8GB显存的消费级GPU即可运行Llama-3.1-8B-Instruct等模型处理长达10万token的上...