LLM的相关内容 - 漫话开发者

2026-01-07 talkingdev

开源|Pi Coding Agent：支持多模型热切换的终端AI编程助手

近日，一个名为Pi Coding Agent的开源项目在GitHub上发布，为开发者提供了一个功能强大的终端AI编程助手。该项目旨在解决无头（headless）编程任务，支持在macOS、Linux和Windows三大主流操作系统上运行。其核心亮点...

2026-01-06 talkingdev

英伟达黄仁勋宣布Vera Rubin芯片全面投产：训练部分大模型所需芯片数量仅为Blackwell的四分之一

英伟达创始人兼CEO黄仁勋近日宣布，其下一代AI芯片平台Vera Rubin已进入“全面生产”阶段。根据英伟达官方披露的技术信息，Vera Rubin平台在训练特定大型语言模型时，所需芯片数量可大幅减少至当前旗舰Blackwell架构平...

2026-01-05 talkingdev

开源|HGMem：超图工作记忆框架提升LLM复杂关系推理能力

近日，一个名为HGMem的开源项目在GitHub上发布，该项目实现了一篇题为《Improving Multi-step RAG with Hypergraph-based Memory for Long-context Complex Relational Modeling》的论文。HGMem是一个基于超图的工作...

2026-01-01 talkingdev

2025年大语言模型回顾：推理能力突破、AI智能体普及与格局重塑

根据年度回顾分析，2025年是大语言模型（LLM）发展史上具有里程碑意义的一年。核心技术突破体现在模型获得了真正的“推理”能力，使其能够处理复杂的多步骤任务，这直接推动了高性能AI智能体的广泛应用。其中，“编码智...

2026-01-01 talkingdev

开源|Ensue Memory Network：为LLM构建持久化知识树，终结对话“重置”难题

近日，GitHub上开源项目Ensue Memory Network引发人工智能领域开发者关注。该项目旨在为大型语言模型（LLM）提供一个持久化且可不断生长的“知识树”系统，从根本上解决当前LLM在每次新对话中“重置”上下文、无法积累长...

2026-01-01 talkingdev

开源|LMCache：为LLM服务注入极速KV缓存层，响应速度提升3-10倍

近日，一个名为LMCache的开源项目在GitHub上发布，旨在通过创新的键值（KV）缓存加速层，显著提升大型语言模型（LLM）的服务性能。该项目专为LLM推理服务设计，其核心在于能够跨GPU、CPU、本地磁盘和Redis等多种存储...

2025-12-30 talkingdev

开源|Crawl4AI：专为大型语言模型设计的开源网页抓取与解析工具

近日，一个名为Crawl4AI的开源项目在GitHub上发布，旨在为大型语言模型（LLM）提供友好、高效的网页抓取与内容解析解决方案。该项目由开发者unclecode主导，其核心目标是简化从复杂网页中提取结构化信息的流程，并将...

2025-12-26 talkingdev

开源|Crawl4AI：专为LLM设计的开源网络爬虫与抓取工具

近日，一个名为Crawl4AI的开源项目在GitHub上发布，旨在为大型语言模型（LLM）提供友好的网络爬虫与内容抓取解决方案。该项目由开发者unclecode主导，其核心目标是简化从网页中提取结构化数据的过程，并优化数据格式...