大型语言模型的相关内容 - 漫话开发者

2026-01-06 talkingdev

英伟达黄仁勋宣布Vera Rubin芯片全面投产：训练部分大模型所需芯片数量仅为Blackwell的四分之一

英伟达创始人兼CEO黄仁勋近日宣布，其下一代AI芯片平台Vera Rubin已进入“全面生产”阶段。根据英伟达官方披露的技术信息，Vera Rubin平台在训练特定大型语言模型时，所需芯片数量可大幅减少至当前旗舰Blackwell架构平...

2026-01-05 talkingdev

开源|HGMem：超图工作记忆框架提升LLM复杂关系推理能力

近日，一个名为HGMem的开源项目在GitHub上发布，该项目实现了一篇题为《Improving Multi-step RAG with Hypergraph-based Memory for Long-context Complex Relational Modeling》的论文。HGMem是一个基于超图的工作...

2026-01-05 talkingdev

开源|Agentic Coding Flywheel Setup：30分钟将全新VPS武装为AI驱动的智能编码环境

近日，GitHub上开源了一个名为‘Agentic Coding Flywheel Setup’（ACFS）的系统工具，旨在为希望获得智能体工程能力的初学者和团队提供一站式解决方案。该工具的核心价值在于，能够在大约30分钟内，将一个全新的Ubunt...

2026-01-01 talkingdev

开源|Ensue Memory Network：为LLM构建持久化知识树，终结对话“重置”难题

近日，GitHub上开源项目Ensue Memory Network引发人工智能领域开发者关注。该项目旨在为大型语言模型（LLM）提供一个持久化且可不断生长的“知识树”系统，从根本上解决当前LLM在每次新对话中“重置”上下文、无法积累长...

2026-01-01 talkingdev

开源|E2E：基于JAX的端到端测试时训练框架，革新长上下文语言建模

近日，GitHub上开源了一个名为E2E的JAX官方实现项目，它提出了一种创新的长上下文语言建模方法。该方法的核心在于将传统的语言建模任务重新定义为持续学习问题。E2E模型采用标准的Transformer架构，并配合滑动窗口注...

2026-01-01 talkingdev

开源|LMCache：为LLM服务注入极速KV缓存层，响应速度提升3-10倍

近日，一个名为LMCache的开源项目在GitHub上发布，旨在通过创新的键值（KV）缓存加速层，显著提升大型语言模型（LLM）的服务性能。该项目专为LLM推理服务设计，其核心在于能够跨GPU、CPU、本地磁盘和Redis等多种存储...

2025-12-30 talkingdev

开源|Crawl4AI：专为大型语言模型设计的开源网页抓取与解析工具

近日，一个名为Crawl4AI的开源项目在GitHub上发布，旨在为大型语言模型（LLM）提供友好、高效的网页抓取与内容解析解决方案。该项目由开发者unclecode主导，其核心目标是简化从复杂网页中提取结构化信息的流程，并将...

2025-12-30 talkingdev

AI芯片市场2025年销售额突破4000亿美元，英伟达领跑但面临竞争加剧与供应链挑战

根据《华尔街日报》报道，在人工智能技术浪潮的强力驱动下，全球主要芯片制造商在2025年实现了超过4000亿美元的销售额，标志着半导体行业进入了一个由AI需求主导的新增长周期。其中，英伟达凭借其在AI加速器领域的领...