一篇题为《图解Transformer》的技术博客在开发者社区Hacker News上引发了广泛关注,该博客由jalammar撰写,通过大量直观的图示和清晰的解释,深入浅出地剖析了Transformer这一革命性神经网络架构的核心工作原理。Tra...
Read More当AI智能体协助用户处理横跨数百条消息的复杂任务时,一旦其上下文窗口耗尽,是能够继续高效工作,还是被迫从头开始?这直接决定了智能体的实用性与可靠性。Factory.ai的最新研究深入探讨了这一问题,并提出了一套评...
Read More一个名为“History LLMs”的开源项目在技术社区引发了广泛关注。该项目旨在训练迄今为止规模最大的、专门基于1913年之前历史文本的大型语言模型。其核心构想是通过构建一个纯净的“前现代”语料库——即排除所有1913年之后...
Read More阿里云通义千问团队近日在GitHub上开源了Qwen-Doc项目,这是一个专注于文档人工智能(Document AI)的开源计划。该项目旨在通过提供先进的模型和工具集,显著提升AI系统对长上下文文档的理解、解析能力,并支持基于...
Read More英伟达近日正式发布了Nemotron 3系列开源模型,该家族包含Nano(300亿参数,30亿活跃参数)、Super(1000亿参数)和Ultra(5000亿参数)三个版本,其中Super和Ultra型号计划于2026年初推出。尤为引人注目的是,当前...
Read More人工智能研究机构OpenAI正式发布了其最新的前沿模型GPT-5.2,该模型被定位为专为专业知识工作和长期运行的智能体(agents)而设计的最先进系统。根据官方介绍,GPT-5.2在多个关键领域树立了新的性能标杆,包括代码生...
Read MoreOpenAI正式推出其新一代前沿模型GPT-5.2,该模型被定位为专为专业工作场景和长期运行的智能体(agent)工作流而优化的最先进模型。相较于前代,GPT-5.2在多个关键维度实现了显著提升:其一,在知识工作领域,模型展...
Read More近日,Vercel团队在GitHub上开源了Streamdown项目,这是一个旨在解决AI模型流式输出Markdown内容时特有难题的React库。作为`react-markdown`的直接替代品,Streamdown的核心价值在于其专门针对AI生成内容流式传输过...
Read More