架构的相关内容 - 漫话开发者

2026-04-23 talkingdev

上下文是软件，权重是硬件：AI学习的核心差异比你想象的更重要

在大型语言模型领域，一种新的视角正在引发讨论：将上下文视为“软件”，而将权重视为“硬件”。这种比喻揭示了模型运作的本质差异。上下文（如KV缓存）动态地调节模型的激活值，为特定任务提供临时性的“编程”，从而实现...

2026-04-23 talkingdev

Broccoli 是一个新颖的开源工具，旨在通过AI代理（包括Claude和Codex）自动化软件开发中的工程工作流。其核心功能是可以直接将Linear项目管理工具中的工单（Tickets）自动转化为GitHub上的拉取请求（Pull Requests）...

2026-04-23 talkingdev

Qwen团队今日发布了其最新的开源权重模型Qwen3.6-27B，在AI社区引发广泛关注。该模型虽然仅有27B参数（稠密架构），却在智能体编码任务中实现了旗舰级性能。据Qwen团队宣称，Qwen3.6-27B在全部主流编码基准测试中均...

2026-04-23 talkingdev

随着人工智能向智能体（Agent）方向演进，传统的大模型推理基准测试正面临根本性变革。智能体工作负载不再是简单的单轮问答，而是包含多轮交互、工具调用等复杂场景。这种变化给推理引擎带来了前所未有的压力，尤其...

2026-04-22 talkingdev

近日，GitHub上开源了一个名为GoModel的高性能AI网关项目，该项目使用Go语言编写，旨在为开发者提供一个统一的、兼容OpenAI API标准的接口，以无缝对接包括OpenAI、Anthropic（Claude）、Google Gemini、Groq、xAI（...

2026-04-21 talkingdev

近日，GitHub上一个名为‘soulplayer-c64’的开源项目引发了技术社区的广泛关注。该项目成功地在仅有1MHz主频、内存极其有限的经典计算机Commodore 64上，部署并运行了一个拥有25,000个参数的真实Transformer神经网络...

2026-04-20 talkingdev

近日，一个名为PgQue的开源项目在GitHub上发布，为PostgreSQL 14及以上版本的用户提供了一个创新的高性能队列解决方案。该项目完全采用PL/pgSQL语言实现，基于经典的PgQ架构，但进行了现代化改进。其核心设计理念是...

2026-04-20 talkingdev

NVIDIA近日在Hugging Face平台发布博客，介绍了其最新研发的NEMOTRON OCR V2模型。该模型的核心创新在于完全利用合成数据进行训练，通过构建包含mOSCAR文本和多样化字体的合成数据管道，生成了跨语言的像素级完美标...