语言模型的相关内容 - 漫话开发者

2026-07-12 talkingdev

马斯克旗下SpaceXAI发布Grok 4.5：专攻编码、智能代理与知识工作的最强模型

埃隆·马斯克旗下的人工智能公司SpaceXAI正式推出了新一代大语言模型Grok 4.5，将其定位为公司在编码、智能代理任务和知识工作领域的最强模型。官方披露，该模型在训练过程中与流行AI编程工具Cursor进行了深度协同优...

2026-06-30 talkingdev

Meta（原 Facebook）近日在 GitHub 上开源了其内部打磨长达八年的设计系统——Astryx。该系统不仅支撑了 Meta 内部超过 13,000 款应用程序的界面开发，更凭借其 150 多个高可访问性组件和丰富主题体系，展示了在极端规...

2026-06-30 talkingdev

DeepSeek近日正式开源了一款名为DSpark的创新框架，旨在显著加速大型语言模型（LLM）的推理过程，据称最高能将解码速度提升85%。这一突破性进展直接针对当前AI大模型在实际应用中普遍存在的响应延迟痛点。与传统模型...

2026-06-29 talkingdev

随着AI编程工具如Claude Code和GitHub Codex的普及，开发者对自主可控、低成本且注重隐私的替代方案需求日益增长。近日，一篇详尽的教程指南提出，利用开源模型和工具搭建本地编码代理成为新趋势。该指南深入剖析了...

2026-06-27 talkingdev

在人工智能领域，开放权重（open-weights）的大语言模型与闭源模型之间的性能差距一直是业界关注的焦点。近日，一项基于“人工分析基准”（Artificial Analysis benchmarks）的预测研究指出，到2026年12月3日，一款能...

2026-06-23 talkingdev

在 AI 大模型竞争白热化的当下，开源模型与闭源旗舰的性能差距一直是业界关注的焦点。知名科技评测媒体 Tech Stackups 发布了一项引人注目的对比测试：将智谱开源的大型语言模型 GLM-5.2 与 Anthropic 的顶级闭源模...

2026-06-23 talkingdev

最新发布的开源大语言模型GLM-5.2在多项基准测试中展现出令人瞩目的性能，一举超越当前所有同级别开源模型，成为开源社区的新标杆。该模型在逻辑推理、代码生成以及多语言理解等关键领域表现尤为突出，其评测分数甚...

2026-06-23 talkingdev

大型语言模型（LLM）的核心架构是Transformer，它通过引入自注意力机制，从根本上解决了传统循环神经网络（RNN）在处理长序列数据时面临的顺序计算瓶颈与长距离信息衰减问题。本文深入剖析了Transformer的各个关键组...