大语言模型的相关内容 - 漫话开发者

2025-12-20 talkingdev

2025年大语言模型范式变革年度回顾：关键趋势与未来展望

知名AI研究员Andrej Karpathy近期发布了其对2025年大语言模型（LLM）领域范式变革的年度回顾文章，引发了技术社区的广泛关注与讨论。该文章深度剖析了过去一年中LLM领域在架构、训练范式、应用部署及多模态融合等方...

2025-12-19 talkingdev

一个名为“History LLMs”的开源项目在技术社区引发了广泛关注。该项目旨在训练迄今为止规模最大的、专门基于1913年之前历史文本的大型语言模型。其核心构想是通过构建一个纯净的“前现代”语料库——即排除所有1913年之后...

2025-12-13 talkingdev

据技术观察者Simon Willison在其博客中披露，OpenAI已在ChatGPT和Codex模型中低调整合了竞争对手Anthropic于去年十月推出的“技能”（Skills）机制。这一机制的核心在于，它允许AI模型直接调用外部工具或API来执行特定...

2025-12-12 talkingdev

人工智能研究机构OpenAI正式发布了其最新的前沿模型GPT-5.2，该模型被定位为专为专业知识工作和长期运行的智能体（agents）而设计的最先进系统。根据官方介绍，GPT-5.2在多个关键领域树立了新的性能标杆，包括代码生...

2025-12-12 talkingdev

根据最新市场监测数据，2025年11月企业级人工智能（AI）的采用率稳定在45%，增长势头出现明显停滞。这一现象在金融和科技这两个传统上对新技术最为敏感的行业尤为突出，其采用率甚至出现了轻微下滑。值得关注的是，...

2025-12-12 talkingdev

近日，一篇题为《Prompts for Open Problems》的文章在机器学习研究社区引发了广泛讨论。文章作者系统性地提出了四个具有高度前瞻性和可行性的研究方向，旨在推动领域突破现有范式。首先，“基于设计的机器学习”倡导...

2025-12-12 talkingdev

OpenAI正式推出其新一代前沿模型GPT-5.2，该模型被定位为专为专业工作场景和长期运行的智能体（agent）工作流而优化的最先进模型。相较于前代，GPT-5.2在多个关键维度实现了显著提升：其一，在知识工作领域，模型展...

2025-12-09 talkingdev

一项突破性的研究提出了一种无需任何人工偏好标注即可训练视觉语言模型评判者的全新框架。该框架的核心在于通过自我合成数据实现迭代式自训练，从而摆脱了对昂贵且易过时的人工标注的依赖。其工作流程分为三个阶段：...