语言模型的相关内容 - 漫话开发者

2025-12-19 talkingdev

开源|History LLMs：训练于1913年前文本的“历史专家”大语言模型项目引发热议

一个名为“History LLMs”的开源项目在技术社区引发了广泛关注。该项目旨在训练迄今为止规模最大的、专门基于1913年之前历史文本的大型语言模型。其核心构想是通过构建一个纯净的“前现代”语料库——即排除所有1913年之后...

2025-12-18 talkingdev

OpenAI官方宣布，开发者现已可以向ChatGPT提交应用程序以供审核和发布。这一举措标志着ChatGPT平台正式向第三方开发者开放其应用生态，用户将能够在即将上线的应用目录中发现和体验各类由开发者构建的AI应用。此举不...

2025-12-13 talkingdev

据技术观察者Simon Willison在其博客中披露，OpenAI已在ChatGPT和Codex模型中低调整合了竞争对手Anthropic于去年十月推出的“技能”（Skills）机制。这一机制的核心在于，它允许AI模型直接调用外部工具或API来执行特定...

2025-12-12 talkingdev

人工智能研究机构OpenAI正式发布了其最新的前沿模型GPT-5.2，该模型被定位为专为专业知识工作和长期运行的智能体（agents）而设计的最先进系统。根据官方介绍，GPT-5.2在多个关键领域树立了新的性能标杆，包括代码生...

2025-12-12 talkingdev

根据最新市场监测数据，2025年11月企业级人工智能（AI）的采用率稳定在45%，增长势头出现明显停滞。这一现象在金融和科技这两个传统上对新技术最为敏感的行业尤为突出，其采用率甚至出现了轻微下滑。值得关注的是，...

2025-12-12 talkingdev

近日，一篇题为《Prompts for Open Problems》的文章在机器学习研究社区引发了广泛讨论。文章作者系统性地提出了四个具有高度前瞻性和可行性的研究方向，旨在推动领域突破现有范式。首先，“基于设计的机器学习”倡导...

2025-12-12 talkingdev

OpenAI正式推出其新一代前沿模型GPT-5.2，该模型被定位为专为专业工作场景和长期运行的智能体（agent）工作流而优化的最先进模型。相较于前代，GPT-5.2在多个关键维度实现了显著提升：其一，在知识工作领域，模型展...

2025-12-09 talkingdev

OpenAI的研究团队近期在模型可解释性领域取得重要进展，通过结合稀疏自编码器与创新的潜在归因方法，系统性地定位和解决大型语言模型中的行为错位问题。该研究提出的归因方法能够有效识别稀疏自编码器潜在空间中导致...