大型语言模型的相关内容 - 漫话开发者

2025-10-17 talkingdev

论文推荐|ScaleRL：大型语言模型强化学习计算扩展的首个系统性研究框架

来自大规模实验的研究团队发布了名为ScaleRL的创新框架，这是首个针对大型语言模型强化学习计算扩展的系统性研究方法。该研究通过超过40万GPU小时的实验数据，构建了可预测的S型计算-性能曲线，揭示了RL训练中算法改...

2025-10-15 talkingdev

一项发表于arXiv的前沿研究显示，大型语言模型（LLM）通过创新的语义相似性评分方法，在57种个人护理产品的消费选择预测中成功复现了人类决策模式，达到人类测试重测可靠性的90%。传统调研方法依赖数值评分易导致数...

2025-10-10 talkingdev

近日GitHub平台出现名为Sora MCP的开源项目，该项目通过构建MCP（模型控制协议）服务器，首次实现大型语言模型直接调用Sora视频生成API的技术突破。该工具使LLMs具备创建Sora视频、实时查询生成状态、将生成视频下载...

2025-10-07 talkingdev

OpenAI近日推出全新开发者工具，允许第三方应用通过MCP连接器直接嵌入ChatGPT对话界面。在官方演示中，用户已能通过Booking.com实时搜索酒店房源，借助Zillow进行房产数据调研，并利用Canva快速生成演示文稿。这一技...

2025-10-07 talkingdev

OpenAI近日在GitHub平台正式开源了ChatKit-JS项目，这是一个专为JavaScript开发者设计的对话界面开发工具包。该库封装了与OpenAI API交互的核心能力，支持实时对话流、上下文管理和多轮对话等企业级功能，可显著降低...

2025-10-07 talkingdev

OpenAI正式推出Apps SDK开发框架，为开发者提供构建ChatGPT专属应用的核心工具链。该框架通过标准化接口封装了对话管理、上下文控制和多模态交互能力，支持快速集成知识库检索、工作流编排等企业级功能。技术文档显...

2025-10-06 talkingdev

最新研究针对大型语言模型的表格理解能力展开系统性评测，通过向GPT-4.1-nano模型输入包含1000条员工记录的11种不同格式数据，评估其回答问题的准确率。研究结果显示，Markdown键值对格式（Markdown-KV）以最高准确...

2025-10-05 talkingdev

NeurIPS 2024系统推理研讨会最新收录的研究项目ProofOfThought提出了一种突破性的神经符号编程合成方法，通过结合大型语言模型的语义理解能力与Z3定理证明器的形式化验证机制，实现了兼具鲁棒性与可解释性的自动推理...