模型的相关内容 - 漫话开发者

2025-10-12 talkingdev

独家：xAI从英伟达挖角两名AI研究员，正开发用于游戏与机器人的世界模型

据英国《金融时报》科技记者Cristina Criddle独家报道，埃隆·马斯克旗下人工智能公司xAI正在秘密推进世界模型（World Models）的研发，该技术将重点应用于游戏与机器人两大领域。为加速技术突破，xAI已从英伟达成功...

2025-10-12 talkingdev

Meta Superintelligence Labs于arXiv发布编号2509.01092的首篇论文，引发学术社区高度关注。该研究并未延续当前大模型参数规模竞赛的常规路径，而是聚焦于注意力机制的基础架构创新。论文提出了一种名为"动态稀疏注...

2025-10-10 talkingdev

近日，GitHub开源项目Jetski为模型上下文协议（MCP）服务器生态带来突破性解决方案。该平台通过零代码修改即可为MCP服务器注入企业级身份认证与深度分析能力，支持最新OAuth2.1标准和动态客户端注册（DCR）协议。其...

2025-10-10 talkingdev

Anthropic联合英国AI安全研究所与艾伦·图灵研究所的最新研究表明，大语言模型面临严重的数据投毒威胁。实验发现，仅需在训练数据中插入250份被篡改的文档（仅占训练总量的0.00016%），就能在参数规模从6亿到130亿不...

2025-10-10 talkingdev

近日，信息检索领域迎来突破性进展——基于生成式模型的上下文排序（ICR）技术实现规模化应用。传统ICR方法通过将任务描述、候选文档和查询直接输入大语言模型（LLM）来识别相关文档，虽效果显著但存在计算效率瓶颈：...

2025-10-10 talkingdev

近日GitHub平台出现名为Sora MCP的开源项目，该项目通过构建MCP（模型控制协议）服务器，首次实现大型语言模型直接调用Sora视频生成API的技术突破。该工具使LLMs具备创建Sora视频、实时查询生成状态、将生成视频下载...

2025-10-10 talkingdev

OpenAI最新发布的GPT-5模型在政治偏见控制方面取得突破性进展。根据该公司与Axios共享的研究数据，GPT-5即时版（Instant）和思考版（Thinking）相较于前代模型，政治偏见水平降低了30%。这一改进源于模型架构的优化...

2025-10-09 talkingdev

近日GitHub开源项目FleetCode推出创新性桌面终端应用，该工具通过创建隔离的Git工作树环境，实现了对Claude Code、Codex等命令行编码智能体的并行化调度与持久化会话管理。其技术核心在于采用轻量级控制平面架构，开...