LLM的相关内容 - 漫话开发者

2025-10-10 talkingdev

仅需250份样本即可毒害任意规模大语言模型，Anthropic研究揭示数据投毒攻击风险

Anthropic联合英国AI安全研究所与艾伦·图灵研究所的最新研究表明，大语言模型面临严重的数据投毒威胁。实验发现，仅需在训练数据中插入250份被篡改的文档（仅占训练总量的0.00016%），就能在参数规模从6亿到130亿不...

2025-10-10 talkingdev

近日，信息检索领域迎来突破性进展——基于生成式模型的上下文排序（ICR）技术实现规模化应用。传统ICR方法通过将任务描述、候选文档和查询直接输入大语言模型（LLM）来识别相关文档，虽效果显著但存在计算效率瓶颈：...

2025-10-10 talkingdev

近日GitHub平台出现名为Sora MCP的开源项目，该项目通过构建MCP（模型控制协议）服务器，首次实现大型语言模型直接调用Sora视频生成API的技术突破。该工具使LLMs具备创建Sora视频、实时查询生成状态、将生成视频下载...

2025-10-07 talkingdev

OpenAI正式推出Apps SDK开发框架，为开发者提供构建ChatGPT专属应用的核心工具链。该框架通过标准化接口封装了对话管理、上下文控制和多模态交互能力，支持快速集成知识库检索、工作流编排等企业级功能。技术文档显...

2025-10-06 talkingdev

最新研究针对大型语言模型的表格理解能力展开系统性评测，通过向GPT-4.1-nano模型输入包含1000条员工记录的11种不同格式数据，评估其回答问题的准确率。研究结果显示，Markdown键值对格式（Markdown-KV）以最高准确...

2025-10-05 talkingdev

NeurIPS 2024系统推理研讨会最新收录的研究项目ProofOfThought提出了一种突破性的神经符号编程合成方法，通过结合大型语言模型的语义理解能力与Z3定理证明器的形式化验证机制，实现了兼具鲁棒性与可解释性的自动推理...

2025-10-03 talkingdev

科技巨头IBM近日正式推出Granite 4.0大语言模型系列，该开源方案采用创新的混合架构设计，宣称相比传统LLM可大幅降低内存占用。作为拥有114年历史的科技企业，IBM此次发布的模型特别强调“企业就绪”特性，通过结合Mam...

2025-10-02 talkingdev

谷歌开发者博客最新推出开源项目Tunix，这是一个基于JAX框架原生设计的专业化工具库，致力于简化大型语言模型从预训练到完全对齐、生产就绪的完整流程。该库为开发者提供了一套全面且友好的工具集，支持大规模模型对...