语言模型的相关内容 - 漫话开发者

2025-11-04 talkingdev

Perplexity如何打造AI版Google：揭秘下一代答案引擎技术架构

Perplexity通过颠覆性的技术架构实现了对传统搜索引擎的革新。其核心是采用检索增强生成（RAG）技术路线，将实时网络搜索与大型语言模型深度整合。该系统首先通过Vespa AI引擎对超过2000亿个URL建立索引，随后通过智...

2025-11-03 talkingdev

Anthropic最新研究通过‘概念注入’实验，首次系统验证了大语言模型的内省能力。研究显示，特别是Claude Opus 4和4.1版本模型能够检测并识别被注入的概念，并能通过参照自身‘意图’来识别意外输出。实验证明这些模型具...

2025-10-31 talkingdev

知名AI社区Hugging Face近日发布了一份名为《Smol训练手册》的深度技术指南，首次系统披露了从零开始训练大语言模型的全流程实战经验。该手册覆盖了模型训练生命周期的关键阶段：从小规模消融实验和基础设施调试，到...

2025-10-31 talkingdev

OpenAI近日公开了其基于ChatGPT的浏览器Atlas的核心技术突破——OWL（OpenAI's Web Layer）架构。这一创新设计将Chromium浏览器进程从主应用进程中分离，构建独立的服务层，实现了技术架构的质的飞跃。通过进程隔离，A...

2025-10-31 talkingdev

月之暗面（Moonshot AI）正式发布Kimi Linear技术报告，这项突破性架构通过创新设计实现了对传统全注意力机制的全面超越。该架构在保持同等性能水平下，将KV缓存使用量最高降低75%，在100万上下文长度场景中解码吞吐...

2025-10-29 talkingdev

Butter是一项专注于优化大型语言模型（LLM）应用成本与效率的前沿技术解决方案。它通过智能缓存机制识别并重复调用相同的LLM响应，显著降低AI系统的运营成本，同时增强其输出的确定性。该技术与OpenAI等主流聊天补全...

2025-10-29 talkingdev

近日，GitHub开源项目Dexto引发开发者社区广泛关注。作为专为AI智能体设计的智能层框架，Dexto通过协调大语言模型、工具链与数据源，将自然语言指令转化为可执行动作。其核心价值在于提供配置驱动的开发范式，支持命...

2025-10-29 talkingdev

最新研究揭示，基于大语言模型（LLM）的智能体AI系统存在根本性安全缺陷——模型无法有效区分指令与数据，导致其极易遭受提示注入攻击。攻击者可通过在Jira工单、网页内容等非受信源中嵌入隐藏指令，诱使具有敏感数据...