大型语言模型的相关内容 - 漫话开发者

2025-11-06 talkingdev

AWS EFA实现万亿参数模型突破：Perplexity发布分布式推理代码

人工智能研究机构Perplexity近日发布突破性代码，首次实现万亿参数混合专家模型在多个AWS服务器间的高效运行。这项技术突破使得算力基础设施相对薄弱的数据中心也能承载尖端AI模型的推理任务。当前大型语言模型面临...

2025-11-04 talkingdev

谷歌Angular团队近日正式开源Web Codegen Scorer工具，专门用于评估大型语言模型生成的Web代码质量。该工具通过建立标准化的代码质量评估体系，支持跨模型、跨框架的横向对比分析，为AI代码生成技术的优化提供量化依...

2025-11-04 talkingdev

Perplexity通过颠覆性的技术架构实现了对传统搜索引擎的革新。其核心是采用检索增强生成（RAG）技术路线，将实时网络搜索与大型语言模型深度整合。该系统首先通过Vespa AI引擎对超过2000亿个URL建立索引，随后通过智...

2025-10-31 talkingdev

OpenAI近日公开了其基于ChatGPT的浏览器Atlas的核心技术突破——OWL（OpenAI's Web Layer）架构。这一创新设计将Chromium浏览器进程从主应用进程中分离，构建独立的服务层，实现了技术架构的质的飞跃。通过进程隔离，A...

2025-10-29 talkingdev

Butter是一项专注于优化大型语言模型（LLM）应用成本与效率的前沿技术解决方案。它通过智能缓存机制识别并重复调用相同的LLM响应，显著降低AI系统的运营成本，同时增强其输出的确定性。该技术与OpenAI等主流聊天补全...

2025-10-27 talkingdev

Anthropic研究团队在《Circuits Updates – October 2025》中披露了令人振奋的发现：其大型语言模型Claude的内部神经元展现出跨模态理解能力。实验表明，当模型处理文字“眼睛”时激活的特定神经元，在遇到用@符号排列...

2025-10-24 talkingdev

加州大学伯克利分校研究团队开发的进化编码智能体OpenEvolve，成功将大型语言模型转化为自主代码优化器，在混合专家模型负载平衡任务中取得重大突破。该系统通过模拟自然选择机制，使LLM能够自主探索算法空间，最终...

2025-10-23 talkingdev

浙江大学团队推出的LightMem开源项目，为大型语言模型智能体提供了一套轻量级记忆增强生成解决方案。该系统通过创新的记忆管理架构，实现了长期记忆的存储、检索和更新功能，显著降低了传统记忆模块的计算开销。技术...