谷歌近期在Gemma大型语言模型上实现了令人瞩目的推理速度提升,成功将性能提升了三倍。这一突破性进展的核心在于采用了“投机解码”(Speculative Decoding)技术。该技术的工作原理是部署一个轻量级、速度极快的“草稿...
Read More在 AI 语音交互技术飞速发展的今天,实时通信协议的选择正成为影响系统性能与可靠性的关键瓶颈。一篇来自 moq.dev 的最新技术分析文章指出,广泛使用的 WebRTC 协议并非 AI 语音应用的理想选择。WebRTC 的设计初衷是...
Read More谷歌DeepMind团队近日发布了其最新成果AlphaEvolve,这是一个由Gemini大模型驱动的自主编码代理。与普通的代码助手不同,AlphaEvolve的核心能力在于设计并生成高级算法,而不仅仅是补全或改写现有代码。它已经能够在...
Read MoreGitHub 近日发布技术博客,详细介绍了其针对 GitHub Agent Workflows 中 Tokens 使用效率的优化工作。随着AI代理工作流在代码仓库管理和代码质量提升中的广泛应用,其自动调度与触发的特性导致Token消耗量急剧增加,...
Read MoreOpenAI近日在API中正式推出了一系列全新的实时音频模型,标志着语音交互技术迈入了一个全新阶段。该系列包括三款核心模型:GPT-Realtime-2,专注于增强对话式推理能力,能够实现更自然、更具逻辑性的实时语音对话;G...
Read MoreOpenAI 宣布其 AI 编程模型 Codex 现已原生支持在 macOS 和 Windows 系统的 Chrome 浏览器中直接运行。这一新特性允许 Codex 在后台不接管浏览器控制权的情况下,跨多个标签页并行工作。用户可以通过它高效地执行重...
Read More近日,一项名为ProgramBench的新型基准测试引发了人工智能和软件工程领域的广泛关注。该测试旨在评估AI智能体(Agent)在没有源代码的情况下,仅通过阅读文档和进行实验,从零开始逆向构建软件可执行文件的能力。Pro...
Read More近日,一款名为Hallucinopedia(注:根据项目网址halupedia.com推测,该名称可能为“Hallucination Encyclopedia”即“幻觉百科全书”的合成词,但网站实际名称为Halupedia,应尊重原项目名称)的趣味知识项目在Hacker N...
Read More