在软件发布前,若用户流程的测试覆盖率低于80%,Bug便极易逃逸至生产环境。然而,对于任何规模的团队而言,实现并维持如此高水平的测试覆盖既困难又昂贵。QA Wolf作为一家AI原生的测试服务提供商,正通过其创新方案...
Read More近日,GitHub开源项目SWE-Pruner提出了一种名为‘任务感知上下文剪枝’的创新框架,旨在显著优化代码智能体(Coding Agents)在处理复杂软件工程任务时的效率与成本。该框架的核心在于,通过一个轻量级模型动态分析与...
Read More近日,GitHub上开源了一款名为Fence的轻量级安全工具,它旨在为运行半可信代码提供一种新颖的隔离方案。与依赖完整操作系统级虚拟化或容器技术的传统沙盒不同,Fence采用了一种“无容器”的设计理念,通过直接包装系统...
Read More字节跳动Seed团队在GitHub上开源了Stable-DiffCoder项目,这是一个基于扩散模型(Diffusion Model)构建的轻量级代码大语言模型(Code DLLM)家族。该项目创新性地将扩散模型的生成范式引入代码建模领域,通过“块扩...
Read More近日,一个名为TTT-Discover的开源项目在GitHub上发布,其核心创新在于将强化学习(Reinforcement Learning)技术应用于大型语言模型(LLMs)的推理(Inference)阶段,而非传统的训练阶段。这一“测试时训练”(Test-...
Read More近日,由comma.ai开发的开源驾驶辅助系统Openpilot引发了科技社区的高度关注。该系统旨在通过人工智能技术,将普通汽车升级为具备先进辅助驾驶能力的智能座驾,其核心理念是“让驾驶变得更轻松”。Openpilot并非一个简...
Read More谷歌研究团队近日发布了一项关于提升智能体意图理解能力的技术成果。核心观点指出,要让AI智能体真正发挥作用,其底层模型必须精准理解用户交互时的真实意图。当前,大型多模态大语言模型虽已在此任务上表现不俗,但...
Read More根据The Information援引知情人士的报道,知名人工智能公司Anthropic在上个月更新了其财务预测,预计到2025年,通过向企业和应用开发者销售AI服务所获得的毛利率将降至40%。这一数字较此前内部估计的50%出现了显著下...
Read More