规模的相关内容 - 漫话开发者

2025-06-10 talkingdev

微软推出Code Researcher：可解析百万行代码的深度研究智能体，Linux内核崩溃修复率提升至58%

微软最新研发的Code Researcher智能体在大型系统代码分析领域取得重大突破，其针对Linux内核崩溃的修复率达到58%，远超SWE-agent的37.5%。这一进展标志着AI编程助手正从快速修复工具向具备深度研究能力的系统演进。...

2025-06-09 talkingdev

微软研究院最新提出的GUI-Actor技术，彻底改变了AI代理与图形用户界面（GUI）的交互方式。这项突破性技术摒弃了传统依赖像素坐标预测的方法，转而采用注意力机制直接解析屏幕截图内容，使AI能够像人类一样'理解'界面...

2025-06-09 talkingdev

阿里巴巴近日开源了Qwen3 Embedding系列模型，其8B参数版本在权威的MTEB多语言排行榜上位列第一。这一系列模型为开发者提供了构建RAG系统、语义搜索引擎和文档检索应用的强大工具，支持超过100种语言的处理需求。模...

2025-06-09 talkingdev

苹果公司研究团队通过定制化谜题环境对大型推理模型(LRMs)进行了系统性评估，揭示了人工智能推理能力的重要局限性。研究发现，随着任务复杂度提升，LRMs会经历推理效能先上升后急剧下降的拐点现象，最终在高度复杂任...

2025-06-09 talkingdev

近日，GitHub用户aavetis发布了一项关于AI编程助手在Pull Request（PR）表现上的对比研究，引发了开发者社区的广泛关注。该研究通过实际数据追踪了GitHub Copilot、OpenAI Codex、Cursor以及新兴的Devin等AI编程工具...

2025-06-06 talkingdev

Tokasaurus是一款针对高吞吐量工作负载优化的大型语言模型（LLM）推理引擎，由斯坦福大学Scaling Intelligence团队研发。该引擎通过创新的架构设计和算法优化，显著提升了LLM在批量处理任务时的计算效率，为需要大规...

2025-06-06 talkingdev

HyperDX团队（现隶属于ClickHouse）近日发布了ClickStack，一个开源的观测性平台，旨在帮助开发者快速收集、集中管理和可视化日志、指标和追踪数据。该平台由ClickHouse提供存储支持，HyperDX负责可视化，OpenTeleme...

2025-06-05 talkingdev

随着AI技术在企业应用中的加速渗透，Airia平台以『零人力增长实现生产力倍增』为核心目标，推出全栈式企业AI代理解决方案。该平台通过三大核心能力重塑组织效能：1) 低代码/无代码工作流构建器，允许非技术人员快速...