漫话开发者 - UWL.ME 精选全球AI前沿科技和开源产品
2025-06-19 talkingdev

Moonshot AI开源模型Kimi-Dev-72B在SWE-bench测试中创下60.4%新纪录

近日,Moonshot AI推出的Kimi-Dev-72B开源模型在SWE-bench Verified测试中取得了60.4%的优异成绩,成为当前开源模型中的新标杆。这一突破性成果得益于其采用的大规模强化学习技术,该技术通过在Docker环境中直接修补...

Read More
2025-06-18 talkingdev

AI文档撰写最佳实践:提升RAG系统效能的关键

Kapa.ai最新发布的文档《Writing documentation for AI: best practices》详细探讨了为AI系统撰写高效文档的核心原则,尤其针对检索增强生成(RAG)技术栈的优化需求。文章指出,RAG系统的性能高度依赖知识库文档的...

Read More
2025-06-17 talkingdev

CoRT-通过代码解释器增强大模型推理能力

GitHub最新开源项目CoRT(Code Interpreter Reasoning)提出了一种创新的方法,通过提示工程(hint engineering)对大语言模型进行后训练(post-train),使其能够将复杂计算任务智能分配给外部代码解释器执行。这一...

Read More
2025-06-17 talkingdev

OpenAI将Prompts升级为API原语,开发者可集中管理提示词

OpenAI宣布将Prompts(提示词)正式升级为API原语,这一重大更新将允许开发者在Playground、API、Evals和Stored Completions等平台间实现提示词的集中管理、版本控制和优化。开发者现在可以预先配置提示词的工具、模...

Read More
2025-06-16 talkingdev

SWE-Factory开源基于LLM多智能体的自动解决管道

SWE-Factory项目近日发布了一套自动化训练与评估管道,专门用于GitHub问题解决任务。该系统的核心创新在于采用了基于大语言模型(LLM)的多智能体系统架构,通过模拟人类开发者的协作模式,实现了软件开发问题的智能...

Read More
2025-06-16 talkingdev

Anthropic揭秘多智能体深度研究系统:并行搜索性能提升显著

Anthropic在其工程博客中详细披露了多智能体系统的关键技术突破,包括提示设计、工具协调和生产可靠性挑战的解决方案。该系统采用协调器-工作者模式,由一个主导智能体生成多个专用子智能体进行并行搜索,性能远超基...

Read More
2025-06-16 talkingdev

告别Bug之吻:QA Wolf推出全自动端到端测试覆盖服务

QA Wolf推出的AI原生服务能在不到4个月内为网页和移动应用实现80%的自动化测试覆盖率。该服务基于开源框架Playwright构建并维护测试套件,同时提供在其基础设施上无限并行测试运行(含24小时维护)。以Salesloft为例...

Read More
2025-06-12 talkingdev

[论文推荐]通过高频日内交易最大化电池储能收益

最新研究提出了一种针对电网级电池储能系统(BESS)的高频日内交易策略,旨在通过动态捕捉电力市场中的瞬时交易机会实现收益最大化。该论文创新性地将标准滚动内在策略(rolling intrinsic strategy)适配于连续日内...

Read More
  1. Prev Page
  2. 3
  3. 4
  4. 5
  5. Next Page