漫话开发者 - UWL.ME 精选全球AI前沿科技和开源产品
2025-09-04 talkingdev

开源|AgentScope:面向智能体编程的LLM应用开发框架

清华大学团队开源AgentScope框架,为大型语言模型应用开发提供全新范式。该框架采用智能体导向编程(Agent-Oriented Programming)设计理念,显著提升LLM应用的透明度和实时可控性。其核心特性包括工具管理、长时记...

Read More
2025-08-13 talkingdev

Claude Sonnet 4上下文窗口突破100万tokens,开启大规模代码分析与文档合成新纪元

Anthropic公司宣布其Claude Sonnet 4模型现已支持高达100万tokens的上下文窗口,这一重大升级使其处理能力提升了5倍。这一突破性进展意味着该模型能够胜任更复杂、数据密集型的任务,如大规模代码库的深度分析和长文...

Read More
2025-07-10 talkingdev

[论文推荐]猫咪干扰大模型推理:无关信息触发推理模型错误率激增300%

最新研究发现,在数学问题中插入诸如'有趣的事实:猫一生大部分时间在睡觉'等无关短语,会导致大语言模型的错误应答率较基准水平飙升300%。这种与查询无关的对抗性触发现象具有跨模型规模的迁移性,且蒸馏版模型表现...

Read More
2025-07-07 talkingdev

Sakana AI推出TreeQuest:多模型协作性能提升30%,开源工具助力企业AI升级

Sakana AI最新发布的TreeQuest技术通过创新的多模型协作框架(Multi-LLM AB-MCTS),实现了比单一大型语言模型(LLM)性能提升30%的突破。该技术采用自适应分支蒙特卡洛树搜索(Adaptive Branching Monte Carlo Tree...

Read More
2025-06-17 talkingdev

CoRT-通过代码解释器增强大模型推理能力

GitHub最新开源项目CoRT(Code Interpreter Reasoning)提出了一种创新的方法,通过提示工程(hint engineering)对大语言模型进行后训练(post-train),使其能够将复杂计算任务智能分配给外部代码解释器执行。这一...

Read More
2025-04-23 talkingdev

[开源]个性化多智能体系统FlowReasoner:基于强化学习的元推理框架

新加坡国立大学SAIL实验室推出的FlowReasoner项目,开创性地将强化学习与外部反馈机制相结合,构建了一个可自主生成定制化多智能体系统的元推理框架。该技术突破性地实现了三大创新:1) 通过动态推理引擎解析用户查...

Read More
2025-04-17 talkingdev

OpenAI发布o3和o4-mini模型:集成多模态能力,推理速度与工具使用全面升级

OpenAI正式推出新一代o3和o4-mini模型,标志着大语言模型在功能整合与推理效率上的重大突破。该系列模型通过深度融合网络搜索、文件解析及图像生成三大核心能力,显著提升了ChatGPT的复杂任务处理水平。技术层面,o4...

Read More
2025-04-16 talkingdev

MoonDream 2.0重磅升级:2B参数小模型性能超越主流开源与闭源模型

近日,轻量级视觉语言模型MoonDream迎来2.0版本重大更新。这款仅含20亿参数的VLM(Vision-Language Model)在最新测试中展现出惊人实力,其性能不仅超越多个同量级开源模型,甚至在部分基准测试中优于参数规模更大的...

Read More
  1. Next Page