漫话开发者 - UWL.ME 精选全球AI前沿科技和开源产品
2025-09-11 talkingdev

开源|Mini-o3:开源多轮视觉推理模型挑战OpenAI o3

Mini-o3作为新兴开源视觉推理模型,实现了与OpenAI o3类似的多轮交互能力,支持高达数十轮的连续对话推理。该项目完全公开训练流程,涵盖数据构建、模型架构与训练策略,为学术界和工业界提供可复现的视觉-语言智能...

Read More
2025-09-11 talkingdev

突破LLM推理非确定性难题:科学家提出确定性推理解决方案

大型语言模型(LLM)推理过程中的非确定性问题正成为制约科学研究可重复性的关键障碍。即使将温度参数调整为0(贪婪采样模式),ChatGPT等模型仍无法保证输出结果的确定性。这种现象不仅存在于API服务中,即使在本地...

Read More
2025-09-04 talkingdev

开源|AgentScope:面向智能体编程的LLM应用开发框架

清华大学团队开源AgentScope框架,为大型语言模型应用开发提供全新范式。该框架采用智能体导向编程(Agent-Oriented Programming)设计理念,显著提升LLM应用的透明度和实时可控性。其核心特性包括工具管理、长时记...

Read More
2025-09-03 talkingdev

防范提示注入攻击:六大设计模式守护AI智能体安全

提示注入攻击正成为大型语言模型面临的新型安全威胁,这种攻击通过操纵自然语言处理能力来利用系统漏洞,其原理类似于传统的SQL注入攻击。研究人员最新提出了六种核心设计模式来强化AI智能体的安全防护:行动选择器...

Read More
2025-08-27 talkingdev

开源|微软发布Minecraft MCP Server:AI助手可实时控制游戏角色进行建造与探索

微软通过GitHub开源项目yuniko-software/minecraft-mcp-server,推出基于Mineflayer API的Minecraft MCP服务器。该技术突破允许Claude等大型语言模型实时控制游戏角色,实现自然语言指令驱动的自动化建造、环境探索...

Read More
2025-08-27 talkingdev

上下文窗口难题:突破Token限制,扩展AI代理能力

当前大型语言模型(LLM)的上下文窗口容量(约100万token)已无法满足企业级代码库的处理需求,这暴露出AI编程工具在复杂场景下的架构瓶颈。为解决这一问题,行业正推动“上下文堆栈”架构的演进,该架构整合了仓库概...

Read More
2025-08-26 talkingdev

开源|Memento:无需微调LLM即可持续优化智能体,GitHub新框架引关注

近日,GitHub开源项目Memento提出了一种革命性的持续学习框架,专为大型语言模型(LLM)智能体设计。该框架通过基于记忆的架构,使智能体能够在无需调整模型权重的情况下实现持续学习,突破了传统微调技术的算力瓶颈...

Read More
2025-08-25 talkingdev

突破AI响应限制:react-markdown-with-mdx实现富UI组件动态渲染

近日,开源库react-markdown-with-mdx通过高阶组件(HOC)技术实现重大突破,允许大型语言模型(LLM)在生成的Markdown内容中直接嵌入JSX组件标签。该库基于react-markdown进行增强,通过Zod schema验证机制确保JSX...

Read More
  1. Prev Page
  2. 4
  3. 5
  4. 6
  5. Next Page