漫话开发者 - UWL.ME 精选全球AI前沿科技和开源产品
2025-08-11 talkingdev

从GPT-2到GPT-OSS:架构演进全解析与Qwen3的对比

近日,一篇深度分析文章《From GPT-2 to GPT-OSS: Analyzing the Architectural Advances》引发技术社区广泛讨论。文章系统梳理了从GPT-2到最新GPT-OSS(开源GPT模型)的架构演进历程,重点对比了其与阿里云Qwen3的...

Read More
2025-08-10 talkingdev

Ch.at:一款可通过HTTP、SSH、DNS和API访问的轻量级LLM聊天服务

Ch.at是一款创新的轻量级大型语言模型(LLM)聊天服务,其独特之处在于支持多种协议访问,包括HTTP、SSH、DNS和API。这种多协议支持的设计使得Ch.at在灵活性和适用性上具有显著优势,能够满足不同场景下的需求。目前...

Read More
2025-08-08 talkingdev

Octo:更友好灵活的开源编程助手,支持多模型切换

Octo 是一款开源编程助手,以其友好性和灵活性受到开发者关注。它兼容 OpenAI 和 Anthropic 等主流大语言模型(LLM)API,允许开发者在对话中随时切换模型,以应对特定模型无法解决的问题。此外,Octo 支持用户使用...

Read More
2025-08-07 talkingdev

AI模型内部计算路径首次可视化:多机构联合发布可解释性研究突破

由多个研究实验室联合开展的可解释性项目取得重大进展,科学家首次实现追踪AI模型推理时的内部计算路径,其精细程度堪比观察脑部神经元的激活过程。这项发表在Neuronpedia平台的研究通过交互式教材形式,系统演示了...

Read More
2025-08-04 talkingdev

LangExtract:基于LLM的文本结构化信息提取库

Google近日在GitHub开源了LangExtract项目,这是一个基于大语言模型(LLM)的Python库,专门用于从非结构化文本中提取结构化信息。该库允许用户通过自定义指令,将杂乱的文本数据转化为可靠的格式化输出。其核心技术...

Read More
2025-08-02 talkingdev

深度智能体:突破LLM工具调用局限,实现复杂任务规划与执行

近日,LangChain博客发布了一篇关于深度智能体(Deep Agents)的技术文章,探讨了如何克服当前基于大语言模型(LLM)的智能体在复杂任务规划与执行中的局限性。传统LLM智能体通常采用简单的工具调用循环架构,这种“...

Read More
2025-08-01 talkingdev

Freestyle平台文档AI化改造:如何让AI更高效理解技术文档

Freestyle作为运行AI代码的平台,近期对其技术文档进行了全面升级,旨在提升AI对文档的理解准确度。此前,平台发现用户依赖AI工具解读文档时经常获得错误信息。为此,Freestyle实施了多项创新措施:首创llms.txt标准...

Read More
2025-08-01 talkingdev

开源 | MCP-Use:轻松连接LLM与MCP服务器的Python库

MCP-Use是一款开源的Python库,旨在将大型语言模型(LLM)与MCP服务器连接起来,以便构建具有工具访问权限的自定义代理。该库通过LangChain支持多种LLM,使代理能够利用诸如网页浏览、文件操作等工具,并使用标准I/O...

Read More
  1. Prev Page
  2. 7
  3. 8
  4. 9
  5. Next Page