漫话开发者 - UWL.ME 精选全球AI前沿科技和开源产品
2025-08-11 talkingdev

从GPT-2到GPT-OSS:架构演进全解析与Qwen3的对比

近日,一篇深度分析文章《From GPT-2 to GPT-OSS: Analyzing the Architectural Advances》引发技术社区广泛讨论。文章系统梳理了从GPT-2到最新GPT-OSS(开源GPT模型)的架构演进历程,重点对比了其与阿里云Qwen3的...

Read More
2025-08-10 talkingdev

AI初创公司Anthropic与OpenAI高薪挖角华尔街量化研究员,人才争夺战升级

据彭博社报道,以Anthropic和OpenAI为代表的人工智能初创公司正在加速从华尔街金融机构招募量化研究员,提供极具竞争力的薪酬和福利。在曼哈顿下东区的一个屋顶酒吧,约150名量化研究员与Anthropic的员工进行了会面...

Read More
2025-08-08 talkingdev

Octo:更友好灵活的开源编程助手,支持多模型切换

Octo 是一款开源编程助手,以其友好性和灵活性受到开发者关注。它兼容 OpenAI 和 Anthropic 等主流大语言模型(LLM)API,允许开发者在对话中随时切换模型,以应对特定模型无法解决的问题。此外,Octo 支持用户使用...

Read More
2025-08-06 talkingdev

OpenAI发布两款开源推理模型:gpt-oss-120b与gpt-oss-20b

OpenAI近日正式推出两款开源权重推理模型gpt-oss-120b和gpt-oss-20b,标志着其在开放生态建设上的重大进展。这两款模型采用Apache 2.0许可证,允许用户自由定制并应用于商业场景,其显著特性包括支持智能体任务处理...

Read More
2025-08-06 talkingdev

开源|OpenAI发布Harmony响应格式渲染器,助力gpt-oss开源模型结构化输出

OpenAI近日在GitHub上开源了Harmony响应格式的渲染器项目,该项目专为其gpt-oss系列开源权重模型设计,旨在实现对话输出的结构化处理。Harmony格式通过Rust编写的核心模块与Python绑定,提供了高效的格式解析与渲染...

Read More
2025-08-06 talkingdev

开源|Code Index MCP:助力大语言模型高效索引与分析代码仓库的协议服务器

Code Index MCP是一款基于Model Context Protocol(MCP)的服务器工具,专为大型语言模型设计,旨在通过极简配置实现对代码仓库的高效索引、搜索与分析。该工具通过先进的搜索算法和代码解析技术,彻底改变了AI理解...

Read More
2025-08-04 talkingdev

LangExtract:基于LLM的文本结构化信息提取库

Google近日在GitHub开源了LangExtract项目,这是一个基于大语言模型(LLM)的Python库,专门用于从非结构化文本中提取结构化信息。该库允许用户通过自定义指令,将杂乱的文本数据转化为可靠的格式化输出。其核心技术...

Read More
2025-08-02 talkingdev

深度智能体:突破LLM工具调用局限,实现复杂任务规划与执行

近日,LangChain博客发布了一篇关于深度智能体(Deep Agents)的技术文章,探讨了如何克服当前基于大语言模型(LLM)的智能体在复杂任务规划与执行中的局限性。传统LLM智能体通常采用简单的工具调用循环架构,这种“...

Read More
  1. Prev Page
  2. 14
  3. 15
  4. 16
  5. Next Page