漫话开发者 - UWL.ME 精选全球AI前沿科技和开源产品
2025-10-03 talkingdev

Comet浏览器全球正式发布:AI原生浏览器重塑网络交互体验

在经历高需求测试阶段后,Perplexity公司正式面向全球用户推出Comet浏览器。这款AI原生浏览器通过深度融合人工智能技术,旨在重构用户的在线交互范式。其核心突破在于将大语言模型能力与浏览器底层架构结合,实现智...

Read More
2025-10-03 talkingdev

IBM发布开源企业级大模型Granite 4.0:混合架构显著降低内存占用

科技巨头IBM近日正式推出Granite 4.0大语言模型系列,该开源方案采用创新的混合架构设计,宣称相比传统LLM可大幅降低内存占用。作为拥有114年历史的科技企业,IBM此次发布的模型特别强调“企业就绪”特性,通过结合Mam...

Read More
2025-10-02 talkingdev

谷歌发布Tunix:基于JAX的LLM后训练工具库,加速大模型生产部署

谷歌开发者博客最新推出开源项目Tunix,这是一个基于JAX框架原生设计的专业化工具库,致力于简化大型语言模型从预训练到完全对齐、生产就绪的完整流程。该库为开发者提供了一套全面且友好的工具集,支持大规模模型对...

Read More
2025-10-02 talkingdev

Thinking Machines实验室推出Tinker API:革新语言模型微调技术

Thinking Machines实验室近日正式发布Tinker API,这一创新平台为开源权重语言模型的精细化调优提供了灵活接口。该技术通过抽象化底层基础设施复杂度,显著降低了开发者部署大型语言模型的技术门槛。特别值得关注的...

Read More
2025-10-01 talkingdev

智谱AI发布GLM-4.6大模型:200K上下文窗口,宣称编程推理能力逼近Claude Sonnet 4

智谱AI正式推出新一代开源权重模型GLM-4.6,该模型最突出的特性是支持高达200K tokens的上下文窗口,使其能够处理更长的文档和复杂任务链。官方宣称在编程与逻辑推理任务上已接近Anthropic公司发布的Claude Sonnet 4...

Read More
2025-09-30 talkingdev

DeepSeek-V3.2-Exp发布:稀疏注意力机制突破长序列处理瓶颈

深度求索公司最新推出的DeepSeek-V3.2-Exp模型引入了创新的稀疏注意力机制,这一技术突破专门针对长上下文序列的训练和推理效率进行了深度优化。该机制通过智能选择关键注意力区域,显著降低了计算复杂度,使得模型...

Read More
2025-09-30 talkingdev

开源|Anthropic发布Claude Code 2.0:专为开发者打造的AI编程助手

人工智能公司Anthropic近日在npm平台正式发布了Claude Code 2.0软件包,标志着AI辅助编程工具进入新的发展阶段。该工具基于Anthropic领先的大语言模型技术,专门针对代码生成、调试和优化等开发场景进行深度优化。在...

Read More
2025-09-29 talkingdev

苹果内部测试'Veritas'聊天机器人,或为Siri AI升级铺路

据最新科技资讯披露,苹果公司正在内部测试代号为'Veritas'的专属员工聊天机器人,这被业界视为苹果对标ChatGPT的重要布局。该举措发生在苹果AI战略面临多重挑战的背景下:其Apple Intelligence功能市场反响平淡,Si...

Read More
  1. Prev Page
  2. 4
  3. 5
  4. 6
  5. Next Page