漫话开发者 - UWL.ME 精选全球AI前沿科技和开源产品
2026-05-19 talkingdev

开源|大模型预训练的“模式跳跃”:语言模型如何从鹦鹉学舌到展现智能?

一项最新研究揭示了语言模型在预训练过程中的一个惊人现象:它们并非平稳地提升能力,而是在“模仿”和“智能行为”之间突然切换,研究人员将其称为“模式跳跃”。这种非连续性的行为转变无法通过标准的优化技术(如调整学...

Read More
2026-05-19 talkingdev

开源|HRM-Text:1B参数文本生成模型,训练成本仅为传统模型的几百分之一

近日,一款名为HRM-Text的新型文本生成模型在GitHub上开源,引发了AI社区的广泛关注。该模型基于HRM架构,参数规模为10亿(1B),但其最大的亮点在于惊人的训练效率。据项目介绍,HRM-Text的训练所需的计算资源和数...

Read More
2026-05-19 talkingdev

揭密大模型内部的政治审查机制:Qwen3.5-9B权重中的可读“审查开关”

一项针对阿里通义千问Qwen3.5-9B模型的最新逆向分析揭示,该模型的政治审查并非根植于其预训练阶段获取的事实性知识,而是在知识层之上附加的一层独立、可识别甚至可移除的注意力电路。研究人员发现,模型本身并未“...

Read More
2026-05-19 talkingdev

Anthropic 收购 SDK 初创公司 Stainless,强化 AI 开发生态工具链

人工智能安全与研究公司 Anthropic 宣布收购开发者工具初创公司 Stainless。Stainless 专注于 SDK 自动化平台,其解决方案能够帮助开发者快速生成和维护高质量的软件开发工具包。该平台在 AI 行业中拥有广泛的用户基...

Read More
2026-05-19 talkingdev

Cursor 发布 Composer 2.5:强化学习加持的智能编码Agent,长时任务能力飞跃

著名AI编程工具Cursor近日正式发布了Composer 2.5版本。这是一款经过深度改进的代码生成Agent,其核心升级在于采用了目标导向的强化学习、合成数据生成以及全新的分布式训练技术。这一举措显著提升了AI在复杂、长周...

Read More
2026-05-19 talkingdev

阿里Qwen3.7预览版登陆Arena,文本与视觉双赛道排名飙升

阿里巴巴通义千问团队近日在Arena平台上发布了Qwen3.7预览版,涵盖文本和视觉两大核心能力。据悉,Qwen3.7 Max Preview在文本竞技场中位列第13名,而Qwen3.7 Plus Preview则在视觉竞技场中排名第16,显示出阿里在大...

Read More
2026-05-18 talkingdev

Braze CTO 独家揭秘:如何用 AI 重构工程团队,六成代码已由 AI 生成

在人工智能浪潮席卷各行各业的当下,客户互动平台 Braze 的首席技术官近日分享了其工程团队向“AI-first”模式转型的激进实践。据透露,Braze 在短短几个月内完成了工程范式的切换,目前超过 60% 的已提交代码是由 AI...

Read More
2026-05-18 talkingdev

开源|Semble:为AI智能体打造的代码搜索神器,Token消耗减少98%

Semble是一款由MinishLab开发的高性能代码搜索库,专为帮助AI智能体通过自然语言快速定位代码片段而设计。它的核心亮点在于大幅降低Token消耗——相比传统的‘grep+read’方法,Semble能减少约98%的Token使用量,同时保...

Read More
  1. 1
  2. 2
  3. 3
  4. Next Page