漫话开发者 - UWL.ME 精选全球AI前沿科技和开源产品
2026-05-20 talkingdev

开源项目“僵尸化”危机:依赖项如何悄然成为技术负债

开源项目因维护者倦怠、资金短缺或技术老化而陷入“僵尸化”状态——虽仍被广泛使用,但已无人维护——正成为软件供应链中一个隐秘但巨大的风险。这一问题在开源生态中尤为突出,因为大量未被更新的软件包仍被各类应用依赖...

Read More
2026-05-20 talkingdev

开源| NVIDIA LongLive 1.0:实时长视频生成框架,支持流式注意力与交互式编辑

英伟达(NVIDIA)最新开源了LongLive 1.0框架,旨在解决长视频生成领域长期面临的实时交互难题。该框架通过引入流式注意力(Streaming Attention)和KV缓存优化(KV-cache optimization)技术,实现了对超长视频序列...

Read More
2026-05-19 talkingdev

开源|大模型预训练的“模式跳跃”:语言模型如何从鹦鹉学舌到展现智能?

一项最新研究揭示了语言模型在预训练过程中的一个惊人现象:它们并非平稳地提升能力,而是在“模仿”和“智能行为”之间突然切换,研究人员将其称为“模式跳跃”。这种非连续性的行为转变无法通过标准的优化技术(如调整学...

Read More
2026-05-19 talkingdev

开源|HRM-Text:1B参数文本生成模型,训练成本仅为传统模型的几百分之一

近日,一款名为HRM-Text的新型文本生成模型在GitHub上开源,引发了AI社区的广泛关注。该模型基于HRM架构,参数规模为10亿(1B),但其最大的亮点在于惊人的训练效率。据项目介绍,HRM-Text的训练所需的计算资源和数...

Read More
2026-05-19 talkingdev

揭密大模型内部的政治审查机制:Qwen3.5-9B权重中的可读“审查开关”

一项针对阿里通义千问Qwen3.5-9B模型的最新逆向分析揭示,该模型的政治审查并非根植于其预训练阶段获取的事实性知识,而是在知识层之上附加的一层独立、可识别甚至可移除的注意力电路。研究人员发现,模型本身并未“...

Read More
2026-05-19 talkingdev

阿里Qwen3.7预览版登陆Arena,文本与视觉双赛道排名飙升

阿里巴巴通义千问团队近日在Arena平台上发布了Qwen3.7预览版,涵盖文本和视觉两大核心能力。据悉,Qwen3.7 Max Preview在文本竞技场中位列第13名,而Qwen3.7 Plus Preview则在视觉竞技场中排名第16,显示出阿里在大...

Read More
2026-05-18 talkingdev

开源|Semble:为AI智能体打造的代码搜索神器,Token消耗减少98%

Semble是一款由MinishLab开发的高性能代码搜索库,专为帮助AI智能体通过自然语言快速定位代码片段而设计。它的核心亮点在于大幅降低Token消耗——相比传统的‘grep+read’方法,Semble能减少约98%的Token使用量,同时保...

Read More
2026-05-18 talkingdev

开源| Zerostack:基于Rust的极简编码Agent,兼顾内存与性能极致优化

在AI辅助编程工具日益臃肿的当下,Zerostack以“极简主义”和极致的性能优化脱颖而出。该项目完全采用Rust编写,核心设计目标是在保持极低内存占用的同时,提供强大的编码代理能力。Zerostack不仅支持多种主流AI提供商...

Read More
  1. Prev Page
  2. 10
  3. 11
  4. 12
  5. Next Page