漫话开发者 - UWL.ME 精选全球AI前沿科技和开源产品
2026-04-06 talkingdev

开源|Caveman:以“原始人”风格压缩75%令牌,Claude代码技能实现高效LLM通信

近日,GitHub上出现了一个名为Caveman的创新项目,它作为Claude Code技能和Codex插件,旨在通过一种极简的“原始人”沟通风格,显著提升大型语言模型(LLM)代理间的交互效率。该技术的核心在于,它能够智能地剥离对话...

Read More
2026-04-06 talkingdev

开源|Gemma Gem:首个完全在设备端通过WebGPU运行谷歌Gemma 4模型的浏览器扩展

近日,GitHub上出现了一个名为Gemma Gem的开源项目,它是一个Chrome浏览器扩展,能够将谷歌最新发布的Gemma 4大型语言模型完全在用户本地设备上运行。该项目最大的技术亮点在于,它通过新兴的WebGPU API来实现高性能...

Read More
2026-04-06 talkingdev

论文推荐|简单自蒸馏显著提升大模型代码生成能力,无需额外验证器或强化学习

一项名为‘简单自蒸馏’(Simple Self-Distillation, SSD)的新方法为大语言模型的代码生成能力提升开辟了一条高效且成本低廉的路径。该方法的核心在于,仅利用模型自身在特定采样配置(如温度参数和截断策略)下生成...

Read More
2026-04-05 talkingdev

开源|Hindsight:赋予AI智能体“学会记忆”的能力,向量化记忆库开源发布

近日,由vectorize-io团队在GitHub上开源的项目Hindsight引发了人工智能领域,特别是智能体(Agent)开发社区的广泛关注。该项目旨在解决当前AI智能体在长期任务和复杂交互中面临的核心挑战——记忆管理。Hindsight的...

Read More
2026-04-05 talkingdev

开源|从零构建GPU:一款寓教于乐的游戏化学习工具

近日,一款名为“MVIDIA”的互动式游戏在技术社区引发广泛关注。该游戏的核心目标是让玩家通过模拟实践,深入理解图形处理器(GPU)的底层架构设计原理。开发者坦言,其创作初衷源于当前市场上系统化、可交互的GPU架构...

Read More
2026-04-05 talkingdev

开源|LLM Wiki:从卡帕西的“灵感文件”看AI开发者的知识管理新范式

近日,AI领域知名专家、OpenAI联合创始人安德烈·卡帕西(Andrej Karpathy)在社交媒体上分享了一个名为“LLM Wiki”的GitHub Gist项目,并将其描述为一个“灵感文件”(idea file)的范例。该项目迅速在技术社区引发关注...

Read More
2026-04-04 talkingdev

YC孵化器移除Delve项目,引发创投圈对AI基础设施公司标准的热议

全球顶级创业孵化器Y Combinator(YC)近日从其官网的公司列表中移除了AI基础设施初创公司Delve,这一举动在科技创投社区Hacker News上引发了广泛关注与讨论,相关帖子获得了182个支持点和93条评论。尽管YC官方及Del...

Read More
2026-04-03 talkingdev

谷歌DeepMind发布Gemma 4:基于Gemma 3技术构建,支持140种语言的多模态推理

谷歌DeepMind近日正式发布了Gemma 4系列开源模型,标志着其在开放人工智能模型领域迈出了重要一步。该系列模型基于其旗舰Gemma 3技术构建,核心优化方向是“单位参数智能效率”,即在保持模型参数规模相对可控的同时,...

Read More
  1. Prev Page
  2. 9
  3. 10
  4. 11
  5. Next Page