语言模型的相关内容 - 漫话开发者

2026-04-10 talkingdev

AI数据新贵AfterQuery：A轮融资3000万美元，年化收入破亿美元，专注代码与金融训练数据

近日，由23岁创始人领导的AI数据公司AfterQuery宣布完成3000万美元的A轮融资，投后估值达3亿美元。更引人注目的是，这家专注于为人工智能实验室提供高质量编程代码和金融领域训练数据的初创企业，已实现超过1亿美元...

2026-04-09 talkingdev

近日，GitHub上开源了一个名为Claw-Eval的评估框架，专门用于评估大型语言模型作为智能体的能力。该框架的核心价值在于其构建了一个全面且经过人类验证的基准测试集，涵盖了139项多样化的真实世界任务。与以往许多依...

2026-04-08 talkingdev

近日，一个名为Clicky的开源项目在GitHub上发布，为macOS用户带来了一种新颖的人机交互体验。该项目本质上是一个运行在光标侧的AI“教师”或“伙伴”，能够实时“看到”用户屏幕内容，并通过语音与用户交流，甚至能直接“指...

2026-04-08 talkingdev

近日，GitHub上开源了一个名为TriAttention的项目，其核心是一种创新的KV（键值）缓存压缩技术。该技术旨在解决大语言模型在处理长上下文任务时，因KV缓存占用内存巨大而难以在消费级或内存受限的GPU上高效部署的行...

2026-04-07 talkingdev

开发者matthartman近日在GitHub上开源了名为Ghost Pepper的macOS应用，它是一款完全在本地运行的“长按说话”语音转文字工具。该工具的核心技术栈结合了OpenAI开源的WhisperKit语音识别模型与本地运行的大型语言模型（...

2026-04-06 talkingdev

近日，GitHub上出现了一个名为Caveman的创新项目，它作为Claude Code技能和Codex插件，旨在通过一种极简的“原始人”沟通风格，显著提升大型语言模型（LLM）代理间的交互效率。该技术的核心在于，它能够智能地剥离对话...

2026-04-06 talkingdev

近日，GitHub上出现了一个名为Gemma Gem的开源项目，它是一个Chrome浏览器扩展，能够将谷歌最新发布的Gemma 4大型语言模型完全在用户本地设备上运行。该项目最大的技术亮点在于，它通过新兴的WebGPU API来实现高性能...

2026-04-06 talkingdev

一项名为‘简单自蒸馏’（Simple Self-Distillation, SSD）的新方法为大语言模型的代码生成能力提升开辟了一条高效且成本低廉的路径。该方法的核心在于，仅利用模型自身在特定采样配置（如温度参数和截断策略）下生成...