大语言模型的相关内容 - 漫话开发者

2026-04-21 talkingdev

月之暗面发布Kimi K2.6系列模型，宣称多项基准超越GPT-5.4与Claude Opus

中国人工智能公司月之暗面（Moonshot AI）近日正式推出其新一代大模型系列Kimi K2.6，并已在Kimi Chat对话平台及API接口上线。该系列模型的核心突破在于强化了长上下文编程能力与智能体（Agent）执行支持，旨在为开...

2026-04-20 talkingdev

在人工智能领域，系统提示词（System Prompt）是塑造大型语言模型行为与输出的核心指令，通常被各大AI实验室视为高度机密。然而，Anthropic公司却独树一帜，成为唯一一家持续公开其面向用户的聊天系统（如Claude）完...

2026-04-13 talkingdev

人工智能公司Anthropic近日宣布，将不会在短期内向公众发布其最新、能力最强的模型Claude Mythos。公司声明，其决定源于对网络安全的审慎考量，认为该模型目前所展现出的网络能力过于强大，若广泛可用可能带来潜在风...

2026-04-08 talkingdev

近日，一个名为Clicky的开源项目在GitHub上发布，为macOS用户带来了一种新颖的人机交互体验。该项目本质上是一个运行在光标侧的AI“教师”或“伙伴”，能够实时“看到”用户屏幕内容，并通过语音与用户交流，甚至能直接“指...

2026-04-08 talkingdev

近日，GitHub上开源了一个名为TriAttention的项目，其核心是一种创新的KV（键值）缓存压缩技术。该技术旨在解决大语言模型在处理长上下文任务时，因KV缓存占用内存巨大而难以在消费级或内存受限的GPU上高效部署的行...

2026-04-06 talkingdev

一项名为‘简单自蒸馏’（Simple Self-Distillation, SSD）的新方法为大语言模型的代码生成能力提升开辟了一条高效且成本低廉的路径。该方法的核心在于，仅利用模型自身在特定采样配置（如温度参数和截断策略）下生成...

2026-04-06 talkingdev

近日，一项名为“LLM Wiki”的创新框架在开发者社区引发关注。该框架的核心是一个可被复制并粘贴到大语言模型（LLM）智能体中的“想法文件”，旨在为利用LLM构建和维护知识库提供一套系统化模式。在这一协作框架下，人类...

2026-04-05 talkingdev

近日，AI领域知名专家、OpenAI联合创始人安德烈·卡帕西（Andrej Karpathy）在社交媒体上分享了一个名为“LLM Wiki”的GitHub Gist项目，并将其描述为一个“灵感文件”（idea file）的范例。该项目迅速在技术社区引发关注...