大型语言模型的相关内容 - 漫话开发者

2025-12-22 talkingdev

开源|Claude技能库新突破：告别“AI美学”生成专业级前端界面

近日，GitHub Gist上出现了一项名为“Claude's frontend design skill”的AI技能，标志着生成式AI在专业前端开发领域的应用迈出了重要一步。该技能的核心目标在于解决当前AI生成界面普遍存在的“通用化美学”问题，即缺...

2025-12-21 talkingdev

人工智能模型评估机构METR发布的最新数据显示，Anthropic公司推出的Claude Opus 4.5大型语言模型在任务处理时效性上取得了显著突破。根据METR的评估框架，Claude Opus 4.5的“50%任务完成时间视界”约为4小时49分钟，...

2025-12-20 talkingdev

在AI驱动编程工具竞争日益激烈的背景下，一项重要的行业整合事件引发了开发者社区的广泛关注。专注于代码审查与协作的初创公司Graphite近日正式宣布，将加入由知名AI代码助手Cursor构建的生态系统。Cursor凭借其深度...

2025-12-19 talkingdev

一个名为“History LLMs”的开源项目在技术社区引发了广泛关注。该项目旨在训练迄今为止规模最大的、专门基于1913年之前历史文本的大型语言模型。其核心构想是通过构建一个纯净的“前现代”语料库——即排除所有1913年之后...

2025-12-09 talkingdev

OpenAI的研究团队近期在模型可解释性领域取得重要进展，通过结合稀疏自编码器与创新的潜在归因方法，系统性地定位和解决大型语言模型中的行为错位问题。该研究提出的归因方法能够有效识别稀疏自编码器潜在空间中导致...

2025-12-07 talkingdev

近日，Oxide Computer公司在其官方技术文档平台RFD（Request for Discussion）上发布了一篇题为《在Oxide使用LLMs》的深度技术文章，引发了技术社区的广泛关注。该文章详细阐述了Oxide作为一家专注于构建现代、一体...

2025-12-01 talkingdev

在AI辅助编程日益普及的今天，如何高效地将大型语言模型（如Claude）集成到软件开发流程中，已成为提升工程师生产力的关键。`CLAUDE.md`文件正是这一趋势下的重要配置工具，它充当了AI代理（Agent）进入代码库的“入...

2025-12-01 talkingdev

在大型语言模型推理优化领域，Prompt缓存技术正成为提升服务效率、降低计算成本的关键前沿技术。本文深入解析了Prompt缓存的核心工作原理，特别聚焦于vLLM框架中创新的Paged Attention机制及其实现的自动前缀缓存。...