LLM的相关内容 - 漫话开发者

2025-10-31 talkingdev

Hugging Face发布《Smol训练手册》：揭秘构建顶尖大语言模型的完整实战指南

知名AI社区Hugging Face近日发布了一份名为《Smol训练手册》的深度技术指南，首次系统披露了从零开始训练大语言模型的全流程实战经验。该手册覆盖了模型训练生命周期的关键阶段：从小规模消融实验和基础设施调试，到...

2025-10-29 talkingdev

Butter是一项专注于优化大型语言模型（LLM）应用成本与效率的前沿技术解决方案。它通过智能缓存机制识别并重复调用相同的LLM响应，显著降低AI系统的运营成本，同时增强其输出的确定性。该技术与OpenAI等主流聊天补全...

2025-10-29 talkingdev

近日，GitHub开源项目Dexto引发开发者社区广泛关注。作为专为AI智能体设计的智能层框架，Dexto通过协调大语言模型、工具链与数据源，将自然语言指令转化为可执行动作。其核心价值在于提供配置驱动的开发范式，支持命...

2025-10-29 talkingdev

最新研究揭示，基于大语言模型（LLM）的智能体AI系统存在根本性安全缺陷——模型无法有效区分指令与数据，导致其极易遭受提示注入攻击。攻击者可通过在Jira工单、网页内容等非受信源中嵌入隐藏指令，诱使具有敏感数据...

2025-10-28 talkingdev

近日，GitHub上开源项目TOON（Token-Oriented Object Notation）引发开发者社区广泛关注。这一由开发者johannschopplich推出的新型数据格式，专为大语言模型（LLM）输入优化设计，通过精简的结构化数据表示方式，显...

2025-10-26 talkingdev

开发者RohanAdwankar近日开源了基于Rust语言构建的图表工具OxDraw，创新性地将声明式图表生成与交互式编辑能力融合。该工具解决了技术文档创作中的核心痛点：传统代码驱动图表工具（如Mermaid.js）虽能快速生成基础...

2025-10-24 talkingdev

谷歌Angular团队正式开源Web Codegen Scorer工具，专门用于评估大语言模型生成的网页代码质量。该工具通过构建成功率、安全漏洞检测、编码规范遵循等核心维度，对LLM生成的HTML/CSS/JavaScript代码进行量化评分。开...

2025-10-24 talkingdev

加州大学伯克利分校研究团队开发的进化编码智能体OpenEvolve，成功将大型语言模型转化为自主代码优化器，在混合专家模型负载平衡任务中取得重大突破。该系统通过模拟自然选择机制，使LLM能够自主探索算法空间，最终...