大模型的相关内容 - 漫话开发者

2026-03-31 talkingdev

开源|Universal Claude.md：无需修改代码，即可将Claude输出Token削减63%

近日，GitHub上出现了一个名为‘claude-token-efficient’的开源项目，其核心是引入一个名为‘Universal CLAUDE.md’的配置文件方案。该项目宣称，通过简单的‘即插即用’方式，无需对现有代码进行任何修改，即可将Anthrop...

2026-03-30 talkingdev

近日，开源AI智能体项目AutoBe发布了一项突破性技术成果，其开发的‘函数调用约束框架’将大型语言模型在生成复杂后端API数据类型时的成功率，从原始的6.75%大幅提升至超过99.8%。这一进展标志着AI在自动化软件开发，...

2026-03-25 talkingdev

随着大语言模型（LLM）应用场景的不断拓展，越来越多的现代工作负载，如大规模内容生成、数据清洗和批量分析等，其核心诉求已从追求单个请求的低延迟，转向了优先保障整体吞吐量。然而，当前许多LLM系统和部署方案仍...

2026-03-23 talkingdev

近日，GitHub上出现了一个名为Project N.O.M.A.D.（Node for Offline Media, Archives, and Data）的开源项目，它是一款自包含、优先离线的知识服务器，旨在为用户提供无需互联网连接的工具、教育资源和人工智能能力...

2026-03-23 talkingdev

近日，科技界发生了一起备受关注的模型溯源事件。AI编程助手Cursor发布的新一代代码生成模型Composer 2，被用户发现其底层架构疑似基于中国人工智能公司月之暗面（Moonshot AI）的开源大模型Kimi 2.5。面对社区质疑...

2026-03-22 talkingdev

近日，一个名为Tinybox的离线AI设备项目在技术社区引发了广泛关注。该项目旨在打造一款能够本地离线运行高达1200亿参数大型语言模型的紧凑型硬件设备。这一构想直击当前AI应用的核心痛点：数据隐私、网络依赖和高昂...

2026-03-20 talkingdev

OpenAI的Codex编码代理系统采用了一种名为“代理循环”的核心机制，该机制通过迭代式地构建提示、与底层大模型交互、并执行工具调用（如运行命令或测试）来完成复杂的编程任务。为了应对日益增长的对话历史和多层上下...

2026-03-19 talkingdev

百度近期在GitHub上开源了其企业级视觉语言模型系列——千帆VL（Qianfan-VL）。该系列模型并非通用型多模态模型的简单变体，而是针对工业场景进行了深度优化和增强的专用模型。其核心设计目标是解决企业级应用中的实际...