富士通研究院近日开源了名为“OneCompression”(简称OneComp)的Python库,这是一个专门用于大语言模型后训练量化的工具。该库集成了当前最先进的量化算法,包括GPTQ和DBF,旨在帮助开发者和研究人员高效地将庞大的LL...
Read More在人工智能领域,算力已成为决定模型性能与创新速度的核心战略资源。近期,Anthropic凭借其Opus 4.5模型的重大突破,将自身计算容量提升了一倍以上,从而使其总计算能力接近甚至在某些方面(如新模型运行的有效算力...
Read More近日,GitHub上出现了一个名为‘claude-token-efficient’的开源项目,其核心是引入一个名为‘Universal CLAUDE.md’的配置文件方案。该项目宣称,通过简单的‘即插即用’方式,无需对现有代码进行任何修改,即可将Anthrop...
Read More近日,专注于隐私保护技术的公司Ente推出了其首款本地大语言模型(LLM)应用——Ensu。这款应用的初始版本定位为一款类似ChatGPT的对话工具,但其核心创新在于完全离线运行于用户设备之上。这意味着所有数据处理和模型...
Read More随着大语言模型(LLM)应用场景的不断拓展,越来越多的现代工作负载,如大规模内容生成、数据清洗和批量分析等,其核心诉求已从追求单个请求的低延迟,转向了优先保障整体吞吐量。然而,当前许多LLM系统和部署方案仍...
Read MoreAnthropic公司旗下的Claude模型近期迎来重大更新,其4.6版本标志着人工智能助手在功能集成与专业化应用方面迈出了关键一步。该版本最显著的技术突破在于其高达100万token的上下文处理能力,这为处理长文档、复杂代码...
Read More随着前沿大语言模型等AI智能体日益成为重要的信息消费与交互主体,传统为人类设计的网页内容格式已显露出局限性。科技公司Sentry率先将‘为智能体优化内容’视为一个真实的接口问题付诸实践。其核心理念在于,AI智能体...
Read More人工智能公司Anthropic近日宣布了一项重大战略举措,正式启动“Claude合作伙伴网络”(Claude Partner Network),并计划投入高达1亿美元的资金支持。该项目旨在建立一个由合作伙伴组成的生态系统,专门协助各类企业客...
Read More