漫话开发者 - UWL.ME 精选全球AI前沿科技和开源产品
2026-04-02 talkingdev

开源|富士通发布OneComp:面向大语言模型的后训练量化开源库

富士通研究院近日开源了名为“OneCompression”(简称OneComp)的Python库,这是一个专门用于大语言模型后训练量化的工具。该库集成了当前最先进的量化算法,包括GPTQ和DBF,旨在帮助开发者和研究人员高效地将庞大的LL...

Read More
2026-04-01 talkingdev

算力军备竞赛:OpenAI与Anthropic的AI基础设施之争

在人工智能领域,算力已成为决定模型性能与创新速度的核心战略资源。近期,Anthropic凭借其Opus 4.5模型的重大突破,将自身计算容量提升了一倍以上,从而使其总计算能力接近甚至在某些方面(如新模型运行的有效算力...

Read More
2026-03-31 talkingdev

开源|Universal Claude.md:无需修改代码,即可将Claude输出Token削减63%

近日,GitHub上出现了一个名为‘claude-token-efficient’的开源项目,其核心是引入一个名为‘Universal CLAUDE.md’的配置文件方案。该项目宣称,通过简单的‘即插即用’方式,无需对现有代码进行任何修改,即可将Anthrop...

Read More
2026-03-26 talkingdev

Ente发布Ensu:一款完全离线、保护隐私的本地大语言模型应用

近日,专注于隐私保护技术的公司Ente推出了其首款本地大语言模型(LLM)应用——Ensu。这款应用的初始版本定位为一款类似ChatGPT的对话工具,但其核心创新在于完全离线运行于用户设备之上。这意味着所有数据处理和模型...

Read More
2026-03-25 talkingdev

性能翻倍!Ray Data LLM实现生产级大模型批量推理吞吐量超越vLLM同步引擎

随着大语言模型(LLM)应用场景的不断拓展,越来越多的现代工作负载,如大规模内容生成、数据清洗和批量分析等,其核心诉求已从追求单个请求的低延迟,转向了优先保障整体吞吐量。然而,当前许多LLM系统和部署方案仍...

Read More
2026-03-25 talkingdev

Claude 4.6全面解析:四大模式、百万级上下文与自动化工作流革新

Anthropic公司旗下的Claude模型近期迎来重大更新,其4.6版本标志着人工智能助手在功能集成与专业化应用方面迈出了关键一步。该版本最显著的技术突破在于其高达100万token的上下文处理能力,这为处理长文档、复杂代码...

Read More
2026-03-16 talkingdev

Sentry实践:为AI智能体优化内容,将Markdown作为新接口标准

随着前沿大语言模型等AI智能体日益成为重要的信息消费与交互主体,传统为人类设计的网页内容格式已显露出局限性。科技公司Sentry率先将‘为智能体优化内容’视为一个真实的接口问题付诸实践。其核心理念在于,AI智能体...

Read More
2026-03-15 talkingdev

Anthropic豪掷1亿美元启动Claude合作伙伴网络,加速企业级AI应用落地

人工智能公司Anthropic近日宣布了一项重大战略举措,正式启动“Claude合作伙伴网络”(Claude Partner Network),并计划投入高达1亿美元的资金支持。该项目旨在建立一个由合作伙伴组成的生态系统,专门协助各类企业客...

Read More
  1. Prev Page
  2. 3
  3. 4
  4. 5
  5. Next Page