漫话开发者 - UWL.ME 精选全球AI前沿科技和开源产品
2026-02-10 talkingdev

开源|Transformers.js v4预览版发布:WebGPU加速,JavaScript生态迎来原生AI推理新纪元

人工智能开源社区Hugging Face近日在NPM上发布了Transformers.js v4的预览版本,标志着在Web端及JavaScript生态系统中部署和运行机器学习模型的能力迈入了新的阶段。Transformers.js的核心价值在于允许开发者直接在...

Read More
2026-02-08 talkingdev

康宁光纤业务因AI数据中心需求与Meta 60亿美元订单而腾飞,英伟达正探索其服务器共封装光学技术

据《华尔街日报》报道,康宁公司一度被建议出售其亏损的光纤业务,如今该部门却成为推动其股价创下历史新高的核心动力。这一转变主要得益于人工智能数据中心对高速数据传输的爆炸性需求,以及Meta公司价值60亿美元的...

Read More
2026-01-30 talkingdev

开源|mactop:专为Mac打造的终端系统监控利器

近日,一款名为mactop的开源工具在GitHub上引发关注,它为搭载Apple Silicon芯片的Mac设备提供了强大的终端级系统监控能力。该工具直接在命令行界面中实时展示关键硬件指标,标志着开发者对苹果自研芯片底层性能洞察...

Read More
2026-01-29 talkingdev

LM Studio 0.4.0发布:支持服务器部署与连续批处理并行请求,大幅提升本地大模型推理效率

近日,备受开发者关注的本地大语言模型运行平台LM Studio发布了其0.4.0版本更新。本次更新带来了多项关键性功能升级,核心聚焦于提升生产环境下的部署能力与推理性能。最引人注目的新特性是支持服务器部署模式,这使...

Read More
2026-01-26 talkingdev

开源|TTT-Discover:推理时强化学习新范式,让大模型实时自适应任务

近日,一个名为TTT-Discover的开源项目在GitHub上发布,其核心创新在于将强化学习(Reinforcement Learning)技术应用于大型语言模型(LLMs)的推理(Inference)阶段,而非传统的训练阶段。这一“测试时训练”(Test-...

Read More
2026-01-19 talkingdev

马斯克xAI创纪录:全球首个吉瓦级AI训练集群Colossus 2正式上线

埃隆·马斯克旗下的人工智能公司xAI宣布,其名为“Colossus 2”的超级计算机集群已正式投入运行。这一系统被确认为全球首个达到吉瓦(1GW)功率规模的专用人工智能训练集群,标志着AI基础设施竞赛进入了一个新的量级门...

Read More
2026-01-09 talkingdev

开源|Sopro TTS:仅1.69亿参数,支持零样本语音克隆的轻量级CPU端模型

近日,GitHub上开源了一个名为Sopro的轻量级文本转语音(TTS)模型,其核心亮点在于仅包含1.69亿参数,却实现了零样本语音克隆能力,并能在普通CPU上流畅运行。该项目由开发者samuel-vitorino发布,迅速在技术社区引...

Read More
2026-01-01 talkingdev

开源|LMCache:为LLM服务注入极速KV缓存层,响应速度提升3-10倍

近日,一个名为LMCache的开源项目在GitHub上发布,旨在通过创新的键值(KV)缓存加速层,显著提升大型语言模型(LLM)的服务性能。该项目专为LLM推理服务设计,其核心在于能够跨GPU、CPU、本地磁盘和Redis等多种存储...

Read More
  1. Prev Page
  2. 2
  3. 3
  4. 4
  5. Next Page