AI模型部署的相关内容 - 漫话开发者

2026-04-06 talkingdev

开源|Gemma Gem：首个完全在设备端通过WebGPU运行谷歌Gemma 4模型的浏览器扩展

近日，GitHub上出现了一个名为Gemma Gem的开源项目，它是一个Chrome浏览器扩展，能够将谷歌最新发布的Gemma 4大型语言模型完全在用户本地设备上运行。该项目最大的技术亮点在于，它通过新兴的WebGPU API来实现高性能...

2026-02-28 talkingdev

据多方信源证实，人工智能领域的领军企业OpenAI已与美国国防部（五角大楼）达成一项重要协议，计划将其先进的人工智能模型部署至美国军方的涉密网络环境中。这一合作标志着生成式AI技术正加速进入国家级安全与国防应...

2026-02-27 talkingdev

人工智能安全领域的领先公司Anthropic近日就其与美国国防部的合作讨论发表公开声明。该公司CEO达里奥·阿莫代伊明确表示，Anthropic坚信AI技术在捍卫美国及其他民主国家安全、对抗专制对手方面具有重要价值，因此已主...

2025-10-20 talkingdev

阿里云最新推出的Aegaeon GPU池化技术系统在AI算力领域实现重大突破，通过创新的资源调度机制将大模型推理所需的英伟达GPU数量从1192片缩减至213片，降幅达82%。该系统目前已在阿里云模型市场完成beta测试，其核心技...

2025-10-13 talkingdev

微软近日在GitHub开源社区正式发布《Edge AI for Beginners》系列课程，该项目专为人工智能初学者设计，系统性地介绍了边缘计算与AI结合的完整技术栈。课程内容涵盖边缘AI基础架构、主流轻量级模型（如MobileNet、Ti...

2025-08-28 talkingdev

Cloudflare近日公开了其内部AI模型部署平台Omni的技术细节，该平台通过轻量级隔离和内存超分配技术，实现在单个GPU上并行运行多个AI模型，显著提升边缘节点的计算资源利用率。Omni平台专为边缘计算环境设计，能够动...

2025-08-22 talkingdev

Sim作为一款新兴的开源平台，专注于AI智能体工作流的构建与部署，其核心突破在于深度整合Ollama框架，支持完全离线的本地AI模型运行。这一特性不仅显著降低了企业使用AI技术的云端依赖和数据传输风险，更通过开源模...

2025-05-13 talkingdev

近日，一篇题为《Build your own Siri. Locally. On-Device. No Cloud.》的技术文章引发广泛关注。文章详细介绍了如何在本地设备上构建类似Siri的语音助手，完全脱离云端服务，从而确保用户隐私安全。这一技术方案利...