AI部署的相关内容 - 漫话开发者

2026-06-05 talkingdev

开源|Ollama Model Tester：一键对比本地大模型性能的CLI工具

随着本地大语言模型（LLM）的普及，Ollama作为一款简洁的本地模型运行工具，受到开发者和研究者的广泛关注。然而，面对众多不同参数规模、训练策略的Ollama模型，如何快速、客观地选出最适合特定任务的模型，成为实...

2026-05-23 talkingdev

微软最新发布的一份内部报告揭示了人工智能应用中的一个严峻现实：大规模部署AI的成本远高于雇佣人类员工来完成同样的工作。这份来自《财富》杂志的报道指出，尽管各大企业正竞相激励员工使用AI技术，但随着使用量的...

2026-05-13 talkingdev

大型语言模型的部署成本一直是其广泛应用的主要障碍之一。一篇来自AlphaXiv的最新研究提出了一种创新解决方案：通过强化学习微调递归语言模型（RLMs）。该方法的核心在于训练一个共享的策略，同时驱动父模型和子模型...

2026-04-06 talkingdev

近日，GitHub上出现了一个名为Gemma Gem的开源项目，它是一个Chrome浏览器扩展，能够将谷歌最新发布的Gemma 4大型语言模型完全在用户本地设备上运行。该项目最大的技术亮点在于，它通过新兴的WebGPU API来实现高性能...

2026-03-27 talkingdev

近日，一位开发者展示了一项颇具创意的低成本AI部署方案。该项目将两个AI智能体分别部署在独立的服务器上，构建了一个分层、高效的交互系统。公开智能体“nullclaw”是一个仅678KB的Zig语言二进制程序，运行内存约1MB...

2026-03-17 talkingdev

在GTC 2026技术大会的预告中，NVIDIA勾勒了一幅宏大的AI技术发展蓝图，宣布将全面扩展其人工智能技术栈。该计划的核心在于构建一个跨越多个关键领域的综合性AI生态系统。具体而言，NVIDIA将深化与各方的合作，共同推...

2026-03-06 talkingdev

OpenAI近日发布了一份具有战略指导意义的框架，系统性地阐述了企业如何利用人工智能技术创造价值并驱动业务重塑，而非仅仅停留在零散的试点项目上。该框架的核心在于提出了五种AI价值创造模型，为企业领导者规划了一...

2026-02-23 talkingdev

近日，在GitHub上开源名为“ntransformer”的高效大语言模型推理引擎项目，其核心创新在于探索并实现了通过NVMe存储设备直接与GPU通信，绕过CPU和系统内存的传统数据路径，从而在消费级显卡RTX 3090上成功运行了参数量...