近日,GitHub上开源项目oLLM引发开发者社区广泛关注。该项目是一个专为大上下文语言模型推理设计的轻量级Python库,其核心突破在于仅需8GB显存的消费级GPU即可运行Llama-3.1-8B-Instruct等模型处理长达10万token的上...
Read MoreCloudflare近日公开了其内部AI模型部署平台Omni的技术细节,该平台通过轻量级隔离和内存超分配技术,实现在单个GPU上并行运行多个AI模型,显著提升边缘节点的计算资源利用率。Omni平台专为边缘计算环境设计,能够动...
Read More近日,一款名为Porffor的新型JavaScript引擎在云计算领域引发关注。该引擎采用前瞻性编译技术,可将JS代码预先编译为WebAssembly及原生二进制文件,生成比Node.js等传统运行时更小、更快的可执行文件。在AWS Lambda...
Read MoreSim作为一款新兴的开源平台,专注于AI智能体工作流的构建与部署,其核心突破在于深度整合Ollama框架,支持完全离线的本地AI模型运行。这一特性不仅显著降低了企业使用AI技术的云端依赖和数据传输风险,更通过开源模...
Read MoreEpicenter 是一个颇具前瞻性的开源项目生态系统,专注于推动“本地优先”(Local-First)应用范式与用户数据所有权理念的实践。该项目通过采用纯文本和SQLite文件作为数据存储基础,使用户能够完全掌控个人数据,并实...
Read MoreLemonade是一个专为现代计算硬件优化的开源推理服务器,致力于帮助开发者和研究者在本地高效运行大型语言模型。该项目通过集成最先进的推理引擎,可自动适配不同厂商的NPU(神经网络处理器)和GPU硬件平台,实现计算...
Read MoreJavaScript引擎Porffor近期实现在AWS Lambda上的突破性应用,通过预编译技术彻底消除函数计算的冷启动延迟。该引擎将JavaScript代码提前编译为WebAssembly及原生二进制文件,生成体积不足1MB的高效可执行文件,实现...
Read More开发者Wyatt Joh近日在JSR平台发布了两个开源工具包@wyattjoh/imessage和@wyattjoh/imessage-mcp,这些工具允许大型语言模型(LLM)如Claude在macOS系统上以只读方式访问用户的iMessage数据库。这一创新技术使用户能...
Read More