近日,Artificial Analysis发布了一项针对OpenAI开源大语言模型gpt-oss-120b的性能基准测试报告。该测试聚焦于同一模型在不同托管服务提供商环境中的表现差异,结果显示各平台间的性能存在明显波动。作为当前参数规...
Read MoreBaseten近日推出其Model APIs服务,旨在为开发者提供高性能的开源大语言模型部署解决方案。该服务支持包括Kimi K2、GPT-OSS、DeepSeek、Qwen 3等在内的多款前沿开源模型,承诺提供行业领先的性能表现和极具竞争力的...
Read More近日,一篇题为《Building my offline AI workspace》的技术博客引发开发者社区广泛关注。作者详细记录了构建完全离线AI工作环境的技术实践,涉及本地化模型部署、数据隐私保护及离线开发工具链搭建等前沿议题。该方...
Read More亚马逊正通过实用型生成式AI创新深刻改变人类工作与生活方式。作为拥有25年AI/ML模型部署经验的技术先驱,亚马逊已构建超1,000个生成式AI应用矩阵,覆盖从AWS云服务、Alexa智能语音到物流机器人等全业务场景。其AI人...
Read MoreBlock公司近日在GitHub开源了Goose AI代理项目,这是一个突破性的开源AI开发工具。与传统代码建议工具不同,Goose作为可扩展的AI代理,支持包括本地模型在内的任意大型语言模型(LLM)作为后端,提供桌面和命令行(C...
Read More开发者Henry和Roman近日推出开源项目Cactus,这是一个专为智能手机设计的跨平台框架,支持本地部署大型语言模型(LLM)、视觉语言模型(VLM)和文本转语音(TTS)模型。与Ollama专注于笔记本和边缘服务器不同,Cactu...
Read MorevLLM是一款开源的大语言模型推理引擎,近日其团队发布了全新的V1架构。本文深入剖析了vLLM V1架构如何通过OpenAI兼容API服务器和核心引擎高效处理推理请求,实现业界领先的文本生成性能。该架构优化了推理请求的处理...
Read MoreMeta旗下FAIR研究团队在arXiv最新论文中提出重大架构革新,通过名为Dynamic Tanh(DyT)的逐元素操作替代传统归一化层,使Transformer模型在保持性能的同时摆脱了对归一化层的依赖。这种S型曲线模拟技术能够自然复现...
Read More