Baseten推出高性能开源大模型API服务,支持Kimi K2、GPT-OSS等前沿模型
talkingdev • 2025-08-15
8505 views
Baseten近日推出其Model APIs服务,旨在为开发者提供高性能的开源大语言模型部署解决方案。该服务支持包括Kimi K2、GPT-OSS、DeepSeek、Qwen 3等在内的多款前沿开源模型,承诺提供行业领先的性能表现和极具竞争力的首token响应时间。Baseten的推理运行时技术能够在任何规模下实现生产级性能,具体优势包括:1)支持在模型发布当天即可部署最先进的开源模型;2)根据OpenRouter的测试数据,各模型性能表现优异,如GPT-OSS可达500+TPS,Kimi K2达75+TPS;3)采用按百万token计费的灵活付费模式,仅需3行代码即可快速上手;4)服务可靠性高达99.99%。这一服务的推出将显著降低企业采用先进AI技术的门槛,加速大模型在生产环境中的应用落地。
核心要点
- Baseten推出支持多款前沿开源大模型的API服务,包括Kimi K2、GPT-OSS等
- 服务提供行业领先的性能表现,如GPT-OSS可达500+TPS,并保证99.99%可靠性
- 采用按token计费模式,仅需3行代码即可快速部署,大幅降低AI技术采用门槛