开源语言模型的相关内容 - 漫话开发者

2025-10-02 talkingdev

Thinking Machines实验室推出Tinker API：革新语言模型微调技术

Thinking Machines实验室近日正式发布Tinker API，这一创新平台为开源权重语言模型的精细化调优提供了灵活接口。该技术通过抽象化底层基础设施复杂度，显著降低了开发者部署大型语言模型的技术门槛。特别值得关注的...

2025-07-09 talkingdev

Hugging Face最新推出的SmolLM3是一款完全开源的3B参数语言模型，支持六种语言，具备强大的推理能力和长上下文处理能力。该模型旨在小型模型领域实现高性能，为多语言处理和复杂推理任务提供了新的解决方案。SmolLM3...

2025-07-09 talkingdev

艾伦人工智能研究所（AI2）近日推出OLMo 2全开源语言模型家族，标志着大模型开源生态取得重大突破。该系列包含32B、13B、7B和1B四种参数规模，其中旗舰型号OLMo 2 32B成为首个在主流基准测试中同时超越GPT-3.5 Turbo...

2025-05-02 talkingdev

艾伦人工智能研究所（Allen Institute for AI）近日发布了OLMo-2-1B语言模型，这是一款参数规模为1B的小型开源模型。该项目的突破性意义在于其完全透明的训练范式：研究团队不仅公开了模型权重，还完整披露了训练数...

2025-02-27 talkingdev

微软近日发布了两款全新的开源语言模型Phi-4-mini和Phi-4-multimodal，这两款模型在硬件效率和多模态处理方面表现出色。其中，Phi-4-mini拥有38亿参数，专注于文本任务；而Phi-4-multimodal则具备56亿参数，能够处理...

2024-05-15 talkingdev

Genkit是一款针对Firebase的新型工具集，专门用于构建和部署生成性产品。Genkit可以用来启动开源语言模型的服务器。Firebase是Google的移动平台，它可以帮助开发者快速开发高质量的应用，增加用户基础，并获取更多的...

2024-04-28 talkingdev

苹果公司近日发布了OpenELM，这是一套包含八种开源语言模型（LLM）的系列产品。这些模型可以高效地在单一设备上运行，用于文本生成任务，其参数大小范围从2.7亿到30亿。OpenELM的发布，标志着苹果在人工智能与机器学...

2024-02-09 talkingdev

Abacus AI开发的一款名为“Smaug-72B”的新型开源语言模型，源自阿里巴巴集团的Qwen团队开发的“Qwen-72B”，现在领导Hugging Face的自然语言处理排行榜。在各种基准测试中，Smaug-72B胜过了已经成熟的模型，如GPT-3.5和...