微调的相关内容 - 漫话开发者

2025-07-14 talkingdev

卡帕西观点：强化学习规模化应用前景广阔，S曲线机遇在大模型

深度学习领域知名专家安德鲁·卡帕西（Andrej Karpathy）近日就强化学习（RL）的规模化应用趋势发表了深刻见解，指出RL的扩展性已成为当前AI研究的焦点。他强调，强化学习在得当的运用下，能够展现出远超监督式微调的...

2025-07-10 talkingdev

视觉AI平台服务商Bria近日在Hugging Face发布新一代开源文本生成图像模型BRIA-3.2，其技术突破引发行业关注。该模型仅用4B参数即实现与Adobe Firefly 4.0和Flux[Dev]相当的图像生成质量，且模型体积缩小至三分之一，...

2025-07-04 talkingdev

谷歌最新推出的Gemma 3N模型现可通过Dynamic GGUFs技术在本地环境中运行，技术社区已实现与llama.cpp、Ollama及Open WebUI生态的无缝集成。本文详解三种部署方案的技术要点：1）利用llama.cpp的量化推理优化实现低资...

2025-07-04 talkingdev

Osmosis-Apply-1.7B是基于Qwen3-1.7B模型通过强化学习微调而成的专用模型，在代码合并任务中表现出色，其奖励分数高达0.9893，甚至超越了OpenAI o3等更大规模的基础模型，同时显著降低了成本。该模型在CommitPackFT...

2025-07-02 talkingdev

Sentence Transformers最新升级引入对稀疏嵌入模型训练的支持，这一技术突破特别适用于混合搜索和重排序场景。该博客详细解析了模型的核心组件与训练步骤，并重点介绍了基于SPLADE架构的现成模型。稀疏编码技术通过...

2025-06-27 talkingdev

知识共享组织（Creative Commons）近日发布CC signals框架，这一创新性技术规范为数据集持有者提供了明确标注内容机器可复用性的标准化方案。该框架通过结构化元数据，允许版权方精确声明其数据在人工智能训练、模型...

2025-06-27 talkingdev

OpenAI近期在其API中新增了两项重要功能：深度研究（Deep Research）和Webhooks。深度研究功能基于经过后期训练的o3和o4-mini模型，这些模型同样为ChatGPT的深度研究提供支持，并支持MCP（多任务控制协议）和代码解...

2025-06-27 talkingdev

视觉AI平台服务商Bria推出新一代开源文本生成图像（T2I）模型，其技术突破引发行业关注。该模型仅用4B参数即实现与Adobe Firefly 4.0和Flux[Dev]相当的生成质量，同时模型体积缩减67%。核心技术亮点包括：集成Contro...