微调的相关内容 - 漫话开发者

2025-04-18 talkingdev

法国AI初创公司Mistral推出快速构建定制分类器的新产品

法国人工智能初创公司Mistral近日推出了一项创新产品，该产品使用户能够快速构建和部署针对多种任务的定制分类器，如垃圾邮件过滤、内容审核等。这一技术的推出标志着AI模型微调领域的重大进步，特别是在处理特定领...

2025-04-05 talkingdev

近日，一款专注于ML训练的OCR pipeline技术引发业界关注。该工具创新性地支持表格、图表、数学公式等复杂结构的识别，并具备多语言处理能力，为机器学习数据预处理提供了高效解决方案。其核心优势在于通过优化的算法...

2025-04-04 talkingdev

机器学习作为人工智能的核心技术之一，近年来在学术界和工业界均取得了显著进展。本文从理论基础出发，系统性地介绍了机器学习的核心概念、算法分类及实际应用场景。监督学习、无监督学习和强化学习三大范式构成了机...

2025-04-04 talkingdev

MetaLoRA通过引入元学习原理的动态参数生成机制，显著提升了基于LoRA（Low-Rank Adaptation）的微调策略的灵活性和任务感知能力。这一技术突破解决了传统LoRA方法在跨任务适应性上的局限性，通过动态生成低秩矩阵参...

2025-04-03 talkingdev

当前大多数3D合成数据仅追求美学质量，导致其在物理环境中无法实现自立或自我支撑。DSO（Data Synthesis Optimization）项目通过微调生成模型，显著提升了3D对象的物理合理性。该技术采用物理仿真反馈机制，对生成结...

2025-04-02 talkingdev

腾讯ARC实验室最新发布的SEED-Bench-R1基准测试，为多模态大语言模型（MLLM）在复杂视频任务中的表现提供了系统评估框架。该研究重点关注强化学习（RL）和监督微调（SFT）等后训练方法，揭示了RL在视觉感知任务和数...

2025-04-02 talkingdev

Open Hands团队最新发布的32B参数代码模型（Open Hands LM-32B）在强化学习（RL）训练框架下，基于Qwen架构实现了突破性进展。该模型在代理编码任务（agentic coding tasks）中的表现已超越许多参数规模更大的竞品，...

2025-03-31 talkingdev

最新研究揭示了现有防御有害微调攻击（Harmful Fine-Tuning Attacks）方法的脆弱性，并提出了一种名为Panacea的创新解决方案。该方案采用自适应扰动技术，在保持模型微调性能的同时有效维护模型安全性。这一突破性进...