高效训练的相关内容 - 漫话开发者

2026-03-05 talkingdev

微软发布Phi-4推理视觉模型：15B参数实现多模态推理，懂得“何时思考”以提升效率

微软近日发布了Phi-4-reasoning-vision-15B，这是一款开源的、权重开放的多模态视觉AI模型。该模型仅包含150亿参数，却在数学、科学、文档及用户界面（UI）推理任务上，达到了与参数量大数倍的模型相当甚至更优的性...

2025-10-06 talkingdev

思维机器实验室最新研究揭示了低秩适配技术（LoRA）在大语言模型微调领域的突破性表现。这项发表于权威平台的研究表明，当LoRA应用于模型所有层（尤其是MLP层）且不受数据集规模限制时，其性能可完全媲美传统全参数...

2025-08-24 talkingdev

近日，一项名为《Writing Speed-of-Light Flash Attention for 5090 in CUDA C++》的技术研究引发广泛关注。该研究通过CUDA C++实现了针对5090硬件的光速级Flash Attention算法，显著提升了注意力机制的计算效率。Fl...

2025-07-18 talkingdev

一项名为“Power”注意力的创新技术通过引入超参数p，实现了对状态大小的独立控制，有效解决了长上下文训练中计算成本平衡的难题。该机制在长序列任务中表现优于标准注意力，并支持定制GPU内核，在64k上下文长度下速度...

2025-06-24 talkingdev

强化学习（RL）作为一种让AI模型通过试错而非简单模仿人类示例进行学习的技术，正展现出其在复杂任务处理中的独特优势。最新行业动态显示，科技公司正在采用两种创新方法大幅扩展训练数据规模：一是利用AI模型相互评...

2025-06-11 talkingdev

上海科研团队最新发布的DiTorch和DiComm技术框架，突破了AI训练对同构硬件的依赖。该创新通过统一编程接口整合NVIDIA、AMD等异构芯片架构，在1,024块规格差异显著的芯片集群上训练千亿参数模型时实现116%的超线性效...

2025-05-30 talkingdev

Meta研究团队最新提出的零样本嫁接（zero-shot grafting）方法，通过从大型语言模型（LLM）的浅层中提取小型代理模型来训练视觉编码器，实现了视觉语言模型（VLM）训练成本降低约45%的突破。该技术不仅显著降低了计...

2025-04-01 talkingdev

Video-R1项目提出了一种创新的基于规则的强化学习（RL）方法，专门用于视频推理任务。该方法采用了GRPO（Generalized Reinforcement Learning with Policy Optimization）的时间变体，并引入了新的数据集来支持训练...