训练方式的相关内容 - 漫话开发者

2025-05-07 talkingdev

Cognition发布KEVIN-32B模型：基于强化学习的多轮代码生成技术突破

Cognition公司最新发布的KEVIN-32B模型标志着代码生成领域的重大进展。该模型采用强化学习技术，专门针对多轮代码生成任务进行优化，在CUDA内核开发方面展现出超越现有模型的卓越性能。KEVIN-32B通过优化中间反馈机...

2025-04-21 talkingdev

Gemini作为谷歌推出的多模态AI模型，其视觉能力一直备受业界关注。最新研究发现，Gemini在图像分割这一计算机视觉核心任务上展现出惊人的易用性。图像分割技术可将数字图像分解为多个具有语义意义的区域，是自动驾驶...

2025-04-01 talkingdev

Video-R1项目提出了一种创新的基于规则的强化学习（RL）方法，专门用于视频推理任务。该方法采用了GRPO（Generalized Reinforcement Learning with Policy Optimization）的时间变体，并引入了新的数据集来支持训练...

2025-03-28 talkingdev

近日，一项名为Guidance-Free Training（GFT）的技术突破引发计算机视觉领域关注。该技术通过完全消除对Classifier-Free Guidance（CFG）的依赖，在保持生成质量的同时显著降低计算成本。与传统基于蒸馏的方法不同，...

2024-12-11 talkingdev

大型语言模型（LLM）的最新研究聚焦于在连续潜在空间中进行训练，以增强模型的推理能力。研究者们探索了一种新的方法，即通过将自然语言转化为连续的向量表示，使得LLM能在一个连续的潜在空间中学习和推理，从而提高...

2024-05-09 talkingdev

近日，一家名为Klimb的初创公司推出了一款名为“Klimb AI”的攀岩教练软件，可以根据用户的身体状况和技能水平，为其呈现出可视化的攀岩路线。据悉，该软件使用计算机视觉技术，分析攀岩者的身体姿势和动作，以及攀爬...

2024-04-09 talkingdev

近期，Andrei Karpathy推出了一个名为llm.c的项目，该项目展示了如何使用C和CUDA编程语言来训练大型语言模型（LLM）。这一创新方法避免了对PyTorch等大型深度学习框架的依赖，尤其是其所需的250MB以上的资源。这种训...

2023-10-25 talkingdev

Meta的FAIR团队推出了Habitat 3.0，这是一个增强的AI模拟环境，用于训练机器人在真实场景中导航。