模型的相关内容 - 漫话开发者

2025-04-30 talkingdev

IBM开源Bamba模型：融合Transformer与SSM优势的新型大语言模型

IBM研究院近日推出开源大语言模型Bamba，该模型创新性地结合了Transformer架构的序列建模能力和状态空间模型（SSM）的推理速度优势。作为IBM Granite系列模型的技术前导，Bamba通过注意力机制与状态空间方程的混合设...

2025-04-29 talkingdev

DeepMind最新推出的AlphaFold 3在分子结构预测领域实现重大突破，新增了对DNA、RNA及各类分子结构的预测能力，同时显著提升了复杂分子间相互作用的预测精度。这一突破性工具现通过欧洲分子生物学实验室（EMBL-EBI）...

2025-04-29 talkingdev

Valeo AI最新发布了两项突破性技术：VaViM自回归视频模型和VaVAM驾驶轨迹预测模型。VaViM通过时空令牌序列预测技术，实现了对连续视频帧的高精度建模；而VaVAM则创新性地将学习到的视频表征通过模仿学习转化为可执行...

2025-04-29 talkingdev

来自arXiv的最新研究论文提出ReLearn框架，通过创新的数据增强和微调技术，解决了大语言模型（LLMs）中的关键挑战——'遗忘学习'（Unlearning）。该技术可精准移除模型训练数据中的特定信息，同时保持整体性能，对数据...

2025-04-29 talkingdev

近期发表于arXiv的一篇研究论文提出了一种针对缺失标签的多重填补方法，为机器学习领域中的分类器评估提供了创新解决方案。该方法通过多重填补技术生成预测分布，即使在数据缺失非随机（MNAR）的复杂条件下，仍能保...

2025-04-28 talkingdev

Nari Labs最新发布的Dia-1.6B开源AI模型在情绪语音合成领域取得突破性进展。这款仅1.6B参数的微型模型在测试中展现出超越ElevenLabs和Sesame等行业领导者的表现，尤其擅长模拟极端情绪状态，如歇斯底里的恐怖尖叫。...

2025-04-28 talkingdev

Character.AI近日推出了一款名为AvatarFX的视频生成模型，该技术能够为AI生成的角色赋予动画效果，并支持从现有图像创建视频。尽管这一技术展现了巨大的潜力，但其可能被滥用于制作深度伪造（deepfake）视频的隐患也...

2025-04-28 talkingdev

Harvey AI近日公开了其创新的AI基础设施架构，通过集中式Python库实现AI模型交互的统一管理，确保部署的可靠性与高性能。该架构采用动态负载均衡和实时监控技术，有效应对突发流量，同时支持无缝模型升级。系统还集...