模型的相关内容 - 漫话开发者

2023-09-18 talkingdev

IBM正式挑战语言模型领域，推出开源MoE模型

IBM近日发布了一系列混合专家模型（Mixture-of-Experts，MoE），并公开了它们的架构和部分代码。MoE模型是一种稀疏模型，意味着在不牺牲准确性的情况下，可以节省计算资源。然而，训练这种模型却颇具挑战性。这次IBM...

2023-09-18 talkingdev

Adobe的Firefly生成AI模型现已从测试阶段进入全面开放阶段，可以在Creative Cloud，Adobe Express和Adobe Experience Cloud中进行使用。用户将根据模型交互量通过'生成积分'进行计费。付费的Adobe方案包含各种积分数...

2023-09-15 talkingdev

科技公司Coqui近日公布了其新型文本转语音模型xtts的权重参数。该模型能够克隆语音参数，并能进行多语种的合成。此项技术的出现，无疑是对人工智能领域的一大贡献，预计将在语音合成、语音识别等多个应用领域发挥巨...

2023-09-15 talkingdev

科研人员已经开发出一种新的模型，名为HAMUR，以改进模型在多个主题或领域（如音乐、书籍或电影）中的推荐方式。与旧的方法混淆这些领域之间的信息不同，HAMUR采用了一种特殊的技术，使数据保持独立且更具灵活性。这...

2023-09-15 talkingdev

混合专家模型（MoEs）是一种增加模型容量的有效方法，同时不会增加每个令牌的运行时间。然而，让它们快速运行并进行微调仍然具有一定的难度。最新研究发现，如果你能有效地修改密集模型参数，以配合MoEs的微调，就能...

2023-09-15 talkingdev

对齐技术有助于使语言模型更有用且无害。虽然有时可能会损害性能，但总的来说，这是一项正面的技术。对齐是昂贵的，需要大量的对齐数据。然而，如果您允许模型在生成后评估自身的输出并进行回溯，它可以提高冻结模型...

2023-09-15 talkingdev

MLPerf发布了两个基准测试套件的结果：MLPerf Inference v3.1和MLPerf Storage v0.5。前者显示了创纪录的参与度和性能提升，后者评估了机器学习训练工作负载的存储系统性能。推理基准测试套件引入了一个大型语言模型...

2023-09-15 talkingdev

Patronus AI近日宣布获得由Lightspeed领投的300万美元种子轮融资，该团队计划构建真实世界评分体系，以帮助企业理解LLMs（大型语言模型）的实用性。在当前，大型语言模型在企业中的应用越来越广泛，然而，将其真正落...