模型开发的相关内容 - 漫话开发者

2025-03-17 talkingdev

Luma推出多模态模型预训练新方法：Inductive Moment Matching

Luma首席科学家宋嘉明，作为最早为扩散模型开发加速算法的先驱，近日发布了新的多模态预训练方法——Inductive Moment Matching（IMM）。这一新方法不仅超越了传统扩散模型在样本质量上的表现，还实现了10倍以上的效率...

2025-02-28 talkingdev

ModelScope近日发布了Diffusion Studio，这是一个基于GitHub的开源平台和代码库，旨在为多种类型的扩散模型及其相关的自动编码器提供高效的抽象支持。Diffusion Studio通过简化复杂模型的开发流程，帮助研究人员和开...

2025-01-23 talkingdev

SambaNova推出的EvaByte模型在字节级语言建模领域取得了显著进展。尽管其性能仅与两代前的模型（如Llama 2）相当，但对于长期受限于10亿参数以下的字节级模型来说，这无疑是一个重要的突破。EvaByte的成功不仅展示了...

2024-07-05 talkingdev

UIST是一种创新的方法，通过将密集嵌入转换为用户和项目表示的紧凑、离散的令牌，显著地改善了点击率预测。不同于传统的持续嵌入方法，UIST将嵌入空间离散化，使得模型能够捕捉到更加细粒度的特征。此外，这种离散化...

2024-06-06 talkingdev

研究人员发现了一种方法，可以在无需进行矩阵乘法（MatMul）的情况下，依然保持大型语言模型的强大性能，甚至在参数规模达到数十亿时仍然有效。这一突破性技术有望显著提高计算效率，减少资源消耗，并为未来的AI模型...

2024-05-27 talkingdev

评估语言模型一直以来都是一个复杂的任务，尤其是在大多数评估细节都只存在于大型公司内部的情况下。这篇论文展示了一套可重复且强大的评估标准，为研究人员提供了一个实用的框架。论文中包括了对困惑度评估的详细讨...

2024-05-20 talkingdev

谷歌近日发布了一款名为 'Model Explorer' 的模型探索器，该工具可以帮助用户轻松查看并审查自己的模型计算图。这项新的工具对于调试和性能工程来说相当有用。Model Explorer以GitHub Repo形式存在，用户可以方便地...

2024-05-13 talkingdev

亚马逊近日发布了名为Bedrock Studio的网络平台，这是亚马逊Bedrock生成式人工智能环境中的一个重要组成部分。Bedrock Studio的设计目标是帮助开发者在一站式的环境中进行人工智能模型的实验、调优及部署。亚马逊这...