漫话开发者 - UWL.ME 精选全球AI前沿科技和开源产品
2024-03-04 talkingdev

论文:深度语义理解,从粗到细的潜在扩散图像合成方法

粗到细潜在扩散(CFLD)方法引入了一种新的姿势引导人像合成方法,通过对图像进行深度语义理解来避免过拟合,克服了现有模型的局限性。

Read More
2024-03-04 talkingdev

关于LLM量化的全面研究

随着人工智能模型的不断发展,越来越多的研究人员开始研究如何在不影响模型准确性的前提下,提高模型的计算效率和内存利用率。LLM量化是一种后训练量化技术,可以使像OPT和LLaMA2这样的大型语言模型更具内存和计算效...

Read More
2024-03-04 talkingdev

Genie世界模型:可生成交互式环境

Google DeepMind的Genie是一个基础的世界模型,通过在互联网视频上进行训练,可以从合成图像、照片甚至草图中生成各种可玩(动作可控)的环境。该模型使用了深度强化学习和生成式建模技术,可以为游戏开发、虚拟现实...

Read More
2024-03-04 talkingdev

Modular推出MAX开发者版,加速AI部署

Modular推出了一款名为MAX的工具包,可大大简化和加速AI部署。现在可用。MAX提供了一个简单易用的接口,可以在几分钟内为任何深度学习模型构建和部署一个API。它还为开发人员提供了一个可扩展的插件系统,以便更轻松...

Read More
2024-03-01 talkingdev

数据保护官鼓励描述性

最近,数据保护官(DPO)鼓励开发人员在开发过程中更加注重数据的描述性,以提高数据保护的效果。为了实现这一目标,开发人员可以利用 TRL 进行模型调优并生成更加描述性的模型。这样可以让数据更加清晰明了,保护效...

Read More
2024-03-01 talkingdev

StarCoderV2发布,具备16k上下文窗口和4T训练令其性能强劲

Big Code项目发布了旗舰编码模型的另一个版本StarCoder v2。该模型具有16k上下文窗口,经过4T令牌的训练,性能强劲,但仍然低于DeepSeek编码器。StarCoder v2将在程序员社区和人工智能研究领域引起轰动,标志着Big C...

Read More
2024-03-01 talkingdev

GDPO药物设计:基于图扩散策略优化的药物设计

基于图扩散策略优化的药物设计增强了使用独特的强化学习技术的图生成模型,该方法承诺在创建复杂和多样化的图结构方面具有更好的性能,并可能在该领域树立新的标准。

Read More
2024-03-01 talkingdev

Distilabel-框架用于对齐数据收集

Distilabel是为AI工程师设计的框架,使用人类反馈的强化学习方法(例如奖励模型和DPO)对大型语言模型进行对齐。 它主要专注于LLM微调和适应性。 Distilabel可协助数据收集,清洗和训练。

Read More
  1. Prev Page
  2. 301
  3. 302
  4. 303
  5. Next Page