漫话开发者 - UWL.ME

2024-03-01 talkingdev

GDPO药物设计：基于图扩散策略优化的药物设计

基于图扩散策略优化的药物设计增强了使用独特的强化学习技术的图生成模型，该方法承诺在创建复杂和多样化的图结构方面具有更好的性能，并可能在该领域树立新的标准。

2024-03-01 talkingdev

Distilabel是为AI工程师设计的框架，使用人类反馈的强化学习方法（例如奖励模型和DPO）对大型语言模型进行对齐。它主要专注于LLM微调和适应性。 Distilabel可协助数据收集，清洗和训练。

2024-03-01 talkingdev

Dual Chunk Attention（DCA）扩展了大型语言模型（如Llama2 70B）的能力，使它们能够处理超过100k个令牌而无需额外的训练。它将注意力计算分解成块，增强了模型对短期和长期上下文的理解。

2024-03-01 talkingdev

一篇令人惊叹的论文将视频框架作为人工智能与人类用户交互的一种潜在更好的方法。它展示了视频模型可以用作规划器、代理、计算引擎和环境模拟器。以视频为基础的人工智能可以模拟现实世界，更好地支持人类决策。

2024-03-01 talkingdev

本研究致力于提高基于多模态的GPT-4V等模型在低级视觉感知任务中的表现。大规模实验从58,000名人类受试者中收集了18,973张图像的反馈，并创建了Q-Pathway数据集，以分析其清晰度、色彩和亮度。

2024-03-01 talkingdev

苹果CEO蒂姆·库克在公司年度股东大会上宣布，公司计划在2024年在生成式人工智能领域开创新局面，为用户提供变革性的机会。

2024-03-01 talkingdev

大多数无服务器GPU提供需要每个模型推论一个POST请求。但是，在您想要流模型输出的情况下，这是一个挑战。Websockets使流媒体成为可能。

2024-03-01 talkingdev

据报道，Meta的Llama团队仍在努力对齐，以使该模型放松并回答更多实际上并不具有争议性的查询。