漫话开发者 - UWL.ME 精选全球AI前沿科技和开源产品
2024-03-01 talkingdev

Adobe推出生成式AI文档与PDF工具

Adobe Acrobat的新AI助手可以在查询文档时给出答案和来源,创建文档摘要,提供深入了解建议问题列表,协助起草各种沟通需求的内容,并提供大纲和要点,使用户可以快速导航重要的文档信息。

Read More
2024-03-01 talkingdev

CharacterAI推出适用于机器学习编码的形状后缀

Character AI公司的一种编码风格极大地提高了张量中形状的可读性。这种风格使用形状后缀来标识张量中的形状,例如“weights_2x3”表示形状为2x3的权重张量。这种命名约定使得代码更加易读和易于理解,特别是对于机器学...

Read More
2024-03-01 talkingdev

HiGPT:学习异构图谱的新方法

HiGPT 是一种学习跨异构图谱的方法,不需要微调。它与新颖的图谱分词器和大量的图谱指令相结合,使其在适应各种数据分布方面表现出色。

Read More
2024-03-01 talkingdev

论文:PromptMM使用LLM知识蒸馏的在线购物推荐系统

PromptMM是一种使用多模态知识蒸馏的在线购物推荐系统,可以改善像亚马逊和TikTok这样的平台上的推荐系统。它通过从各种内容类型(视觉、文本或声音)中蒸馏出重要特征,来解决用户偏好的不准确性,并简化系统,以防...

Read More
2024-03-01 talkingdev

StarCoderV2发布,具备16k上下文窗口和4T训练令其性能强劲

Big Code项目发布了旗舰编码模型的另一个版本StarCoder v2。该模型具有16k上下文窗口,经过4T令牌的训练,性能强劲,但仍然低于DeepSeek编码器。StarCoder v2将在程序员社区和人工智能研究领域引起轰动,标志着Big C...

Read More
2024-03-01 talkingdev

GDPO药物设计:基于图扩散策略优化的药物设计

基于图扩散策略优化的药物设计增强了使用独特的强化学习技术的图生成模型,该方法承诺在创建复杂和多样化的图结构方面具有更好的性能,并可能在该领域树立新的标准。

Read More
2024-03-01 talkingdev

Distilabel-框架用于对齐数据收集

Distilabel是为AI工程师设计的框架,使用人类反馈的强化学习方法(例如奖励模型和DPO)对大型语言模型进行对齐。 它主要专注于LLM微调和适应性。 Distilabel可协助数据收集,清洗和训练。

Read More
2024-03-01 talkingdev

LLMs使用Dual Chunk Attention处理10万个令牌

Dual Chunk Attention(DCA)扩展了大型语言模型(如Llama2 70B)的能力,使它们能够处理超过100k个令牌而无需额外的训练。它将注意力计算分解成块,增强了模型对短期和长期上下文的理解。

Read More
  1. Prev Page
  2. 714
  3. 715
  4. 716
  5. Next Page