模型的相关内容 - 漫话开发者

2024-01-12 talkingdev

Unsloth轻量化库加速TRL上的模型

Unsloth是一个轻量化库，可加速语言模型的微调。它现在可以轻松地与TRL在常见的模型架构上配合使用。Unsloth库通过一个简单的API使得模型训练和微调更快速。它可以帮助从训练数据中自动学习、优化和微调模型，使得模...

2024-01-11 talkingdev

谷歌的开关Transformer是最早成功的专家混合模型之一。现在，该模型的代码已经在HuggingFace平台上发布，供人们使用。

2024-01-11 talkingdev

该项目介绍了一种一次性编辑人类图像的方法，可以在保留人的身份的同时，对姿势和身形进行重大变化。该技术基于深度学习模型，利用对抗生成网络 (GAN) 和条件生成网络 (CGAN) 的方法，用户只需提供一张人体图像，就...

2024-01-11 talkingdev

研究人员开发了一种新的多学科协作框架，以提高大型语言模型在医学领域的理解和推理能力。这种方法涉及到AI代理，扮演一起分析、讨论和达成共识的医学主题的角色扮演游戏。

2024-01-11 talkingdev

对于视觉转换器(ViTs)的显著进展，研究人员使用一种新的自我涌现令牌标记(STL)框架，提高了完全注意力网络(FAN)模型的鲁棒性。这种方法涉及训练FAN令牌标记器来创建有意义的补丁令牌标记，然后训练FAN学生模型。

2024-01-11 talkingdev

研究人员开发了一种新的文本到3D生成模型的评估指标，解决了当前单一标准指标的局限性。这种先进的方法使用GPT-4V来创建提示并比较3D资产。它与人类偏好密切相关，并通过适应各种用户定义的标准来提供多样性。

2024-01-11 talkingdev

Rabbit推出了一款大型行动模型（LAM），可与其R1口袋伴侣电脑搭配使用。该公司的R1设备是计算机和智能手机的重新构想，几乎完全由其LAM驱动。

2024-01-11 talkingdev

据报道，OpenAI 向新闻出版商提供每年100万至500万美元的报价，以使用他们的内容来训练其AI模型。OpenAI计划通过这种方式将其基于AI的新闻摘要和其他工具提供给新闻出版商。OpenAI已与《纽约时报》、《华尔街日报》...