模型的相关内容 - 漫话开发者

2023-11-09 talkingdev

CogVLM-17B开放式视觉语言模型

CogVLM-17B是一个开放式的视觉语言模型，具有100亿视觉参数和70亿语言参数。该模型在许多标准基准测试中表现出色，并在人类评估中表现良好。CogVLM-17B的性能优于以往的模型，将为计算机视觉和自然语言处理领域的发...

2023-11-09 talkingdev

DARE方法可以简化语言模型（如BERT）的增强过程，允许将新功能集成到统一模型中，从而在各种语言任务中提高效率。

2023-11-09 talkingdev

PixArt是一种新的文本到图像模型，它使用T5文本编码、交叉注意力和扩散变压器，以比可比模型低得多的计算成本取得了出色的结果。这种新模型使用Transformer扩散模型，可以比使用UNet模型训练快90%。PixArt模型的训练...

2023-11-09 talkingdev

跨视角训练（SCT）可以提高小型语言模型的性能，使其能够生成先前仅可由较大模型实现的句子嵌入，从而优化性能和计算效率。

2023-11-09 talkingdev

Nvidia在IEEE/ACM计算机辅助设计国际会议上发表主题演讲，介绍了一款名为ChipNeMo的大型语言模型，旨在提高芯片设计师的生产力。尽管尚未完全证明，但ChipNeMo有助于为设计工具编写脚本，总结错误报告，并为设计师提...

2023-11-09 talkingdev

OpenAI首席执行官Sam Altman在该公司的首次开发者大会上展示了公司AI模型的新功能和改进，强调了未来AI融合将在消费科技中发挥核心作用。本次活动突显了OpenAI向产品为中心的转变，新工具立即可用，并暗示了进军硬件...

2023-11-08 talkingdev

OpenAI最近发布了用于稳定扩散的一致性解码器，这将极大地改善潜在扩散模型生成图像的性能。这是一个开源项目，可在GitHub上获得。随着这种技术的进步，我们可以期待AI在图像生成方面的更多突破。

2023-11-08 talkingdev

近日，研究人员提出了一种名为CLLM4Rec的全新方法，该方法通过高级预训练和新型语言嵌入，将大型语言模型与基于ID的系统相结合，提高了推荐精度。研究人员表示，CLLM4Rec的核心在于将大型语言模型与基于ID的系统相结...