漫话开发者 - UWL.ME 精选全球AI前沿科技和开源产品
2023-11-09 talkingdev

CogVLM-17B开放式视觉语言模型

CogVLM-17B是一个开放式的视觉语言模型,具有100亿视觉参数和70亿语言参数。该模型在许多标准基准测试中表现出色,并在人类评估中表现良好。CogVLM-17B的性能优于以往的模型,将为计算机视觉和自然语言处理领域的发...

Read More
2023-11-09 talkingdev

DARE方法:无需重新训练增强语言模型

DARE方法可以简化语言模型(如BERT)的增强过程,允许将新功能集成到统一模型中,从而在各种语言任务中提高效率。

Read More
2023-11-09 talkingdev

基于Transformer扩散模型的训练成本比基于UNet的模型便宜90%

PixArt是一种新的文本到图像模型,它使用T5文本编码、交叉注意力和扩散变压器,以比可比模型低得多的计算成本取得了出色的结果。这种新模型使用Transformer扩散模型,可以比使用UNet模型训练快90%。PixArt模型的训练...

Read More
2023-11-09 talkingdev

论文:跨视角训练提升小型语言模型效率

跨视角训练(SCT)可以提高小型语言模型的性能,使其能够生成先前仅可由较大模型实现的句子嵌入,从而优化性能和计算效率。

Read More
2023-11-09 talkingdev

Nvidia正在为工程师推出生成式AI进行试点测试

Nvidia在IEEE/ACM计算机辅助设计国际会议上发表主题演讲,介绍了一款名为ChipNeMo的大型语言模型,旨在提高芯片设计师的生产力。尽管尚未完全证明,但ChipNeMo有助于为设计工具编写脚本,总结错误报告,并为设计师提...

Read More
2023-11-09 talkingdev

OpenAI首次开发者大会:AI融入消费科技将成主流

OpenAI首席执行官Sam Altman在该公司的首次开发者大会上展示了公司AI模型的新功能和改进,强调了未来AI融合将在消费科技中发挥核心作用。本次活动突显了OpenAI向产品为中心的转变,新工具立即可用,并暗示了进军硬件...

Read More
2023-11-08 talkingdev

OpenAI开源其稳定扩散一致性解码器

OpenAI最近发布了用于稳定扩散的一致性解码器,这将极大地改善潜在扩散模型生成图像的性能。这是一个开源项目,可在GitHub上获得。随着这种技术的进步,我们可以期待AI在图像生成方面的更多突破。

Read More
2023-11-08 talkingdev

利用LLM提高推荐系统精度的新方法

近日,研究人员提出了一种名为CLLM4Rec的全新方法,该方法通过高级预训练和新型语言嵌入,将大型语言模型与基于ID的系统相结合,提高了推荐精度。研究人员表示,CLLM4Rec的核心在于将大型语言模型与基于ID的系统相结...

Read More
  1. Prev Page
  2. 371
  3. 372
  4. 373
  5. Next Page