漫话开发者 - UWL.ME 精选全球AI前沿科技和开源产品
2023-11-09 talkingdev

CogVLM-17B开放式视觉语言模型

CogVLM-17B是一个开放式的视觉语言模型,具有100亿视觉参数和70亿语言参数。该模型在许多标准基准测试中表现出色,并在人类评估中表现良好。CogVLM-17B的性能优于以往的模型,将为计算机视觉和自然语言处理领域的发...

Read More
2023-11-09 talkingdev

OVIR-3D,可实现即时3D搜索技术开源

OVIR-3D是一项创新技术,可以通过2D图像融合实现从文本提示中检索3D对象,无需3D数据训练,从而实现即时实时搜索功能,非常适合机器人应用。该技术的最新成果是在GitHub上发布了代码库,使更多开发者可以在其应用中...

Read More
2023-11-09 talkingdev

DARE方法:无需重新训练增强语言模型

DARE方法可以简化语言模型(如BERT)的增强过程,允许将新功能集成到统一模型中,从而在各种语言任务中提高效率。

Read More
2023-11-09 talkingdev

基于Transformer扩散模型的训练成本比基于UNet的模型便宜90%

PixArt是一种新的文本到图像模型,它使用T5文本编码、交叉注意力和扩散变压器,以比可比模型低得多的计算成本取得了出色的结果。这种新模型使用Transformer扩散模型,可以比使用UNet模型训练快90%。PixArt模型的训练...

Read More
2023-11-09 talkingdev

论文:跨视角训练提升小型语言模型效率

跨视角训练(SCT)可以提高小型语言模型的性能,使其能够生成先前仅可由较大模型实现的句子嵌入,从而优化性能和计算效率。

Read More
2023-11-09 talkingdev

YouTube 推出AI生成功能测试

YouTube正在测试其高级订阅服务中的新生成AI功能。这些功能包括一个对话工具,可用于提问有关内容并获得推荐,另一个工具可用于总结评论主题。

Read More
2023-11-09 talkingdev

Nvidia正在为工程师推出生成式AI进行试点测试

Nvidia在IEEE/ACM计算机辅助设计国际会议上发表主题演讲,介绍了一款名为ChipNeMo的大型语言模型,旨在提高芯片设计师的生产力。尽管尚未完全证明,但ChipNeMo有助于为设计工具编写脚本,总结错误报告,并为设计师提...

Read More
2023-11-09 talkingdev

OpenAI首次开发者大会:AI融入消费科技将成主流

OpenAI首席执行官Sam Altman在该公司的首次开发者大会上展示了公司AI模型的新功能和改进,强调了未来AI融合将在消费科技中发挥核心作用。本次活动突显了OpenAI向产品为中心的转变,新工具立即可用,并暗示了进军硬件...

Read More
  1. Prev Page
  2. 866
  3. 867
  4. 868
  5. Next Page