漫话开发者 - UWL.ME 精选全球AI前沿科技和开源产品
2023-12-11 talkingdev

Claude长文本提示

Anthropic最近发布的Claude拥有200k个词汇的上下文。它似乎遭受了语言模型在外部评估中的“迷失在中间”的问题,这意味着它只有27%的标准问题的检索性能。但是,如果在提示中添加句子“助手:这是上下文中最相关的句子...

Read More
2023-12-11 talkingdev

Kandinsky3.0:升级版文本转图像技术,实现更高质量、真实感的图像生成

Kandinsky 3.0是一种文本转图像模型,它可以从文本中生成更加真实的图像。Kandinsky 3.0采用了最新的生成对抗网络(GAN)模型,通过学习图像语义和语法,从而生成更加逼真、高质量的图像。该技术的应用将会在电影、...

Read More
2023-12-11 talkingdev

谷歌推出Cloud TPU v5p和AI超级计算机,助力下一代AI工作负载

谷歌宣布推出Cloud TPU v5p,这是目前谷歌最强大、可扩展和灵活的AI加速器。TPU用于训练和提供AI产品。谷歌还宣布推出AI超级计算机,这是一种超级计算机架构,采用性能优化硬件、开放软件、领先的ML框架和灵活的消费...

Read More
2023-12-08 talkingdev

Meta开源高效分割技术SAM

Segment Anything是一款出色的模型,但运行速度较慢。Efficient Segment Anything是一款新模型,使用多种优化技术,运行速度显著提高。

Read More
2023-12-08 talkingdev

优化LLMs使其可实现真实世界应用

Lightspeed分享了来自Google和TitanML关于通过提示或微调优化LLMs的内幕。 这些技术可以优化自然语言处理模型,从而帮助它们更好地适应真实世界的应用。 在这篇文章中,您将了解到这些优化技术的工作原理以及它们如...

Read More
2023-12-08 talkingdev

StableFast开源,更快的Diffusers推理引擎

Stable Fast是HuggingFace扩散模型的推理引擎,通过它可以进行快速的Diffusers推理。该推理引擎在多种硬件上实现了出色的性能,包括CPU和GPU。此外,Stable Fast还兼容多个框架,包括PyTorch和TensorFlow。在GitHub...

Read More
2023-12-08 talkingdev

论文:使用扩散模型实现3D物体检测

研究人员开发了Diffusion-SS3D,这是一种改进半监督3D物体检测的新方法,使用扩散模型添加噪声到3D空间中的物体大小和类别标签分布,然后使用扩散模型去噪和生成更好的边界框输出。

Read More
2023-12-08 talkingdev

论文:图像集合的差异性描述

本文使用自然语言描述两个图像集合之间的不同之处。这是一个新颖且具有挑战性的问题。解决方案涉及给每个图像加上标题和重新排序,然后使用语言模型对它们进行总结。

Read More
  1. Prev Page
  2. 324
  3. 325
  4. 326
  5. Next Page