漫话开发者 - UWL.ME 精选全球AI前沿科技和开源产品
2023-12-08 talkingdev

StableFast开源,更快的Diffusers推理引擎

Stable Fast是HuggingFace扩散模型的推理引擎,通过它可以进行快速的Diffusers推理。该推理引擎在多种硬件上实现了出色的性能,包括CPU和GPU。此外,Stable Fast还兼容多个框架,包括PyTorch和TensorFlow。在GitHub...

Read More
2023-12-08 talkingdev

苹果开源针对 Mac 的新 Array 框架

近日,苹果公司发布了一款针对 Mac 设备加速的 Array 框架,利用统一内存技术,使其变得简单干净,并提供了一些 GPU 支持。这个新框架可以帮助开发者更高效地编写代码,从而提升用户体验。据悉,这个新框架可以在 Gi...

Read More
2023-12-08 talkingdev

论文:使用扩散模型实现3D物体检测

研究人员开发了Diffusion-SS3D,这是一种改进半监督3D物体检测的新方法,使用扩散模型添加噪声到3D空间中的物体大小和类别标签分布,然后使用扩散模型去噪和生成更好的边界框输出。

Read More
2023-12-08 talkingdev

论文:图像集合的差异性描述

本文使用自然语言描述两个图像集合之间的不同之处。这是一个新颖且具有挑战性的问题。解决方案涉及给每个图像加上标题和重新排序,然后使用语言模型对它们进行总结。

Read More
2023-12-08 talkingdev

BenchLLM开源,测试大型多模态模型的基准

这个项目介绍了BenchLMM,一个专门设计用于测试GPT-4V和LLaVA等大型多模态模型对各种图像样式的鲁棒性的基准。

Read More
2023-12-08 talkingdev

Meta推出AI图像生成器Imagine,可作为独立网站使用

Meta发布了一个名为Imagine的独立图像生成器,其拥有自己的网站,使用生成式人工智能从文本提示中创建图像。该工具使用GAN(生成式对抗网络)技术,可以生成高度逼真的图像,用户只需输入文本提示,就可以生成与之相...

Read More
2023-12-08 talkingdev

Google Gemini:原生多模态模型,文本能力达到GPT4水平

Google的旗舰机型Gemini是一款原生多模态模型,其文本能力达到了GPT4的水平,同时还能够处理许多其他数据序列。此外,它还训练了Alpha Code 2,这是一个在代码力量比赛中排名前15%的编码器。Alpha Code 2将在12月13...

Read More
2023-12-07 talkingdev

Solve Intelligence帮助律师起草专利文件以进行知识产权分析和生成

Solve Intelligence是一个基于人工智能的平台,可以帮助高效地起草高质量的专利文件。自7月份推出以来,全球25家以上的知识产权公司正在使用他们的平台,客户报告效率提高了60-90%。该公司从Y Combinator毕业,并最...

Read More
  1. Prev Page
  2. 821
  3. 822
  4. 823
  5. Next Page