漫话开发者 - UWL.ME

2023-12-08 talkingdev

StableFast开源，更快的Diffusers推理引擎

Stable Fast是HuggingFace扩散模型的推理引擎，通过它可以进行快速的Diffusers推理。该推理引擎在多种硬件上实现了出色的性能，包括CPU和GPU。此外，Stable Fast还兼容多个框架，包括PyTorch和TensorFlow。在GitHub...

2023-12-08 talkingdev

近日，苹果公司发布了一款针对 Mac 设备加速的 Array 框架，利用统一内存技术，使其变得简单干净，并提供了一些 GPU 支持。这个新框架可以帮助开发者更高效地编写代码，从而提升用户体验。据悉，这个新框架可以在 Gi...

2023-12-08 talkingdev

研究人员开发了Diffusion-SS3D，这是一种改进半监督3D物体检测的新方法，使用扩散模型添加噪声到3D空间中的物体大小和类别标签分布，然后使用扩散模型去噪和生成更好的边界框输出。

2023-12-08 talkingdev

本文使用自然语言描述两个图像集合之间的不同之处。这是一个新颖且具有挑战性的问题。解决方案涉及给每个图像加上标题和重新排序，然后使用语言模型对它们进行总结。

2023-12-08 talkingdev

这个项目介绍了BenchLMM，一个专门设计用于测试GPT-4V和LLaVA等大型多模态模型对各种图像样式的鲁棒性的基准。

2023-12-08 talkingdev

Meta发布了一个名为Imagine的独立图像生成器，其拥有自己的网站，使用生成式人工智能从文本提示中创建图像。该工具使用GAN（生成式对抗网络）技术，可以生成高度逼真的图像，用户只需输入文本提示，就可以生成与之相...

2023-12-08 talkingdev

Google的旗舰机型Gemini是一款原生多模态模型，其文本能力达到了GPT4的水平，同时还能够处理许多其他数据序列。此外，它还训练了Alpha Code 2，这是一个在代码力量比赛中排名前15%的编码器。Alpha Code 2将在12月13...

2023-12-07 talkingdev

Solve Intelligence是一个基于人工智能的平台，可以帮助高效地起草高质量的专利文件。自7月份推出以来，全球25家以上的知识产权公司正在使用他们的平台，客户报告效率提高了60-90%。该公司从Y Combinator毕业，并最...