漫话开发者 - UWL.ME 精选全球AI前沿科技和开源产品
2024-03-27 talkingdev

苹果iOS 18系统或不包含自有AI聊天机器人功能

据最新报道,苹果公司在其即将推出的iOS 18等重大软件更新中,可能不会推出自家的生成式AI聊天机器人。尽管苹果正在与谷歌、OpenAI和百度等公司探讨潜在的生成式AI合作,但目前计划主要是在各种应用程序中增加生成式...

Read More
2024-03-27 talkingdev

论文:SegRefiner模型无关解决方案提升对象分割精度

SegRefiner作为一种创新的模型无关解决方案,通过将细化过程视为数据生成过程,显著提升了各种分割任务中的对象掩膜质量。该技术通过离散扩散过程逐像素细化粗糙掩膜,从而提高分割和边界指标的精确度。这一方法的核...

Read More
2024-03-26 talkingdev

论文:图像合成中的写实阴影生成技术取得新突破

最近的一项研究提出了一种新的图像合成中写实阴影生成的方法,解决了以往在形状和强度准确性方面的挑战。研究人员通过增强ControlNet的强度调节模块以及扩展DESOBA数据集,显著提高了图像中阴影生成的质量。该技术的...

Read More
2024-03-25 talkingdev

DeepGram推出Aura:实现低于250毫秒的低延迟文本转语音API

DeepGram公司近日推出了一项名为Aura的创新产品,这是一款文本转语音(TTS)API,其最引人注目的特性是拥有低于250毫秒的响应延迟时间。这一技术突破意味着用户可以在实时应用中获得更快的语音反馈,极大提升了交互...

Read More
2024-03-25 talkingdev

AI系统“内心独白”能力,推理能力大幅提升

研究人员开发了一种名为“Quiet-STaR”的新技术,通过赋予AI系统“内心独白”,显著提升了其在推理测试中的性能。该技术已经被应用于Mistral 7B语言模型,并且取得了令人瞩目的效果。这一项技术的进步意味着AI系统能够更...

Read More
2024-03-25 talkingdev

论文:开放词汇注意力图谱革新图像分割技术

开放词汇注意力图谱(OVAM)是一种新兴的图像分割技术,它通过对类Stable Diffusion的文本到图像扩散模型进行改进,实现了对任意词汇生成注意力图的功能,打破了之前的限制。这意味着,通过OVAM,开发者和研究人员能...

Read More
2024-03-22 talkingdev

Meta Reality Labs推出场景脚本3D场景重建技术

Meta Reality Labs最新研发的模型能够将视觉输入转换为场景的三维表示。这个拥有7000万个参数的模型能够在设备上快速运行,并且展现出极高的稳定性。这一技术的发展,不仅为虚拟现实和增强现实领域带来了新的突破,...

Read More
2024-03-21 talkingdev

通用一致性轨迹模型(GCTMs)助力提升图像编辑效率

近期,一项名为Generalized Consistency Trajectory Models(GCTMs)的新项目在GitHub上发布,该项目致力于通过引入一致性模型来增强扩散模型在图像编辑和恢复等任务上的能力。GCTMs通过简化处理流程,实现了通过单...

Read More
  1. Prev Page
  2. 47
  3. 48
  4. 49
  5. Next Page