漫话开发者 - UWL.ME 精选全球AI前沿科技和开源产品
2024-06-06 talkingdev

GenS:从多视图图像中重建3D表面模型开源

GenS是一款端到端的通用神经表面重建模型,能够在没有3D监督的情况下,从多视图图像中出色地重建表面。与传统的表面重建方法相比,GenS在处理复杂的几何形状和纹理细节方面表现尤为突出。这一模型不仅提高了重建的精...

Read More
2024-06-03 talkingdev

AI技术向边缘计算迈进,开辟全新应用领域

随着人工智能(AI)技术的不断进步,AI正在向多模态和边缘计算方向发展。这种转变不仅改变了我们对AI的使用方式,还大大提高了其在实际应用中的有效性。多模态AI是指能够处理多种形式的数据,例如文本、图像和语音,...

Read More
2024-06-03 talkingdev

Mora:挑战Sora的新一代视频生成模型开源

Mora是一款创新的视频生成模型,它利用多个视觉AI代理,旨在挑战OpenAI的领先模型Sora。Mora的独特之处在于其多代理系统,这使得它在视频内容生成的多样性和质量上表现出色。通过集成高级视觉处理技术和机器学习算法...

Read More
2024-05-31 talkingdev

开源4K-Rain13k数据集:解决超高清图像去雨问题

研究人员近日发布了一个名为4K-Rain13k的新数据集,这一数据集中包含了13,000对4K分辨率的图像,旨在解决超高清(UHD)图像中的去雨问题。4K-Rain13k数据集的推出,为图像处理和计算机视觉领域提供了宝贵的资源,使...

Read More
2024-05-31 talkingdev

论文:Yuan 2.0-M32,具备注意力路由的MOE专家混合模型

Yuan 2.0-M32是一款具备40亿参数的专家混合模型,其中任意时刻仅有3.7亿参数处于激活状态。尽管其计算需求仅为Llama 3 70B的1/19,但其性能却接近后者。该模型在2万亿个token上进行了训练,展现出了令人惊讶的强大性...

Read More
2024-05-24 talkingdev

Cohere推出多语言Aya模型

Cohere最新发布的Aya项目包含3种不同规模的模型,能够使用101种语言进行对话,其中许多语言资源极为稀缺。Aya项目的推出对于开放和普及研究社区来说是一个巨大的进步。通过这一项目,研究人员和开发者能够更广泛地获...

Read More
2024-05-24 talkingdev

Llama cpp支持多机器的分布式推理部署

Llama cpp现已支持跨多台机器的分布式推理。这一功能目前仅限于FP16(半精度浮点数),但对于开源部署来说,这无疑是一个巨大的进步。通过分布式推理,开发者可以更高效地利用集群资源,提升模型推理的速度和效率。...

Read More
2024-05-03 talkingdev

StreamMultiDiffusion开源,实时交互式图像创作

近日,一个名为StreamMultiDiffusion的新框架在GitHub上开源,该框架能够实现实时的区域性文本到图像的生成。这是一项突破性的技术,可以将文本信息实时转换为图像,显著提高了图像生成的效率和便利性。无论是在设计...

Read More
  1. Prev Page
  2. 11
  3. 12
  4. 13
  5. Next Page