漫话开发者 - UWL.ME 精选全球AI前沿科技和开源产品
2024-02-08 talkingdev

BriaAI开源最先进的背景去除模型

Bria AI公司已经开源了其背景去除模型和工具,包括训练数据混合和性能指标。该模型是相比其他开源模型的重大改进。这个模型可以轻松去除图像背景,使得用户可以更方便地进行后期处理,并且可以应用于诸如视频会议、...

Read More
2024-02-01 talkingdev

MIT生物技术博士生用大肠杆菌制作了Doom游戏屏幕

一位MIT生物技术博士生创造了一个原始的屏幕,能够使用大肠杆菌的模拟显示Doom游戏。在生物发光菌上显示一个Doom帧需要大约70分钟。完全重置需要8小时20分钟。有关该项目的视频在本文中提供。这项技术将有望推动生物...

Read More
2024-01-25 talkingdev

SyncTalk:创造有真实感的人物形象

SyncTalk是逼真的人物形象中的突破。它克服了以往在同步面部身份、唇部运动和表情方面遇到的挑战。SyncTalk使用最新的深度学习技术,通过从少量的样本中学习,以逼真的方式生成高质量的人物形象。 SyncTalk可以应用...

Read More
2024-01-25 talkingdev

探索程序:Prompts是软件工程的子集

Prompt工程只是软件工程的一部分。Prompt是用自然语言编写的小程序。通过巧妙地使用词汇来猜测正确的'函数调用',因为API未指定且在模型之间变化巨大,这是游戏的重要部分。将Prompt视为代码,允许Prompt工程师为喜...

Read More
2024-01-24 talkingdev

2024年,游戏行业的巨大挑战

对于玩家和外界观察者来说,2023年似乎是游戏行业有史以来最伟大的一年之一。有许多顶级游戏发布,硬件发展为游戏体验带来了实质性的改进。然而,这一年对于从业者来说却是残酷的。2023年,游戏行业创下了裁员人数的...

Read More
2024-01-23 talkingdev

AI Toolkit:将状态机和目标导向行动规划引入游戏NPC

AI Toolkit是一个仅包含头文件的C++库,可将有限状态机、行为树、效用AI和目标导向行动规划引入游戏NPC。该库通用且易于扩展,可为游戏开发人员提供更高效、灵活和智能的NPC控制方式。

Read More
2024-01-22 talkingdev

Meta发布音乐和声音生成模型(HuggingFace Hub)

Meta最近推出了一系列令人难以置信的音乐和声音生成模型,并发布了推理代码。这些模型是通过机器学习训练的,可以生成高质量的音乐和声音效果。该公司表示,这些模型可以用于广泛的应用场景,包括游戏声音、虚拟现实...

Read More
2024-01-16 talkingdev

AutoNarrate开源:用GPT4-V和TTS自动记录生活

最近,一位技术爱好者开发了一个名为AutoNarrate的GitHub Repo,它使用GPT4-V和最先进的文本转语音技术,加上一些屏幕录制软件,可以让像David Attenborough这样的人自动记录你生活中的所有事情。该技术可用于个人日...

Read More
  1. Prev Page
  2. 30
  3. 31
  4. 32
  5. Next Page