漫话开发者 - UWL.ME 精选全球AI前沿科技和开源产品
2024-01-16 talkingdev

微软计划在部分 Windows 11 设备上自动启动 Copilot AI

微软目前正在 Windows 11 的 Dev Channel 预览版中测试一个更新,该更新会自动在至少拥有 27 英寸屏幕尺寸和 1920 像素宽度的宽屏设备上启动 AI 功能 Copilot。这一试验旨在增强 Windows 中的 AI 集成,是微软更广泛...

Read More
2024-01-16 talkingdev

A16Z:Pande谈AI的过去现在和未来

维杰·潘德(Vijay Pande)是斯坦福大学化学工程和生物物理学教授,也是一位知名的数据科学家。在这次40分钟的播客中,他分享了他对人工智能(AI)过去、现在和未来的看法。他谈到了一些关于AI的历史,以及AI在自然语...

Read More
2024-01-16 talkingdev

从人工狭义智能到通用智能:探讨融合人机的超级智能路径

一位人类认知和人工智能专家探讨了从人工狭义智能到通用智能的演变,提出通过融合人机的方式或许是通向超级智能的潜在路径。在过去的几十年中,人工智能已经取得了长足的进步,但是它的发展仍受到许多限制。人工狭义...

Read More
2024-01-16 talkingdev

Prompt-Aligned:开源图像个性化技术大热

Dreambooth是目前最好的个性化图像模型的方法。Prompt对齐技术显著提高了对Prompt的遵循度,并且具有组合性。

Read More
2024-01-16 talkingdev

AnimateAnyone 开源视频控制模型复现成功

AnimateAnyone 是一款非常优秀的视频控制模型,它接受图像和骨架动作作为输入,然后将人物动画应用到控制图像上。这个开源仓库是对这项工作的复现,它实现了 AnimateAnyone 的主要功能,并在开发者社区中广受好评。

Read More
2024-01-16 talkingdev

AutoNarrate开源:用GPT4-V和TTS自动记录生活

最近,一位技术爱好者开发了一个名为AutoNarrate的GitHub Repo,它使用GPT4-V和最先进的文本转语音技术,加上一些屏幕录制软件,可以让像David Attenborough这样的人自动记录你生活中的所有事情。该技术可用于个人日...

Read More
2024-01-16 talkingdev

Surya开源,多语言OCR工具包提供准确的文本检测

排线检测是在图像或PDF中在文本行周围放置一个边界框的过程。Surya是一个非常强大的多语言排线检测模型,并已在GitHub上开源发布。该模型可以识别多种语言,包括中文、英文、法文、德文和印地文等,并且可以在不同的...

Read More
2024-01-16 talkingdev

Sleeper Agents:如何训练具有持久性的LLMs

Anthropic发布了一项非常有趣的研究,该研究有意将语言模型中的“睡眠短语”进行有害污染。研究发现,它无法将这种模型与用于生产模型的强大系统进行“对齐”。也就是说,一旦模型被污染,就无法使用当前的工具消除不良...

Read More
  1. Prev Page
  2. 791
  3. 792
  4. 793
  5. Next Page