漫话开发者 - UWL.ME 精选全球AI前沿科技和开源产品
2023-08-02 talkingdev

基于AI的舞蹈生成模型开源:塑造活灵活现的舞蹈影像

你是否曾经希望AI能够创作出真实且灵活的人类舞蹈视频?这正是DisCo模型所做的!它不仅能够保持人物主体和背景的外观,准确地跟随舞蹈姿势,而且还能适应它从未见过的新主体、背景和姿势。DisCo模型利用参考图像,精...

Read More
2023-07-31 talkingdev

论文:自我监督学习助力医疗影像技术提升

研究人员引入了一种名为vox2vec的创新方法,该方法通过自我监督学习,能够在体素(3D像素)级别更好地理解医疗图像,如CT扫描图。研究结果显示,与领域内的其他技术相比,vox2vec表现出色,提供了一种更高效的解决方...

Read More
2023-07-31 talkingdev

文字生成接口:Rust、Python和gRPC服务器的新型应用

HuggingFace公司最近在其文字生成接口(GitHub Repo)中进行了一次重要的许可证变更,该接口现在不再可用于商业用途。此接口是一个建立在Rust、Python和gRPC服务器上的文字生成推断系统,广泛应用于HuggingFace公司...

Read More
2023-07-31 talkingdev

iPhone 15 Pro或将采用钛合金边框,边框更窄,价格上涨

彭博社记者Mark Gurman证实了即将在一个多月内发布的下一代iPhone系列的一些细节。新的Pro型号将采用钛合金边框和更窄的屏幕边框。静音开关将被可定制按钮替代,闪电接口将被USB-C接口取代。Max型号的价格将上涨高达...

Read More
2023-07-28 talkingdev

推出Tidepool:面向AI应用的产品分析工具

AI基于文本的接口为我们与软件交互开辟了一种全新的方式,但是在非结构化文本中寻找洞察力却十分困难。Tidepool就是为解决这一问题而生,它能在用户的文本交互中找出模式,帮助你做出更好的产品决策。AI在许多领域已...

Read More
2023-07-28 talkingdev

JourneyDB - 生成图像基准:发布400万高质量、策划的文本和图像对

近日,已发布超过400万对高质量、经过策划的文本和图像对,用于视觉问题回答。所有这些数据都是由Midjourney合成生成的,因此有人戏称这个数据集为Midjourney蒸馏数据集。这意味着该数据集能够提供丰富的视觉和语言...

Read More
2023-07-28 talkingdev

稳定性AI发布最新文本到图像模型:稳定扩散XL 1.0

稳定性AI近期发布了最新的先进文本到图像模型,稳定扩散XL (SDXL) 1.0,该模型已在亚马逊Bedrock,以及其自有API上提供。新模型提供了改进的颜色准确性和细节,并引入了一个用于专门图像生成的Beta微调功能。SDXL 1....

Read More
2023-07-27 talkingdev

AI文本错误检测新工具:FacTool(GitHub Repo)

近日,新的框架FacTool在GitHub上开源,该框架专门设计用于检测大型语言模型生成的文本中的事实错误,无论任务或领域如何。这是一次重大突破,因为AI生成的文本往往包含事实上的错误或误导,这可能导致信息误解和混...

Read More
  1. Prev Page
  2. 216
  3. 217
  4. 218
  5. Next Page