漫话开发者 - UWL.ME 精选全球AI前沿科技和开源产品
2024-04-01 talkingdev

VoiceCraft项目发布:700M参数模型实现零样本语音克隆与合成

近期,一项名为VoiceCraft的开源项目在GitHub上引起了广泛关注。该项目通过一个强大的700M参数模型,实现了零样本(Zero shot)的语音克隆和语音合成功能。这意味着用户无需进行任何额外的训练,就能够利用该模型复...

Read More
2024-03-29 talkingdev

MRA开源-高分辨率大型语言视觉助手

研究人员最近开发出一种名为Mixture-of-Resolution Adaptation(MRA)的新技术,该技术能够显著提升人工智能在图像识别中的细节识别能力。MRA方法通过调整AI模型对图像分辨率的适应度,使其更加精准地捕捉图像中的细...

Read More
2024-03-29 talkingdev

3D医学成像数据集与AI框架CT-CLIP开源

CT-RATE是一个将3D医学成像与文本报告相结合的数据集,旨在提供更丰富的医学影像信息。与此同时,CT-CLIP作为一个多功能的人工智能框架,已经针对这些图像进行了优化处理。该框架能够更好地理解和分析医学成像数据,...

Read More
2024-03-29 talkingdev

Valkey:得到AWS、谷歌、甲骨文支持的开源Redis替代品

Valkey是一款高性能的数据结构服务器,主要用于键/值工作负载。它是流行Redis数据存储的开源分支。该项目始于Redis Labs(原Redis代码库背后的公司)将Redis更改为更具限制性的许可。Valkey分支已经汇聚了一批令人印...

Read More
2024-03-27 talkingdev

DETR技术开源,提升目标检测性能

近期,一个名为Salience DETR的项目引起了业界关注。该项目采用了层次化显著性过滤技术,对目标检测中的查询选择进行了优化。通过这种方式,Salience DETR在保持计算效率的同时,也提高了检测的准确性。这一技术的出...

Read More
2024-03-26 talkingdev

PSALM:面向图像分割任务的多模态模型扩展

PSALM是大型多模态模型(LMM)的扩展版本,通过引入一个掩码解码器和多功能输入模式,在各种图像分割任务中表现出色。这种方法不仅克服了仅限于文本输出的限制,而且还使模型能够有效理解和分类复杂图像。PSALM的创...

Read More
2024-03-26 talkingdev

全新Open Interpreter O1 Light:开启AI家居新时代

Open Interpreter O1 Light是一款创新的便携式语音接口设备,能够控制家中的电脑。它不仅能看见屏幕内容,还能使用各类应用程序,并不断学习新技能。作为一款开源基础设备,O1 Light为人工智能设备带来了全新的发展...

Read More
2024-03-26 talkingdev

谷歌、英特尔和ARM联手挑战英伟达AI芯片霸主地位

由英特尔、谷歌、ARM、高通、三星等科技公司组成的统一加速(UXL)基金会,正在开发开源软件,旨在避免AI开发者受限于英伟达的专有技术。这一举措意味着,未来AI开发将有更多的选择,不必完全依赖英伟达的生态系统。...

Read More
2024-03-25 talkingdev

autofix开源:自动修复代码漏洞

代码托管平台GitHub近期推出了一项名为code-scanning autofix的测试功能,该功能结合了GitHub Copilot和CodeQL技术,旨在检测并自动修复JavaScript、TypeScript、Java和Python等编程语言中的安全漏洞。这一创新工具...

Read More
2024-03-22 talkingdev

Meta推出Torchtune库,助力PyTorch语言模型微调

Meta公司近日发布了一个名为Torchtune的原生PyTorch库,专门用于精细调整语言模型。该库旨在为开发者提供更为便捷的工具,以便在PyTorch框架中进行语言模型的微调工作。通过Torchtune,开发者可以更容易地实现模型性...

Read More
  1. Prev Page
  2. 37
  3. 38
  4. 39
  5. Next Page