漫话开发者 - UWL.ME 精选全球AI前沿科技和开源产品
2024-03-25 talkingdev

大数据最优传输理论:全面阅读清单开放

最优传输理论是数学和计算领域的一个丰富分支,主要研究概率分布之间的距离。此GitHub仓库提供了一个全面的阅读清单,旨在提高最优传输在速度和准确性上的扩展性。该清单包括了最优传输理论的基础知识、数学原理、算...

Read More
2024-03-22 talkingdev

医疗异常检测新突破:CLIP模型的创新应用

近期,一项新项目在GitHub上发布,该框架通过结合多级残差适配器和视觉-语言对齐损失函数,将CLIP模型重新应用于医疗异常检测。CLIP模型原本是由OpenAI开发的一种多模态预训练模型,能够理解图像和文本之间的关系。...

Read More
2024-03-20 talkingdev

Quiet-Star:提升语言模型输出准确性的推理框架开源

Quiet-Star是一个推理框架,旨在增强语言模型生成正确输出的能力。该框架的代码已经公开,同时发布了一个每个令牌8步的模型。Quiet-Star通过优化模型的推理过程,提高了生成文本的准确性和相关性,对于自然语言处理...

Read More
2024-03-19 talkingdev

GroupContrast:重新定义自监督3D场景理解技术

最近,一个新的GitHub项目GroupContrast引起了技术界的广泛关注。该项目通过将片段分组与语义感知对比学习相结合,重新定义了自监督3D表示学习的概念。这种创新的方法不仅能够提高3D场景理解的准确性,还能够在不依...

Read More
2024-03-19 talkingdev

跨光谱目标识别方法开源

近期,一个创新性的目标识别方法在GitHub上发布,该项目通过聚焦于对象中心信息,以识别在RGB、近红外和热成像等多种光谱下拍摄的图像中的对象。这一方法的核心在于克服背景噪声,从而提高识别的准确度。研究团队通...

Read More
2024-03-19 talkingdev

论文:视觉变换器技术助力水下机器人目标检测能力提升

最新研究项目YOLOX-ViT在水下机器人领域中引入了一种创新的目标检测方法,该方法通过整合视觉变换器(Visual Transformers)和知识蒸馏(Knowledge Distillation)技术,显著提高了目标检测的准确性和效率。该技术的...

Read More
2024-03-18 talkingdev

ScoreHMR推出基于扩散模型的3D人体姿态重建技术

ScoreHMR公司近日推出了一种新颖的3D人体姿态和形状重建方法。该技术利用扩散模型的强大能力,避免了传统优化技术,采用了得分引导方式将人体模型与图像观测数据对齐。这一创新方法不仅提高了重建的准确性,还大大减...

Read More
2024-03-18 talkingdev

OpenAI意外泄露下一代ChatGPT升级版GPT-4.5 Turbo?

近日,OpenAI疑似意外发布了一篇博客文章,该文章被Bing和DuckDuckGo索引后迅速被撤下。文章似乎是关于GPT-4.5 Turbo的公告,这是一个新的模型,其速度、准确性和可扩展性均超越了GPT-4 Turbo。缓存的描述中提到了20...

Read More
2024-03-15 talkingdev

Branch-Train-MiX:将专家LLM混合到Mixture-of-Experts LLM中

这项工作表明,您可以单独训练模型,然后将它们合并成单个Mixture-of-Experts模型。

Read More
2024-03-13 talkingdev

VideoMamba视频方案所有代码和模型开源

VideoMamba是一种解决视频理解复杂性的解决方案,它通过高效地管理本地冗余和全局依赖性来实现。该项目的创建者宣布,他们已经将代码和模型全部发布到GitHub上供公众使用。这个开源项目将提高人工智能在视频理解上的...

Read More
  1. Prev Page
  2. 19
  3. 20
  4. 21
  5. Next Page