漫话开发者 - UWL.ME 精选全球AI前沿科技和开源产品
2024-05-24 talkingdev

论文:全新ProtT3框架提升蛋白质文本理解能力

研究人员推出了ProtT3,这是一个旨在通过结合蛋白质语言模型(PLM)和传统语言模型(LM)来增强蛋白质文本理解能力的新框架。ProtT3框架集成了用于处理氨基酸序列的PLM,并利用一种名为Q-Former的跨模态投影器生成高...

Read More
2024-05-23 talkingdev

Tarsier:提升LLMs与网页交互的开源工具

Reworkd公司近日发布了一款名为Tarsier的新工具,旨在通过使用括号和ID对网页元素进行视觉标记,增强大语言模型(LLMs)的网页交互任务处理能力。Tarsier利用OCR生成的文本表示,使得没有视觉功能的LLM也能理解网页...

Read More
2024-05-21 talkingdev

PSG-4D全景场景图生成,让AI理解时空世界的技术开源

PSG-4D是一种全新的表示法,帮助AI理解空间和时间的四维世界。这种技术的GitHub Repo已经开源。该技术能够生成4D全景场景图,通过这种场景图,AI不仅能够理解物体的三维空间位置,还能理解物体随时间的变化。这是一...

Read More
2024-05-16 talkingdev

Hopfield Boosting技术开源,检测机器学习模型中的分布外数据

Hopfield Boosting是一种技术,该技术利用现代Hopfield能量来增强在机器学习模型中对分布外(OOD)数据的检测。在机器学习中,处理OOD数据一直是一项挑战,因为这些数据往往不符合模型的预期分布。通过Hopfield Boos...

Read More
2024-05-16 talkingdev

SqueezeTime-移动视频理解的新进展

SqueezeTime是一款为移动视频理解设计的轻量级网络,其独特之处在于,它能够将视频的时间轴压缩到频道维度中,从而增强了时间分析的能力。SqueezeTime网络的设计理念是,通过压缩时间轴,可以在不牺牲视频内容质量的...

Read More
2024-05-15 talkingdev

图像去雨技术的新突破——ESDNet神经网络模型

ESDNet是一个专为图像去雨任务设计的脉冲神经网络(SNN)。这个神经网络模型首次将雨像素的独特属性用于增强脉冲信号强度。其设计理念是利用雨滴的像素值的特性,通过特定的神经网络结构和算法,实现对图像中的雨滴...

Read More
2024-05-14 talkingdev

OpenAI声称其最新工具可有效识别DALL-E 3生成的图片

OpenAI最近推出了一款新的检测工具,该工具主要用于识别由其DALL-E 3模型生成的图片。这项技术的推出是为了解决人工智能生成假内容的问题,同时也是OpenAI为增强数字内容真实性而做出的努力。OpenAI在开发此工具时,...

Read More
2024-05-14 talkingdev

MRSegmentator-MRI扫描扩展工具开源

MRSegmentator是一款新型工具,专为增强MRI扫描分割而设计。它可以有效地识别腹部、盆腔和胸部区域的40种不同器官和结构。这款新工具的开发将极大提高医疗和科研人员的工作效率,提高诊断的准确性。MRSegmentator的...

Read More
  1. Prev Page
  2. 45
  3. 46
  4. 47
  5. Next Page