计算机视觉的相关内容 - 漫话开发者

2025-05-07 talkingdev

Pinterest推出全新视觉搜索工具，率先在女性时尚领域应用

Pinterest近期升级了其基于图像的搜索功能，推出了一系列新工具，旨在帮助用户更精准地筛选搜索结果并探索不同风格。这一创新功能首先在部分地区的女性时尚类别中推出，标志着视觉搜索技术在电子商务和社交媒体领域...

2025-05-05 talkingdev

谷歌近日发布了开源AI模型SpeciesNet，该模型专为通过相机陷阱图像识别动物物种而设计。SpeciesNet此前已应用于Wildlife Insights平台，其开源将显著提升全球生物多样性监测的规模与效率。这一技术突破结合了计算机...

2025-05-05 talkingdev

近日，一项名为'Attention Distillation for Diffusion-Based Image Stylization'的技术在图像生成领域取得重要进展。该技术通过利用预训练扩散模型中的自注意力特征，创新性地引入了注意力蒸馏损失函数，有效优化了...

2025-05-02 talkingdev

微软近日发布了其广受欢迎的截图解析工具OmniParser的重大版本更新——OmniParser v2.0。作为一款领先的视觉信息处理工具，新版本在Screenshot Pro基准测试中表现优异，展现了微软在计算机视觉和自然语言处理领域的技...

2025-05-02 talkingdev

谷歌研究团队近日宣布其医疗对话AI系统AMIE（Articulate Medical Intelligence Explorer）取得重大升级，新增医学影像分析功能。这一突破性进展使AMIE在基于聊天的诊断过程中能够同步解读X光片、CT扫描等医学影像，...

2025-05-01 talkingdev

最新研究表明，人工智能模型已能通过图像中的微小细节实现高精度地理位置识别。这一突破性技术展示了AI在视觉模式识别领域的卓越能力，例如仅凭植被类型、建筑风格或路面纹理等细微特征即可推断拍摄地点，准确率远超...

2025-05-01 talkingdev

卡文迪什实验室开发的SALT（Semi-Automatic Labeling Tool）为LiDAR点云处理领域带来突破性解决方案。该工具通过创新的零样本适应技术，能够在不进行额外训练的情况下，直接适配不同厂商的激光雷达传感器（如Velodyn...

2025-04-30 talkingdev

苏黎世联邦理工学院（ETH）研究人员在GitHub开源了名为'Alias free super resolution'的创新项目，该项目通过算法突破解决了超分辨率技术中长期存在的重建伪影问题。传统超分辨率方法在放大图像时往往会产生锯齿、振...