漫话开发者 - UWL.ME 精选全球AI前沿科技和开源产品
2024-01-24 talkingdev

DepthAnything:通过大规模数据集提高单目深度估计精度

Depth Anything是一种新的单目深度估计方法,它依赖于约6200万张图像的大规模数据集来提高其精度。通过使用数据增强和预训练编码器的辅助监督,该模型实现了令人印象深刻的泛化能力,并在深度估计方面树立了新的标准...

Read More
2024-01-24 talkingdev

苹果汽车自动驾驶规模缩小,计划于2028年推出

据悉,苹果现在将集中精力开发更接近特斯拉汽车的驾驶辅助功能,其自动驾驶系统将具备转向和制动/加速支持,但驾驶员仍将控制汽车,并必须注意道路情况。

Read More
2024-01-23 talkingdev

提升视觉基础模型性能:ViSFT开源

针对图像-文本训练中使用的视觉基础模型,研究人员提出了一种名为ViSFT的新方法,以提高其性能。ViSFT使用类似于语言模型中的微调的两阶段过程来增强视觉基础模型。首先,该模型使用大规模的无监督预训练来学习图像...

Read More
2024-01-23 talkingdev

微软利用AI发现了新的电池材料

微软和太平洋西北国家实验室利用人工智能和大规模云计算发现了一种新的电池材料,这种材料是一种新型的固态电解质。与锂离子电池相比,它可能导致电池更不容易爆炸。虽然还需要测试材料是否是锂离子电池的可行替代品...

Read More
2024-01-21 talkingdev

CPO策略提高翻译语言模型的能力

该项目提出了对比优化策略(CPO),以提高机器翻译中中等规模语言模型的性能。将该方法应用于13B参数ALMA模型,解决了监督微调的局限性,并取得了改进。CPO策略通过对模型的预训练进行增量式微调,有助于提高机器翻译...

Read More
2024-01-20 talkingdev

苹果发布大型图像模型预训练论文

苹果公司发布了一篇关于用自回归损失预训练图像模型的论文。它测量了扩展行为,并发现像语言一样,这些大规模无监督的图像模型具有非常可预测的行为。这项技术为图像识别和计算机视觉领域的研究提供了新的思路和方法...

Read More
2024-01-08 talkingdev

苹果公司将在WWDC上推出一系列基于生成式AI的新工具

据报道,作为iOS 18的一部分,苹果计划在WWDC上宣布一系列基于生成式AI的新工具。这些新工具将包括Siri的改进版本、Xcode的新版本以及Apple Music中用于自动创建播放列表的工具。该技术还将用于解决AppleCare的问题...

Read More
2024-01-03 talkingdev

IBM副总裁达塔和创业公司总监鲁瑟福:AI正在改变游戏规则

人工智能技术正在改变各行各业的企业。IBM软件和技术副总裁Raj Datta和创业公司总监Kylie Rutherford在这篇文章中分享了人工智能如何改变各种产品的使用情况,以及如何为各种规模的公司创造商业机会。达塔和鲁瑟福提...

Read More
2023-12-22 talkingdev

FontDiffuser:开源一键式字体生成技术

阿里巴巴推出了一项名为FontDiffuser的技术,该技术是一种基于扩散的自动字体生成方法,特别擅长处理复杂字符和大规模风格变化。它采用多尺度内容聚合块来更好地保留笔画,并配备了风格对比细化模块来进行风格转移。...

Read More
2023-12-20 talkingdev

论文:图神经网络为节点分类提供更好的解决方案

研究人员开发了一种名为DSF的新方法,以改进谱图神经网络。通过引入节点特定的过滤器权重,DSF可以更好地处理像万维网这样的复杂网络。谱图神经网络(SGNN)是一种基于图的深度学习方法,它在节点分类、图分类和节点...

Read More
  1. Prev Page
  2. 17
  3. 18
  4. 19
  5. Next Page