漫话开发者 - UWL.ME 精选全球AI前沿科技和开源产品
2023-12-15 talkingdev

SvelteKit 2发布!支持Vite 5,增加浅层路由功能

SvelteKit是使用Svelte构建应用程序的官方框架。版本2.0增加了对Vite 5的支持和其他小的改进。它还增加了浅层路由功能,允许开发人员将状态与历史记录条目关联而不会导致导航。浅层路由对于创建可以通过向后滑动或弹...

Read More
2023-12-15 talkingdev

Natrue:DeepMindAI在未解问题上超过了人类数学家

FunSearch是一种人工智能系统,可以与特别训练的大型语言模型进行交互,创建生成数学问题解决方案的计算机程序。该系统会检查这些解决方案是否优于已知的解决方案,如果不是,它会向LLM提供反馈,以便下一轮改进。它...

Read More
2023-12-13 talkingdev

FamO2O框架,提高状态自适应平衡的RL算法

研究人员引入了FamO2O框架,旨在通过确定基于状态的最佳平衡来改进和约束当前的离线到在线RL算法的能力。该框架可自适应地根据环境状态调整平衡,以确保算法在不同的环境下都能得到最优的表现。FamO2O框架可以在多种...

Read More
2023-12-12 talkingdev

KTO改进:更好更便宜快速的数据对齐

通常,大多数数据对齐框架需要排名偏好数据(A优先于B)。而这种数据通常很昂贵且罕见。而这种新的框架只需要每个数据点的独立是或否评级即可实现数据对齐,更加便宜、更加高效。

Read More
2023-12-08 talkingdev

论文:使用扩散模型实现3D物体检测

研究人员开发了Diffusion-SS3D,这是一种改进半监督3D物体检测的新方法,使用扩散模型添加噪声到3D空间中的物体大小和类别标签分布,然后使用扩散模型去噪和生成更好的边界框输出。

Read More
2023-12-07 talkingdev

RGB-D视频中显著对象检测得到提升

这个GitHub仓库公布了两个重要贡献:RDVS数据集,包含丰富多样的RGB-D视频场景,以及DCTNet+,一种专门用于RGB-D视频对象检测的网络,配备了创新功能,以精确预测和改进现有模型的性能。

Read More
2023-11-29 talkingdev

CoachLM引入新型AI技术可提高指令质量

针对LLM(语言模型)的指令数据集,CoachLM引入了一种新型AI技术,通过修改而非删除低质量样本独特地改进了数据集,从而显著提高了LLM遵循指令的效果。

Read More
2023-11-20 talkingdev

论文:改进视频问答的新方法

研究人员发现,大型语言模型在视频问答(VideoQA)中有时会出现错误,这是因为它们过于依赖语言而忽略了实际的视频内容。为了解决这个问题,研究人员引入了一种名为Flipped-VQA的新方法,这种方法使得这些模型更好地...

Read More
2023-11-20 talkingdev

Meta公布视频编辑和创作模型

往往情况下,当你使用生成模型生成一张图片后,它不完全是你想要的。然而,使用同一模型对图像进行编辑是极具挑战性的。Meta有一个关键的想法,即将所有生成视为指令,从而使编辑功能出现。这与新的模型架构的简单性...

Read More
2023-11-17 talkingdev

视频帧插值技术Distance Indexing进一步提升视频质量

本项目引入一种名为“distance indexing”的新方法,以改进传统的视频帧插值技术(VFI),该技术通常难以准确预测物体的运动。这种方法通过向模型提供有关物体在帧之间移动的距离的明确信息,来明确学习目标并减少模糊...

Read More
  1. Prev Page
  2. 24
  3. 25
  4. 26
  5. Next Page