漫话开发者 - UWL.ME 精选全球AI前沿科技和开源产品
2023-11-20 talkingdev

Meta公布视频编辑和创作模型

往往情况下,当你使用生成模型生成一张图片后,它不完全是你想要的。然而,使用同一模型对图像进行编辑是极具挑战性的。Meta有一个关键的想法,即将所有生成视为指令,从而使编辑功能出现。这与新的模型架构的简单性...

Read More
2023-11-17 talkingdev

视频帧插值技术Distance Indexing进一步提升视频质量

本项目引入一种名为“distance indexing”的新方法,以改进传统的视频帧插值技术(VFI),该技术通常难以准确预测物体的运动。这种方法通过向模型提供有关物体在帧之间移动的距离的明确信息,来明确学习目标并减少模糊...

Read More
2023-11-16 talkingdev

Knowpat-特定领域的AI问答系统开源

近日,有学者在GitHub上发布了一项新的研究项目,名为“知识偏好对齐(KnowPAT)”,该项目旨在利用大型语言模型来改进领域特定问答系统。研究人员借助该技术,可以更加精准地针对特定领域提出问题,从而得到更加准确...

Read More
2023-11-15 talkingdev

LLaMA模型的增强:引入泰米尔语令牌

经过增强的LLaMA模型现已包含16,000个泰米尔语令牌,利用了LoRA方法进行高效训练。这个更新,连同Alpaca和OpenOrca数据集的新的泰米尔语版本,显著改进了泰米尔语文本处理,为印度语言人工智能的未来发展铺平了道路...

Read More
2023-11-13 talkingdev

LM4Visual-基于AI文本模型来进行视觉任务

研究人员发现,尽管大型语言模型是为文本设计的,但它们可以成为处理视觉任务的强大工具。使用文本训练的模型的部分来直接处理图像和视频,研究人员在各种视觉任务中取得了改进的结果。该研究结果表明,基于文本的AI...

Read More
2023-11-10 talkingdev

论文:自动驾驶车辆的地标匹配技术有新突破

自动驾驶汽车的地标匹配是一项重要的技术,其能力直接关系到自动驾驶汽车的定位和导航精度。近日,研究人员提出了一种名为RobustMat的新方法,通过使用空间信息和神经微分方程,改进了自动驾驶汽车在不同条件下匹配...

Read More
2023-11-09 talkingdev

OpenAI首次开发者大会:AI融入消费科技将成主流

OpenAI首席执行官Sam Altman在该公司的首次开发者大会上展示了公司AI模型的新功能和改进,强调了未来AI融合将在消费科技中发挥核心作用。本次活动突显了OpenAI向产品为中心的转变,新工具立即可用,并暗示了进军硬件...

Read More
2023-11-08 talkingdev

OpenAI开源其稳定扩散一致性解码器

OpenAI最近发布了用于稳定扩散的一致性解码器,这将极大地改善潜在扩散模型生成图像的性能。这是一个开源项目,可在GitHub上获得。随着这种技术的进步,我们可以期待AI在图像生成方面的更多突破。

Read More
2023-11-08 talkingdev

OpenAI Dev Day回顾

在本周的OpenAI Dev Day上,OpenAI发布了一款名为GPT-4 Turbo的API,它可以提供128k上下文的自然语言处理,以及自定义GPT和视觉功能。这款API的成本只有GPT-3的一小部分。此外,OpenAI还发布了一款名为Codex的API,...

Read More
2023-11-07 talkingdev

OpenAI Dev Day:开发者新工具、ChatGPT新价格计划、Gizmo V8 iOS应用重磅发布

OpenAI Dev Day 今日召开,据悉我们可以期待 OpenAI 的开发者工具有所改进,ChatGPT 推出新的价格计划,以及 Gizmo V8,ChatGPT iOS 应用的全新升级版。此次更新将进一步提升 OpenAI 的开发者体验,为开发者提供更丰...

Read More
  1. Prev Page
  2. 25
  3. 26
  4. 27
  5. Next Page