漫话开发者 - UWL.ME 精选全球AI前沿科技和开源产品
2024-04-12 talkingdev

即时生成3D网格:InstantMesh框架秒级转换图像开源

InstantMesh项目近日亮相,该框架能够从单张图片中瞬间生成3D网格模型,其生成的模型质量与可扩展性均处于行业领先水平。该技术的出现极大地简化了3D建模过程,为游戏开发、虚拟现实、增强现实等领域带来前所未有的...

Read More
2024-04-12 talkingdev

论文:多摄像头3D物体检测技术突破

最新的研究提出了一种从弱到强的引导框架,用于改进多摄像头3D物体检测(MC3D-Det)中的周边精细化处理。该领域借助鸟瞰技术得到了显著增强。该框架通过优化算法,提高了物体检测的精确度和实时性,对于自动驾驶、机...

Read More
2024-04-10 talkingdev

Visual Autoregressive Models:图像生成高分辨率解决方案

Visual Autoregressive Models是一个新的GitHub项目,它将图像生成视为逐步预测更高分辨率的过程。该代码库包含了用于下一分辨率预测工作的推理脚本和演示笔记本。虽然训练代码将很快公开,但目前该项目已经引起了技...

Read More
2024-04-09 talkingdev

用C/CUDA语言训练大型语言模型,无需依赖PyTorch

近期,Andrei Karpathy推出了一个名为llm.c的项目,该项目展示了如何使用C和CUDA编程语言来训练大型语言模型(LLM)。这一创新方法避免了对PyTorch等大型深度学习框架的依赖,尤其是其所需的250MB以上的资源。这种训...

Read More
2024-04-09 talkingdev

论文:Seg-NN框架简化3D物体识别流程

Seg-NN框架通过去除对大量预训练的需求,极大地优化了3D分割的流程。这一创新使得模型能够快速适应新的、未见过的类别,同时避免了通常存在的领域差异问题。这一技术突破不仅加快了3D物体识别的速度,还提高了模型的...

Read More
2024-04-08 talkingdev

AMD 开源 Radeon GPU 固件以促进 AI 框架发展

AMD 宣布将开源其 Radeon GPU 的固件,这一决定意味着技术社区将能够快速改进人工智能框架,同时也可能提高 AMD 产品的市场接受度。开源固件将使得独立开发者和研究人员能够更深入地了解和修改 GPU 底层功能,从而推...

Read More
2024-04-05 talkingdev

InstantStyle:打造个性化图片新体验

InstantStyle是一个全新的图片个性化框架,它通过巧妙地将图片中的风格和内容分离,并专注于特定风格区域,解决了风格一致性的挑战,无需复杂的调整。该框架确保了详尽且一致的视觉风格化效果,并将风格强度与文本控...

Read More
2024-04-02 talkingdev

OpenUI-实现文本编辑到React、Svelte等界面的渲染

Wandb近日发布了一款名为OpenUI的创新工具包,该工具包允许用户通过文本描述来定义用户界面,并能够将其渲染到React、Svelte等多种流行的前端框架中。OpenUI的显著特点在于支持文本编辑,简化了UI设计与开发的流程。...

Read More
2024-04-02 talkingdev

论文:Transformer-Lite,在手机GPU上运行大型语言模型

在移动设备上运行语言模型面临着延迟、带宽和功耗等多方面的挑战。本研究通过采用量化技术、移除键值缓存以及其他优化手段,成功实现了在手机上以每秒30个令牌的速度运行强大的Gemma 2B模型。这一成果比其他框架快约...

Read More
2024-04-01 talkingdev

论文:AI与预测模型结合,打造繁忙交通中的安全变道框架

本文介绍了一种结合人工智能与预测模型的控制框架,旨在实现在密集交通中的平稳和安全变道。该框架通过与周围驾驶员的合作,强调了变道过程中的交互与协调。研究者们通过深入分析交通流动数据,建立了一个能够预测其...

Read More
  1. Prev Page
  2. 13
  3. 14
  4. 15
  5. Next Page