漫话开发者 - UWL.ME 精选全球AI前沿科技和开源产品
2025-05-03 talkingdev

开发者耗时两年打造基于3D物理引擎的合成器Anukari,开创GPU音频处理新范式

独立开发者历时两年多打造的Anukari 3D物理合成器近日正式发布,这款创新性音频工具成为首批采用GPU进行实时音频处理的虚拟乐器之一。项目创始人在开发者日志中透露,其物理模拟系统的GUI开发难度远超预期,甚至超过...

Read More
2025-04-29 talkingdev

Hugging Face推出可3D打印的智能机械臂SO-101,售价仅100美元起

人工智能技术公司Hugging Face近日发布了一款名为SO-101的可编程3D打印机械臂,该产品以其亲民的价格和出色的性能引起了科技界的广泛关注。这款机械臂配备了高清摄像头,具有改进的组装结构和电机性能,能够精准抓取...

Read More
2025-04-28 talkingdev

Pippo开源:单张图生成高分辨率多视角3D模型

Meta研究院推出的Pippo项目突破传统三维重建技术限制,开发了一套无需预训练模型的虚拟人体生成系统。该系统仅需输入单张二维人像,即可输出具有高保真细节的多视角3D人体表征,其核心技术可能涉及神经辐射场(NeRF...

Read More
2025-04-22 talkingdev

Magewell推出革命性Eco M.2 HDMI采集卡:PCIe直连超低延迟

专业视频技术厂商Magewell近日发布业界首款采用M.2接口的Eco系列HDMI采集卡,该产品通过PCIe 3.0 x1接口直接与主板连接,实现4K30fps/1080p60fps的视频采集能力,端到端延迟低于0.1帧。相比传统USB采集方案,M.2接口...

Read More
2025-04-20 talkingdev

Raspberry Pi推出高精度Lidar扫描仪,开启低成本3D感知新纪元

近日,Raspberry Pi基金会正式发布基于其单板计算机的Lidar扫描解决方案,该设备通过脉冲激光测距技术可实现毫米级精度的三维环境建模。这款兼容Raspberry Pi 4/5的Lidar模块采用TOF(飞行时间)原理,最大测距达12...

Read More
2025-04-19 talkingdev

跨平台游戏引擎Defold:开发者新选择

Defold作为一款轻量级、高性能的跨平台游戏引擎,正逐渐成为全球开发者的新宠。其支持2D和3D游戏开发,并具备一键发布至多平台的能力,包括iOS、Android、HTML5、Windows、macOS和Linux等。Defold采用Lua脚本语言,...

Read More
2025-04-18 talkingdev

Meta发布多项AI新成果:图像编码器、视觉语言模型及3D物体定位系统

Meta公司近日重磅推出四项人工智能领域的重要技术成果:1)高性能图像编码器,可优化视觉数据的特征提取效率;2)视觉语言模型(VLM),实现跨模态理解与生成;3)基于联合嵌入预测架构(JEPA)的3D物体定位模型,突...

Read More
2025-04-18 talkingdev

[论文推荐]3D CoCa:融合视觉语言对比学习与场景描述的统一3D场景理解框架

谷歌研究院与加州大学团队在arXiv最新发表的论文提出3D CoCa框架,这一突破性技术通过整合视觉语言对比学习(Contrastive Learning)与场景描述(Captioning)两大前沿方向,实现了对三维场景的多模态联合理解。该框...

Read More
  1. Prev Page
  2. 3
  3. 4
  4. 5
  5. Next Page