漫话开发者 - UWL.ME 精选全球AI前沿科技和开源产品
2025-04-28 talkingdev

Pippo开源:单张图生成高分辨率多视角3D模型

Meta研究院推出的Pippo项目突破传统三维重建技术限制,开发了一套无需预训练模型的虚拟人体生成系统。该系统仅需输入单张二维人像,即可输出具有高保真细节的多视角3D人体表征,其核心技术可能涉及神经辐射场(NeRF...

Read More
2025-04-27 talkingdev

围观o3模型猜测照片拍摄地:超现实、反乌托邦且令人着迷

OpenAI最新发布的o3模型展示了其通过照片猜测拍摄地点的惊人能力,这一技术突破仿佛将科幻小说中的场景带入了现实。用户只需上传一张照片,o3便能基于图像中的视觉线索(如建筑风格、植被类型、车牌信息等)进行地理...

Read More
2025-04-27 talkingdev

MILS开源-无需训练即可实现视觉与听觉感知

Facebook研究团队近日在GitHub开源了MILS项目代码,其核心突破在于证明大型语言模型(LLMs)无需额外训练即可具备跨模态感知能力。该项目论文《LLMs can see and hear without any training》提出创新方法,通过重构...

Read More
2025-04-25 talkingdev

[论文推荐]GEMCODE:AI驱动的共晶筛选自动化系统加速药物研发

近日,一项名为GEMCODE的新型AI系统在药物研发领域引发关注。该系统通过人工智能技术实现了共晶筛选的自动化流程,有望大幅缩短药物开发周期。共晶技术作为药物固态研发的重要手段,能显著改善活性药物成分的溶解度...

Read More
2025-04-25 talkingdev

[论文推荐]RoWeeder:基于无监督方法的农田杂草识别新框架

近日,一项名为RoWeeder的创新研究提出了一种全新的农田杂草识别框架,该框架采用无监督学习方法,结合作物行检测与抗噪声深度学习模型,显著提升了杂草识别的准确性和效率。研究团队通过训练模型利用作物行信息区分...

Read More
2025-04-25 talkingdev

AI可解释性研究迫在眉睫:模型复杂化时代亟需透明化机制

随着人工智能模型复杂度呈指数级增长,可解释性研究已成为保障AI系统安全可靠的核心议题。斯坦福大学研究员Dario Amodei在最新论述中指出,当前Transformer架构的参数量已突破万亿级别,但决策黑箱问题导致医疗诊断...

Read More
2025-04-24 talkingdev

[论文推荐]ANFM提出基于过滤技术的快速图生成新方法

ANFM研究团队在arXiv最新发表的论文中,提出了一种基于过滤技术(filtration techniques)的革命性图生成方法。该技术通过优化传统图生成模型的拓扑结构处理流程,实现了比扩散模型快100倍的训练速度,同时保持了具...

Read More
2025-04-24 talkingdev

谷歌推出Mobility AI计划:用人工智能重塑城市交通系统

谷歌最新启动的Mobility AI计划,旨在通过人工智能技术彻底革新城市交通体系。该计划整合了三大核心技术模块:AI驱动的多源交通数据实时分析系统、基于深度学习的城市交通流仿真平台,以及具备自适应优化能力的智能...

Read More
  1. Prev Page
  2. 37
  3. 38
  4. 39
  5. Next Page