漫话开发者 - UWL.ME 精选全球AI前沿科技和开源产品
2025-11-11 talkingdev

开源|Egocentric-10K:全球最大规模工业操作视频数据集发布

由builddotai团队在Hugging Face平台开源的Egocentric-10K数据集,标志着工业视觉与机器人学习领域取得重大突破。该数据集包含10,000小时以第一人称视角采集的工业操作视频,涵盖192,900个视频片段,真实记录了2,138...

Read More
2025-10-26 talkingdev

儿童心理保护警示:避免用'幸运'定义亲子关系,科技助力家庭隐私安全监测

近日,一则关于儿童心理保护的生活建议在社交平台引发热议。该观点指出,即使父母表面展现完美形象,公开评价孩子'幸运拥有这样的父母'仍存在潜在风险。这一议题与当前科技领域的发展形成交叉:基于人工智能的家庭行...

Read More
2025-10-24 talkingdev

AI After Hours:与顶尖AI开发者共赴本地技术交流盛宴(赞助)

Encord公司近期在美国和英国多地推出专属AI技术交流会“AI After Hours”,为开发者社群搭建高质量的线下交流平台。活动聚焦人工智能领域的前沿动态,通过行业专家的闪电演讲、世界级AI领袖的圆桌讨论,促进技术见解的...

Read More
2025-10-23 talkingdev

Snapchat向全美用户免费开放首个AI提示词镜头,迎战Meta与OpenAI视频生成技术

Snapchat正式向美国所有用户免费开放其人工智能驱动的「Imagine Lens」功能,这标志着该平台首次将开放式提示词AI图像编辑工具从付费订阅模式转向全民普惠。该技术允许用户通过输入自定义文本指令,实时生成或编辑Sn...

Read More
2025-10-12 talkingdev

微软OneDrive测试人脸识别AI功能,用户每年仅能3次选择退出照片扫描

微软近期在OneDrive云存储服务中启动了一项引发争议的AI功能测试:面向部分预览用户推出基于人脸识别的照片智能分析技术。该系统通过人工智能自动识别并分类用户照片中的人物面部信息,但仅允许用户每年行使3次退出...

Read More
2025-09-27 talkingdev

模块化流形:一种结合几何约束的神经网络优化器协同设计新框架

Thinking Machines公司近期发布的研究成果《模块化流形》提出了一种创新的几何框架,用于协同设计带有流形约束的神经网络优化器。该框架通过引入微分几何中的流形概念,将优化问题的约束条件自然地嵌入到神经网络训...

Read More
2025-09-19 talkingdev

Luma AI推出Ray3视频生成器:具备'预思考'能力的新一代模型

人工智能视频生成领域迎来重大突破。Luma AI最新推出的Ray3视频生成模型采用革命性的'推理视频'架构,能够对复杂动作序列进行深度逻辑分析后再生成内容。该模型支持16位HDR高动态范围视频输出,在保持视觉保真度的同...

Read More
2025-09-16 talkingdev

开源|HuMo:文本、图像与音频驱动的统一人体视频生成框架

HuMo是一项突破性的人工智能技术,通过统一的多模态输入框架实现了人体视频生成的跨模态融合。该研究团队创新性地构建了大规模数据集并采用渐进式训练策略,成功解决了音频与视觉动作的时序同步难题。其技术核心在于...

Read More
  1. Prev Page
  2. 3
  3. 4
  4. 5
  5. Next Page