人机交互的相关内容 - 漫话开发者

2025-11-11 talkingdev

开源|Egocentric-10K：全球最大规模工业操作视频数据集发布

由builddotai团队在Hugging Face平台开源的Egocentric-10K数据集，标志着工业视觉与机器人学习领域取得重大突破。该数据集包含10,000小时以第一人称视角采集的工业操作视频，涵盖192,900个视频片段，真实记录了2,138...

2025-10-31 talkingdev

OpenAI近日公开了其基于ChatGPT的浏览器Atlas的核心技术突破——OWL（OpenAI's Web Layer）架构。这一创新设计将Chromium浏览器进程从主应用进程中分离，构建独立的服务层，实现了技术架构的质的飞跃。通过进程隔离，A...

2025-10-28 talkingdev

人工智能初创公司Decart与语音技术领军企业ElevenLabs合作，推出开源实时唇形同步API技术。该技术通过实时音频流输入，可生成精准同步的虚拟人像视频与语音输出，支持任意语音引擎与自定义角色配置。这项突破性技术...

2025-10-22 talkingdev

OpenAI正式推出创新浏览器产品ChatGPT Atlas，标志着人工智能与网页浏览的深度融合迈出关键一步。该浏览器通过内置ChatGPT侧边栏，实现了对任意网页内容的即时智能交互：用户可一键获取文章摘要、进行多维度数据解析...

2025-10-12 talkingdev

近期在行为心理学与认知科学交叉领域引发热议的一项生活技巧，通过神经机制训练有效解决日常健忘焦虑。该方法要求个体在执行关键动作（如锁门、关闭烤箱）时，刻意启动‘确认时刻’机制：面向目标物体清晰说出状态关键...

2025-10-03 talkingdev

Glide是一款基于Firefox开源代码分支开发的创新型网页浏览器，其核心特性在于采用TypeScript配置文件实现深度定制化，标志着浏览器技术向开发者友好型架构演进的重要突破。该浏览器通过突破传统扩展插件的安全沙盒限...

2025-10-03 talkingdev

在经历高需求测试阶段后，Perplexity公司正式面向全球用户推出Comet浏览器。这款AI原生浏览器通过深度融合人工智能技术，旨在重构用户的在线交互范式。其核心突破在于将大语言模型能力与浏览器底层架构结合，实现智...

2025-09-30 talkingdev

OpenAI与支付巨头Stripe联合推出Agentic Commerce Protocol（代理商务协议），标志着AI驱动商业生态迈出关键一步。该协议通过标准化接口打通ChatGPT与商家的支付系统，实现用户与AI代理协同购物的无缝体验。技术层面...