计算机的相关内容 - 漫话开发者

2025-08-13 talkingdev

开源|Jan：本地化运行的AI助手开源项目，支持离线部署

近日，GitHub上出现了一个名为Jan的开源项目，该项目旨在提供一个完全离线运行的ChatGPT替代方案。与依赖云服务的传统AI助手不同，Jan允许用户在本地计算机（支持Windows、macOS和Linux系统）上下载、运行和扩展大型...

2025-08-05 talkingdev

GitHub开源项目ScreenCoder推出了一项突破性技术，通过模块化多智能体架构实现UI设计稿到代码的自动化转换。该系统具备三大核心技术能力：1）基于计算机视觉的界面元素识别；2）动态布局规划算法；3）自适应代码生成...

2025-08-01 talkingdev

本文详细介绍了一种前沿的AI购物助手的开发过程，该助手能够浏览在线服装商店、定位特定服装，并生成虚拟试穿预览，展示服装在用户身上的效果。该技术结合了计算机视觉、自然语言处理和机器学习的最新进展，通过Grad...

2025-07-28 talkingdev

Runway Research最新发布的Aleph视频模型标志着视频生成与编辑技术的重要突破。该模型具备上下文感知能力，可在视频中进行对象操作、视角转换、风格迁移和光照调整等高保真度编辑任务。其核心技术在于实现了对视频内...

2025-07-22 talkingdev

Morphik.ai公司创新性地提出了一种基于视觉的文档检索方法，该方法摒弃了传统的OCR（光学字符识别）和解析技术，转而采用文档页面的图像作为处理对象。通过将文档图像分割成小块，并利用视觉Transformer和语言模型，...

2025-07-18 talkingdev

OpenAI最新推出的ChatGPT Agent标志着人工智能助手能力的重大飞跃。该产品深度融合了Operator的网页浏览功能和Deep Research的分析能力，并配备专属虚拟计算机系统，能够自主完成多步骤复杂任务。从技术架构来看，Ch...

2025-07-10 talkingdev

视觉AI平台服务商Bria近日在Hugging Face发布新一代开源文本生成图像模型BRIA-3.2，其技术突破引发行业关注。该模型仅用4B参数即实现与Adobe Firefly 4.0和Flux[Dev]相当的图像生成质量，且模型体积缩小至三分之一，...

2025-07-10 talkingdev

近日，一项名为“分离轴测试（Separating Axis Test）”的3D碰撞检测算法迎来重大性能突破。开发者cairnc在疫情期间发现该优化方法，通过特定技巧可使检测速度提升5倍，相关技术细节已在其GitHub仓库公开。该算法在Hac...