漫话开发者 - UWL.ME 精选全球AI前沿科技和开源产品
2025-08-13 talkingdev

开源|Jan:本地化运行的AI助手开源项目,支持离线部署

近日,GitHub上出现了一个名为Jan的开源项目,该项目旨在提供一个完全离线运行的ChatGPT替代方案。与依赖云服务的传统AI助手不同,Jan允许用户在本地计算机(支持Windows、macOS和Linux系统)上下载、运行和扩展大型...

Read More
2025-08-05 talkingdev

开源|ScreenCoder:将UI截图秒变网页代码的模块化多智能体系统

GitHub开源项目ScreenCoder推出了一项突破性技术,通过模块化多智能体架构实现UI设计稿到代码的自动化转换。该系统具备三大核心技术能力:1)基于计算机视觉的界面元素识别;2)动态布局规划算法;3)自适应代码生成...

Read More
2025-08-01 talkingdev

Python实现MCP服务器:基于Gradio的AI购物助手开发指南

本文详细介绍了一种前沿的AI购物助手的开发过程,该助手能够浏览在线服装商店、定位特定服装,并生成虚拟试穿预览,展示服装在用户身上的效果。该技术结合了计算机视觉、自然语言处理和机器学习的最新进展,通过Grad...

Read More
2025-07-28 talkingdev

Runway推出Aleph视频模型:支持高保真视频编辑与生成

Runway Research最新发布的Aleph视频模型标志着视频生成与编辑技术的重要突破。该模型具备上下文感知能力,可在视频中进行对象操作、视角转换、风格迁移和光照调整等高保真度编辑任务。其核心技术在于实现了对视频内...

Read More
2025-07-22 talkingdev

Morphik.ai提出视觉文档检索新方法:用图像替代传统OCR解析

Morphik.ai公司创新性地提出了一种基于视觉的文档检索方法,该方法摒弃了传统的OCR(光学字符识别)和解析技术,转而采用文档页面的图像作为处理对象。通过将文档图像分割成小块,并利用视觉Transformer和语言模型,...

Read More
2025-07-18 talkingdev

ChatGPT Agent正式发布:连接研究与行动的全新智能助手

OpenAI最新推出的ChatGPT Agent标志着人工智能助手能力的重大飞跃。该产品深度融合了Operator的网页浏览功能和Deep Research的分析能力,并配备专属虚拟计算机系统,能够自主完成多步骤复杂任务。从技术架构来看,Ch...

Read More
2025-07-10 talkingdev

Bria开源T2I模型BRIA-3.2:参数仅4B却媲美Flux画质

视觉AI平台服务商Bria近日在Hugging Face发布新一代开源文本生成图像模型BRIA-3.2,其技术突破引发行业关注。该模型仅用4B参数即实现与Adobe Firefly 4.0和Flux[Dev]相当的图像生成质量,且模型体积缩小至三分之一,...

Read More
2025-07-10 talkingdev

3D碰撞检测算法新突破:分离轴测试性能提升5倍

近日,一项名为“分离轴测试(Separating Axis Test)”的3D碰撞检测算法迎来重大性能突破。开发者cairnc在疫情期间发现该优化方法,通过特定技巧可使检测速度提升5倍,相关技术细节已在其GitHub仓库公开。该算法在Hac...

Read More
  1. Prev Page
  2. 3
  3. 4
  4. 5
  5. Next Page