漫话开发者 - UWL.ME 精选全球AI前沿科技和开源产品
2026-04-22 talkingdev

OpenAI发布ChatGPT Images 2.0:图像生成模型迎来重大升级,文本渲染与多模态推理能力显著提升

OpenAI近日正式推出了其图像生成模型的重大升级版本——ChatGPT Images 2.0。该版本标志着多模态人工智能技术迈入了新的阶段,其核心在于集成了一个先进的图像生成模型,该模型在多个关键技术指标上实现了显著突破。首...

Read More
2026-04-09 talkingdev

Meta发布Muse Spark:迈向个人超级智能的多模态推理与工具调用新模型

Meta公司近日正式推出了名为Muse Spark的新型多模态推理模型,标志着其在追求个人超级智能(Personal Superintelligence)的道路上迈出了关键一步。该模型集成了三大前沿技术能力:工具使用、视觉思维链以及多智能体...

Read More
2026-04-07 talkingdev

开源|Ghost Pepper:macOS本地长按语音转文字工具,基于WhisperKit与本地LLM,数据不出设备

开发者matthartman近日在GitHub上开源了名为Ghost Pepper的macOS应用,它是一款完全在本地运行的“长按说话”语音转文字工具。该工具的核心技术栈结合了OpenAI开源的WhisperKit语音识别模型与本地运行的大型语言模型(...

Read More
2026-01-27 talkingdev

告别空白文档:Atlassian Rovo AI如何用几分钟生成完整产品发布计划?

产品发布流程正迎来AI驱动的深刻变革。Atlassian近日通过一场线上研讨会,展示了其新产品Rovo AI如何彻底改变传统产品发布模式。传统上,产品经理和营销人员往往从一张空白文档和紧迫的截止日期开始,而Rovo AI通过...

Read More
2026-01-26 talkingdev

开源|字节跳动Seed团队发布Stable-DiffCoder:基于扩散模型的轻量级代码大语言模型

字节跳动Seed团队在GitHub上开源了Stable-DiffCoder项目,这是一个基于扩散模型(Diffusion Model)构建的轻量级代码大语言模型(Code DLLM)家族。该项目创新性地将扩散模型的生成范式引入代码建模领域,通过“块扩...

Read More
2025-11-23 talkingdev

Meta发布WorldGen:文本生成沉浸式3D世界的突破性技术

Meta Reality Labs最新推出的WorldGen技术,通过生成式人工智能实现了从文本描述直接创建高质量沉浸式3D环境的突破。该系统结合了神经辐射场(NeRF)、扩散模型和程序化生成技术,能够根据自然语言输入(如'被苔藓覆...

Read More
2025-11-12 talkingdev

空间智能:AI从语言大师迈向世界构建者的下一前沿

当前大型语言模型虽在文本生成领域表现卓越,却存在根本性认知缺陷——缺乏人类与生俱来的空间智能。最新研究指出,构建具备几何一致性与物理规律模拟能力的“世界模型”将成为突破这一瓶颈的关键。这类模型能通过处理图...

Read More
2025-11-07 talkingdev

深度解析月之暗面Kimi K2推理模型:国产MoE架构突破性能边界

中国人工智能实验室月之暗面(Moonshot AI)最新推出的Kimi K2 Thinking模型,以其创新的混合专家(MoE)推理架构引发行业关注。该模型在Humanity's Last Exam综合能力测评和BrowseComp浏览理解基准测试中,部分指标...

Read More
  1. 1
  2. 2
  3. 3
  4. Next Page