Multi的相关内容 - 漫话开发者

2026-04-29 talkingdev

NVIDIA发布Nemotron 3 Nano Omni：多模态AI新突破，长上下文处理能力引领文档、音频与视频智能分析

NVIDIA日前发布了名为Nemotron 3 Nano Omni的全新多模态模型，标志着其在长上下文多模态智能领域的重要进展。该模型专为文档、音频和视频分析设计，在MMlongbench-Doc和VoiceBench等多个权威基准测试中均取得了业界...

2026-04-22 talkingdev

OpenAI发布图像生成提示工程权威指南，助力开发者打造高可控性生产级视觉内容

OpenAI近期在其官方开发者平台发布了一份详尽的《图像生成模型提示工程指南》，这份长达38分钟的阅读材料，标志着生成式AI在图像创作领域正从实验性探索迈向成熟、可控的生产级应用。该指南系统性地阐述了如何通过精...

2026-04-21 talkingdev

月之暗面发布Kimi K2.6系列模型，宣称多项基准超越GPT-5.4与Claude Opus

中国人工智能公司月之暗面（Moonshot AI）近日正式推出其新一代大模型系列Kimi K2.6，并已在Kimi Chat对话平台及API接口上线。该系列模型的核心突破在于强化了长上下文编程能力与智能体（Agent）执行支持，旨在为开...

2026-04-13 talkingdev

开源|Multica：将AI编程智能体转化为真实开发队友的开源平台

近日，一个名为Multica的开源基础设施平台在GitHub上发布，旨在将AI编程智能体深度集成到软件开发团队中，使其成为能够自主认领任务、编写代码并汇报进度的“真实队友”。该平台采用Go语言构建的架构，通过本地守护进...

2026-04-13 talkingdev

多智能体协同五大模式解析：从生成-验证到事件驱动，如何选择最优架构？

在人工智能系统日益复杂的今天，多智能体协同架构的设计成为提升系统可靠性与效率的关键。最新技术分析揭示了五种核心协调模式及其适用场景。其中，生成-验证模式通过将任务执行与质量控制分离，专门解决特定可靠性...

2026-03-11 talkingdev

谷歌发布Gemini Embedding 2：首个统一多模态嵌入模型，支持超百种语言

谷歌近日正式推出了其新一代多模态嵌入模型Gemini Embedding 2，标志着人工智能在跨模态语义理解领域迈出了关键一步。该模型通过Gemini API和Vertex AI平台提供服务，其核心突破在于首次将文本、图像、视频、音频及...

2026-01-05 talkingdev

开源|HGMem：超图工作记忆框架提升LLM复杂关系推理能力

近日，一个名为HGMem的开源项目在GitHub上发布，该项目实现了一篇题为《Improving Multi-step RAG with Hypergraph-based Memory for Long-context Complex Relational Modeling》的论文。HGMem是一个基于超图的工作...

2025-12-09 talkingdev

论文推荐|无需人工标注！新型自训练框架让视觉语言模型学会自我评判

一项突破性的研究提出了一种无需任何人工偏好标注即可训练视觉语言模型评判者的全新框架。该框架的核心在于通过自我合成数据实现迭代式自训练，从而摆脱了对昂贵且易过时的人工标注的依赖。其工作流程分为三个阶段：...