模型融合的相关内容 - 漫话开发者

2026-05-04 talkingdev

开源|DeepClaude — 融合DeepSeek V4 Pro与Claude Code的AI代理循环，成本降低17倍

在AI大模型应用领域，成本与性能的平衡一直是开发者关注的焦点。近日，一款名为DeepClaude的开源工具在开发者社区引发热议。该项目巧妙地将DeepSeek V4 Pro模型与Claude Code的代理循环（Agent Loop）进行结合，旨在...

2025-09-11 talkingdev

字节跳动最新推出的AI图像生成模型Seedream 4.0引发行业关注。该公司宣称，在内部评测基准MagicBench中，该模型在提示词遵循度、图像对齐能力和美学质量三个核心维度上超越了谷歌DeepMind的Gemini 2.5 Flash Image模...

2025-07-18 talkingdev

苹果公司近期在其机器学习研究官网发布了《Apple Intelligence Foundation Language Models Tech Report 2025》技术报告，正式公开了支撑Apple Intelligence功能的两大核心基础模型。报告显示，这两个模型具备多语言...

2025-04-01 talkingdev

最新发表在arXiv的论文提出了一种创新的模型融合技术，能够从大型语言模型(LLM)中精准移除敏感内容，同时保持模型的通用知识能力。这项突破性研究通过参数空间分析，识别并分离与敏感信息相关的神经网络连接，实现了...

2024-04-28 talkingdev

Sakana AI近日发布了EvoSDXL-JP，这是一款为日语指令优化的高速图像生成模型，采用了一种革新的模型融合方法。与现有模型相比，EvoSDXL-JP的推断速度提高了十倍，并且性能卓越。这款模型非常适合在日本的教育领域使...

2024-04-10 talkingdev

OpenAI宣布推出GPT-4 Turbo，该模型融合了文本和图像处理功能，为开发者提供了一个全新的AI工具。GPT-4 Turbo的问世，意味着开发者可以通过单一模型来实现对文本和图像数据的综合处理，极大地提高了开发效率和创新潜...

2024-03-22 talkingdev

Sakana AI开发了先进的日语语言、视觉和图像生成模型。该公司引入了一种进化模型融合技术，旨在无需昂贵的预训练即可发展基础模型。该模型融合技术已经发布，并附带了方法的解释。这一创新技术将有助于降低AI模型开...

2024-03-18 talkingdev

人工智能领域的领先企业xAI近日宣布，已将其拥有3140亿参数的Mixture-of-Experts模型——Grok-1的权重和架构公开。Grok-1采用JAX编写，并融入了现代Transformer架构，包括GeGLU、ROPE、三明治范数等先进技术。此次公开...