模型的相关内容 - 漫话开发者

2025-02-06 talkingdev

谷歌发布全新AI模型Gemini 2.0，推动AI思考能力发展

谷歌本周三推出了Gemini 2.0 Pro Experimental实验版，并在其推理模型Gemini 2.0 Flash Thinking上进行了更新，用户可以在Gemini应用中使用。Gemini 2.0 Pro Experimental将在谷歌的AI开发平台Vertex AI和Google AI...

2025-02-05 talkingdev

MIT化学家利用生成型AI快速计算3D基因组结构

麻省理工学院（MIT）的化学家们开发了一种新方法，利用生成型人工智能（AI）确定3D基因组结构。这项技术能在几分钟内预测数千种结构，这对于研究基因组的三维组织如何影响单个细胞中的基因表达模式和功能至关重要。...

2025-02-04 talkingdev

OpenAI推出Deep Research：ChatGPT中的自主研究agent

OpenAI近日发布了名为“Deep Research”的自主研究agent，该agent集成于ChatGPT中，能够通过综合分析大量在线资源进行多步骤研究。Deep Research由即将推出的OpenAI o3模型的优化版本驱动，展现了AI在复杂任务处理中的...

2025-02-04 talkingdev

DeepSeek AI模型颠覆市场，创新或重塑AI竞争格局

DeepSeek的AI模型以其显著低于其他领先模型的训练成本，正在颠覆AI市场。这一突破性进展不仅挑战了Nvidia等科技巨头的地位，还展示了资源高效利用的潜力。传统观念认为，更高的投入意味着更好的性能，但DeepSeek的成...

2025-02-02 talkingdev

Ratzilla：新一代AI技术的突破与应用

近日，一款名为Ratzilla的新型AI技术引起了广泛关注。Ratzilla结合了LLM、agent、embedding、LoRA和RAG等先进技术，展现了在自然语言处理、智能代理和多模态学习领域的强大潜力。该技术通过高效的模型训练和推理机制...

2025-02-01 talkingdev

OpenAI O3-Mini技术解析：小型化AI模型的新突破

近日，OpenAI发布了其最新研发的O3-Mini模型，这一小型化AI模型在性能和效率上取得了显著突破。O3-Mini采用了先进的embedding技术和LoRA优化策略，使其在保持高精度的同时，大幅降低了计算资源的消耗。该模型特别适...

2025-01-31 talkingdev

Qwen2.5-VL Cookbooks发布：助力多任务视觉语言模型应用

近日，Qwen2.5-VL这一全新的视觉语言模型推出了配套的Cookbooks，详细展示了如何利用该模型完成多种不同的任务。Qwen2.5-VL作为一款先进的视觉语言模型，具备强大的多模态处理能力，能够同时理解图像和文本信息。此...

2025-01-31 talkingdev

Chatbot Arena排名被操纵，GitHub仓库揭示技术漏洞

近日，研究人员通过GitHub仓库公开了一项研究，展示了Chatbot Arena的众包投票系统可以被操纵，从而影响模型排名的可靠性。研究表明，通过战略性操纵技术，某些模型可以在排行榜上被提升或降低排名。这一发现引发了...