GPT的相关内容 - 漫话开发者

2025-04-16 talkingdev

[开源]Auto Deploy (GitHub Repo)：NVIDIA推出PyTorch和Hugging Face模型高效部署新方案

NVIDIA在GitHub开源项目TensorRT-LLM中发布了名为Auto Deploy的创新工具，该技术实现了将PyTorch和Hugging Face模型转化为高效可部署格式的重大突破。通过TensorRT-LLM的优化编译器，模型推理速度可提升数倍，特别适...

2025-04-16 talkingdev

OpenAI近日将其内部研发的高性能计算核心——FP4（4-bit浮点）与MoE（混合专家）系统的关键算子通过GitHub PR开源至Triton语言项目。这一举动标志着AI基础设施领域的重要进展：FP4作为新兴的低精度计算格式可显著提升...

2025-04-15 talkingdev

OpenAI近日在其API中推出了三款全新模型：GPT-4.1、GPT-4.1 mini和GPT-4.1 nano。这些模型在编码和指令遵循方面表现优异，全面超越了之前的GPT-4o和GPT-4o mini。新模型不仅具备更大的上下文窗口，支持高达100万toke...

2025-04-14 talkingdev

OpenAI正在准备发布GPT-4.1及其o3推理模型的完整版本。GPT-4.1是对GPT-4o的重新设计版本，并计划推出更小尺寸的mini和nano版本。尽管OpenAI目前尚未实现盈利，但其当前估值已达到3000亿美元。上个月，ChatGPT成为应...

2025-04-11 talkingdev

OpenAI宣布对ChatGPT进行升级，增强其聊天机器人的记忆功能，并使其成为默认设置。升级后的ChatGPT将能够参考先前的对话历史，以提供更加相关和有用的回答。这一改进将适用于平台上的所有交流方式。长期记忆对AI而言...

2025-04-07 talkingdev

谷歌宣布其新一代多模态大模型Gemini 2.5 Pro正式进入公测阶段，开发者现可通过Google AI Studio的Gemini API进行体验，而企业级平台Vertex AI的支持也即将上线。作为Gemini系列的最强版本，2.5 Pro在跨模态理解、长...

2025-04-07 talkingdev

近期AI生成的吉卜力风格视觉作品引发热潮，导致OpenAI服务器负载激增，同时引发了关于AI时代创造力本质的深刻讨论。虽然人工智能能够快速生成具有艺术性的图像，但它缺乏人类体验和综合复杂思想与情感的能力。专家指...

2025-04-03 talkingdev

本文梳理了2024年以来最具影响力的AI模型，深入解析其技术特性与应用场景。OpenAI推出的GPT-4.5 Orion凭借其强大的世界知识建模能力成为通用AI领域的标杆；Google的Gemini 2.5 Pro则专注于代码生成与理解，为开发者...