效率的相关内容 - 漫话开发者

2025-04-17 talkingdev

OpenAI 发布全新模拟推理模型o3和o4-mini 提升全工具访问能力

全球领先的人工智能研究实验室 OpenAI 最近发布了两款新型的模拟推理模型——o3和o4-mini。这两款模型不仅拥有模拟推理的能力，还首次集成了对各种ChatGPT工具的访问功能，包括网页浏览和编程等，这标志着OpenAI在推理...

2025-04-17 talkingdev

Stability AI与AMD近日宣布，双方已成功针对Radeon显卡及Ryzen AI处理器优化了多款Stable Diffusion模型。这一技术突破显著提升了AMD硬件平台在生成式AI工作负载下的运行效率，实测显示推理速度最高可提升40%。该优...

2025-04-17 talkingdev

Tile Language是一种简洁的领域特定语言（DSL），旨在简化和优化高性能GPU/CPU内核（如GEMM、Dequant GEMM、FlashAttention和LinearAttention）的开发流程。该语言采用类似Python的语法，并基于TVM（Tensor Virtual...

2025-04-17 talkingdev

M1是一种基于Mamba架构的推理模型，通过扩展测试时间计算进行训练。虽然尚未完全达到最先进模型的水平，但M1在长上下文处理和高吞吐量任务中表现出色。这一突破为大规模语言模型的推理效率提供了新的研究方向，特别...

2025-04-17 talkingdev

OpenAI正式推出新一代o3和o4-mini模型，标志着大语言模型在功能整合与推理效率上的重大突破。该系列模型通过深度融合网络搜索、文件解析及图像生成三大核心能力，显著提升了ChatGPT的复杂任务处理水平。技术层面，o4...

2025-04-16 talkingdev

OpenAI近日将其内部研发的高性能计算核心——FP4（4-bit浮点）与MoE（混合专家）系统的关键算子通过GitHub PR开源至Triton语言项目。这一举动标志着AI基础设施领域的重要进展：FP4作为新兴的低精度计算格式可显著提升...

2025-04-16 talkingdev

AllenAI最新推出的Data Decide工具为预训练过程中的数据筛选提供了创新解决方案。这一框架能够帮助研究人员和开发者更科学地评估和选择预训练数据，显著提升模型训练效率和质量。该工具通过系统化的评估指标，量化不...

2025-04-16 talkingdev

近日，Gemini和Whisk两大平台宣布集成Veo 2技术，为用户提供更强大的视频生成能力。Veo 2作为新一代视频生成工具，通过先进的AI算法，能够快速生成高质量的视频内容，满足用户在营销、教育、娱乐等多领域的需求。此...