性能的相关内容 - 漫话开发者

2025-02-27 talkingdev

微软发布全新Phi模型，专为多模态处理优化

微软近日发布了两款全新的开源语言模型Phi-4-mini和Phi-4-multimodal，这两款模型在硬件效率和多模态处理方面表现出色。其中，Phi-4-mini拥有38亿参数，专注于文本任务；而Phi-4-multimodal则具备56亿参数，能够处理...

2025-02-27 talkingdev

近日，SubPOP发布了一个大规模数据集，专门用于微调LLM（大语言模型），以预测调查响应分布。该数据集通过减少预测差距，显著提升了模型在未见过的调查数据上的泛化能力。这一技术突破为公众意见预测提供了更精准的...

2025-02-27 talkingdev

Allen AI近日宣布，其通过持续微调Qwen VL模型，成功训练出一款强大的PDF文本提取工具——OlmOCR。该模型基于超过20万份PDF文档进行训练，能够高效、精准地提取PDF中的文本内容。OlmOCR的推出标志着PDF文本提取技术的...

2025-02-27 talkingdev

Hazy Research的最新研究表明，通过Ollama使用本地模型，并结合长上下文云端模型作为协调器，可以在仅花费17%成本的情况下，实现97%的任务性能。这一发现为企业在AI部署中提供了更高效、更经济的解决方案。本地模型...

2025-02-27 talkingdev

在深度学习领域，Self-Attention机制因其在处理序列数据时的高效性而广受欢迎。然而，最近的研究表明，快速傅里叶变换（FFT）可能成为Self-Attention的有力替代品。FFT作为一种经典的信号处理技术，能够在计算复杂度...

2025-02-26 talkingdev

Google Cloud近日发布了由Nvidia GB200 NVL72系统驱动的A4X虚拟机实例，该实例配备了72个B200 GPU和36个Grace CPU，专为大规模AI和高并发应用设计。A4X实例的训练效率是前代A3实例的四倍，并且与Google Cloud服务无...

2025-02-26 talkingdev

近日，一款基于DiNO 2的视线估计算法在GitHub上开源，该算法能够高效地估计人们的视线方向，为商业、制造业和安全领域提供了重要的技术支持。视线估计技术通过分析人眼的注视点，可以广泛应用于零售场景中的消费者行...

2025-02-26 talkingdev

近日，一款名为LightningDiT的高效模块化扩散模型工具包在GitHub上发布，旨在为生成式AI应用提供可扩展且多功能的解决方案。LightningDiT通过优化模型架构和训练流程，显著提升了生成式AI的性能和效率。该工具包支持...