Hazy Research的最新研究表明,通过Ollama使用本地模型,并结合长上下文云端模型作为协调器,可以在仅花费17%成本的情况下,实现97%的任务性能。这一发现为企业在AI部署中提供了更高效、更经济的解决方案。本地模型...
Read More在深度学习领域,Self-Attention机制因其在处理序列数据时的高效性而广受欢迎。然而,最近的研究表明,快速傅里叶变换(FFT)可能成为Self-Attention的有力替代品。FFT作为一种经典的信号处理技术,能够在计算复杂度...
Read MoreGoogle Cloud近日发布了由Nvidia GB200 NVL72系统驱动的A4X虚拟机实例,该实例配备了72个B200 GPU和36个Grace CPU,专为大规模AI和高并发应用设计。A4X实例的训练效率是前代A3实例的四倍,并且与Google Cloud服务无...
Read More近日,一款基于DiNO 2的视线估计算法在GitHub上开源,该算法能够高效地估计人们的视线方向,为商业、制造业和安全领域提供了重要的技术支持。视线估计技术通过分析人眼的注视点,可以广泛应用于零售场景中的消费者行...
Read More近日,一款名为LightningDiT的高效模块化扩散模型工具包在GitHub上发布,旨在为生成式AI应用提供可扩展且多功能的解决方案。LightningDiT通过优化模型架构和训练流程,显著提升了生成式AI的性能和效率。该工具包支持...
Read More近日,Character AI在其大规模推理系统中成功减少了KV缓存的使用,并在一个简化版的GPT模型中实现了这一优化。通过这一技术改进,内存使用量减少了40%。这一优化不仅提升了系统的运行效率,还为未来更大规模的AI模型...
Read More近日,EmbodiedEval作为一种全面且交互式的基准测试工具正式亮相,旨在评估多模态大语言模型(MLLMs)在具身任务中的表现。具身任务是指模型需要在物理环境中执行具体操作的任务,这对模型的感知、推理和执行能力提...
Read More近日,Chicory作为一款JVM原生的WebAssembly运行时技术,引起了广泛关注。WebAssembly(Wasm)作为一种高效的二进制指令格式,旨在为Web应用提供接近原生的性能。Chicory的独特之处在于其直接在Java虚拟机(JVM)上...
Read More