漫话开发者 - UWL.ME 精选全球AI前沿科技和开源产品
2025-02-27 talkingdev

Allen AI推出OlmOCR:基于Qwen VL的PDF文本提取新突破

Allen AI近日宣布,其通过持续微调Qwen VL模型,成功训练出一款强大的PDF文本提取工具——OlmOCR。该模型基于超过20万份PDF文档进行训练,能够高效、精准地提取PDF中的文本内容。OlmOCR的推出标志着PDF文本提取技术的...

Read More
2025-02-27 talkingdev

本地模型与云端模型协同工作,成本降低83%

Hazy Research的最新研究表明,通过Ollama使用本地模型,并结合长上下文云端模型作为协调器,可以在仅花费17%成本的情况下,实现97%的任务性能。这一发现为企业在AI部署中提供了更高效、更经济的解决方案。本地模型...

Read More
2025-02-27 talkingdev

Qwen推出全新推理模型,数学与代码能力表现卓越

近日,Qwen公司预览了一款全新的推理模型,该模型在数学和代码领域表现出色,取得了显著的成果。Qwen计划将这一模型与其强大的Max模型一同以开放权重的形式发布。这一举措不仅展示了Qwen在人工智能领域的技术实力,...

Read More
2025-02-26 talkingdev

FFT强势回归:高效替代Self-Attention的新选择

在深度学习领域,Self-Attention机制因其在处理序列数据时的高效性而广受欢迎。然而,最近的研究表明,快速傅里叶变换(FFT)可能成为Self-Attention的有力替代品。FFT作为一种经典的信号处理技术,能够在计算复杂度...

Read More
2025-02-26 talkingdev

ForeverVM:在持久化沙盒中运行AI生成代码

近日,ForeverVM推出了一项创新技术,允许开发者在持久化的沙盒环境中运行AI生成的代码。这一技术通过创建状态化的沙盒环境,使得代码可以在其中无限期运行,同时保持环境的状态不变。这对于测试和验证AI生成的代码...

Read More
2025-02-26 talkingdev

基于DiNO 2的视线估计算法在GitHub开源,助力商业与安全应用

近日,一款基于DiNO 2的视线估计算法在GitHub上开源,该算法能够高效地估计人们的视线方向,为商业、制造业和安全领域提供了重要的技术支持。视线估计技术通过分析人眼的注视点,可以广泛应用于零售场景中的消费者行...

Read More
2025-02-26 talkingdev

R1-OneVision:多模态推理模型在复杂视觉任务中的突破

近日,R1-OneVision作为一种多功能的大型多模态模型,正式在GitHub上发布。该模型通过整合视觉与文本数据,在数学、科学、深度图像理解及逻辑推理等复杂任务中表现出色。R1-OneVision的设计旨在解决传统单一模态模型...

Read More
2025-02-26 talkingdev

LightningDiT:高效模块化扩散模型工具包助力生成式AI应用

近日,一款名为LightningDiT的高效模块化扩散模型工具包在GitHub上发布,旨在为生成式AI应用提供可扩展且多功能的解决方案。LightningDiT通过优化模型架构和训练流程,显著提升了生成式AI的性能和效率。该工具包支持...

Read More
  1. Prev Page
  2. 33
  3. 34
  4. 35
  5. Next Page