漫话开发者 - UWL.ME 精选全球AI前沿科技和开源产品
2025-06-03 talkingdev

[开源]Penny-1.7B:基于GRPO的单卡A6000训练的《爱尔兰便士杂志》风格迁移模型

开发者dleemiller近日在Hugging Face平台发布了Penny-1.7B语言模型,该模型通过创新性的训练方法实现了对19世纪《爱尔兰便士杂志》古英语风格的精准模仿。项目采用纯GRPO(一种新型优化算法)训练策略,仅用单张NVID...

Read More
2025-05-27 talkingdev

[论文推荐]ICYM2I框架:基于逆概率加权的多模态学习缺失模态评估新方法

来自arXiv的最新研究提出ICYM2I框架,通过逆概率加权技术解决多模态模型在数据缺失场景下的信息增益评估偏差问题。该研究针对医疗影像、自动驾驶等依赖多源数据融合的前沿领域,首次系统性地建立了缺失模态条件下的...

Read More
2025-05-17 talkingdev

KVSplit开源-苹果上运行更长上下文的LLM,内存减少59%

近日,开发者dipampaul17在GitHub上发布了KVSplit项目,该项目通过差异化精度的KV缓存量化技术,在苹果芯片(M1/M2/M3/M4)上实现了更长上下文的LLM推理。研究发现,LLM推理中的KV缓存中,键(Keys)和值(Values)...

Read More
2025-04-02 talkingdev

视频运动分割技术新突破:Dino与SAM2实现密集像素追踪

近期,视频运动分割技术迎来重要进展,研究人员通过整合Dino和SAM2模型,成功将密集像素追踪应用于长期分割任务。这项技术突破解决了传统方法在复杂场景下跟踪精度不足的问题,通过像素级运动分析显著提升了分割稳定...

Read More
2025-02-13 talkingdev

ESM2蛋白质折叠模型在Equinox GitHub仓库中发布

ESM2是一款卓越的蛋白质折叠模型,现已在广受欢迎的Jax包中发布了维护良好的版本。该模型利用先进的机器学习技术,能够高效预测蛋白质的三维结构,为生物医学研究和药物开发提供了强大的工具。此次发布的版本经过优...

Read More
2024-11-01 talkingdev

苹果M1/M2 GPU驱动程序更新解读

近日,苹果公司对其M1和M2系列的GPU驱动程序进行了重要更新。本次更新主要旨在提升图形处理性能和兼容性,尤其是在高负载应用场景下的表现。更新内容包括对多种图形软件的优化,使得开发者能够更好地利用M1和M2的硬...

Read More
2024-07-19 talkingdev

LLM2sh:让命令行更人性化的开源工具

GitHub近日发布了一款命令行实用工具——LLM2sh。这项工具的主要功能在于利用LLMs技术,将用户的普通语言请求转化为shell命令。通过LLM2sh,用户可以用日常语言来控制和指导计算机操作,提升了命令行的便利性和亲和力...

Read More
2024-05-09 talkingdev

苹果发布专为AI设计的M4芯片

苹果公司宣布了下一代Apple Silicon芯片——M4,这也是该公司首款专为人工智能设计的芯片。新芯片采用3纳米架构,并将首次在2024年的iPad Pro中亮相。新芯片拥有10核CPU,速度比M2快50%,并配备了新的神经引擎,能够每...

Read More
  1. Next Page