漫话开发者 - UWL.ME 精选全球AI前沿科技和开源产品
2024-05-15 talkingdev

论文:深度学习新模型,无状态序列并行推理

深度学习领域有了一项新的突破。研究人员开发出了一个新的状态空间模型,这一模型使用双重转移函数表示。其主要特点是一个无状态的序列并行推理算法。这种新的推理算法能够在处理大规模数据时,有效提高计算效率和准...

Read More
2024-05-14 talkingdev

MoonDream COYO Captions:基于COYO数据集的500万条图像标注描述

MoonDream最新发布COYO Captions,这是一个包含500万条全新图像描述的数据库,这些描述基于COYO数据集部分图像及其替代文本。COYO数据集是一个大型的、多元化的图像数据集,它包含了各种不同的场景和对象。通过这500...

Read More
2024-05-09 talkingdev

QoQ高效量化算法助力LLM推理加速

QoQ,一种新型量化算法,通过使用4位权重、8位激活和4位KV缓存,加速了大型语言模型推理。量化是一种广泛应用于深度学习中的技术,它能够减少模型的存储需求和计算复杂性。在这种情况下,QoQ算法采用了较低精度的数...

Read More
2024-05-06 talkingdev

提升医疗影像精度:新算法RaffeSDG开源

科研人员已经研发出一种名为RaffeSDG的新算法,该算法能够在分析来自不同来源的数据时提高医疗影像模型的准确度。RaffeSDG通过加强算法的鲁棒性,使得模型在处理多源数据时的性能有了显著提高。这一进步对于医疗影像...

Read More
2024-05-02 talkingdev

微梦想家算法驱动的3D生成技术

科研人员已经开发出一种名为微梦想家(MicroDreamer)的创新3D生成算法。这种算法通过降低所需函数评估的数量,显著加快了3D生成的过程。微梦想家算法采用先进的计算策略和优化技术,大大提升了3D建模和渲染的效率和...

Read More
2024-04-28 talkingdev

使用Unsloth微调Llama3:显著减少内存使用且长上下文增6倍

Llama3是一种革命性的新技术,它通过使用Unsloth进行微调,可以在保持相同的计算效率的同时,显著降低VRAM的使用量。最近的研究表明,使用Unsloth微调Llama3可以使上下文长度增长六倍,这比HF的flash attention技术...

Read More
2024-04-28 talkingdev

字节跳动宁愿关闭TikTok,也不愿出售

字节跳动宁愿选择关闭在美国的TikTok,也不愿意出售。美国市场只为TikTok的全球收入贡献了四分之一,而且字节跳动旗下所有媒体平台的日活用户中,美国市场只占5%。短时间内完成出售的压力可能会对任何可能的销售价格...

Read More
2024-04-27 talkingdev

苹果收购法国AI公司Datakalab,专注于设备内处理技术

苹果已经收购了总部位于巴黎的人工智能初创公司Datakalab,这是苹果为了提供设备内AI工具的一项举措。Datakalab公司专注于算法压缩和嵌入式AI系统。这次收购显示出苹果对于提升其在设备内处理技术的重视,这也将对苹...

Read More
  1. Prev Page
  2. 29
  3. 30
  4. 31
  5. Next Page