漫话开发者 - UWL.ME 精选全球AI前沿科技和开源产品
2024-05-27 talkingdev

Mistral发布其官方模型微调开源仓库

Mistral近日宣布推出其官方模型微调仓库,这一举措将为开发者提供更方便的工具来优化和定制Mistral的模型。该官方仓库已经在GitHub上开放,用户可以通过访问该仓库获取相关资源和文档。Mistral的微调仓库支持多种机...

Read More
2024-05-27 talkingdev

论文:研究人员推出基于分类器引导的图像个性化扩散模型

研究人员提出了一种新的方法,通过使用分类器引导来定制扩散模型,从用户提供的参考图像中生成保持身份特征的图像。与传统方法需要大量特定领域的训练不同,这种技术利用分类器引导扩散模型,无需额外的训练。此方法...

Read More
2024-05-24 talkingdev

Cohere推出多语言Aya模型

Cohere最新发布的Aya项目包含3种不同规模的模型,能够使用101种语言进行对话,其中许多语言资源极为稀缺。Aya项目的推出对于开放和普及研究社区来说是一个巨大的进步。通过这一项目,研究人员和开发者能够更广泛地获...

Read More
2024-05-24 talkingdev

Llama cpp支持多机器的分布式推理部署

Llama cpp现已支持跨多台机器的分布式推理。这一功能目前仅限于FP16(半精度浮点数),但对于开源部署来说,这无疑是一个巨大的进步。通过分布式推理,开发者可以更高效地利用集群资源,提升模型推理的速度和效率。...

Read More
2024-05-24 talkingdev

diffusion-rscc-概率扩散模型提升遥感图像变化描述能力

该项目推出了一种用于遥感图像变化描述的新型概率扩散模型(RSICC)。这一模型的引入旨在通过对时间推移中的环境变化进行描述,提高遥感图像的解读能力。遥感图像变化描述(RSICC)技术在环境监测、灾害评估及土地利...

Read More
2024-05-23 talkingdev

谷歌月球工厂回归地面:项目转型为初创企业

Alphabet 这家自封的“月球工厂”正在为项目开辟一条新路径,可以将其剥离为创业公司。虽然公司最初不愿让外部投资者分享其投资成果,也不愿冒险损害知识产权,但高管们最终决定,这比让有前途的技术凋零要好。这项新...

Read More
2024-05-22 talkingdev

论文:基于LLMs的文本分类智能专家系统

智能专家系统是一种利用大型语言模型(LLMs)进行文本分类的新方法。该系统通过减少对广泛的预处理和领域专业知识的需求,大大简化了文本分类过程。LLMs具备强大的自然语言处理能力,能够更高效地理解和分类复杂的文...

Read More
2024-05-21 talkingdev

LeMeViT:通过可学习元令牌加速视觉Transformer

LeMeViT是一种新的方法,通过使用可学习元令牌来降低视觉Transformer的计算成本。这些元令牌能够高效地捕捉关键信息,从而显著提高推理速度。与传统的视觉Transformer相比,LeMeViT在保持高精度的同时,大幅减少了计...

Read More
2024-05-20 talkingdev

Model Explorer-开源模型资源管理器让模型调试更便利

谷歌近日发布了一款名为 'Model Explorer' 的模型探索器,该工具可以帮助用户轻松查看并审查自己的模型计算图。这项新的工具对于调试和性能工程来说相当有用。Model Explorer以GitHub Repo形式存在,用户可以方便地...

Read More
2024-05-17 talkingdev

Hugging Face向AI开发者提供价值1000万美元的免费计算资源

人工智能公司Hugging Face宣布,将免费提供价值1000万美元的共享图形处理器(GPUs)资源,以帮助开发者、学者和初创公司创建新的AI技术。此举旨在抵消科技巨头主导的AI发展的集中趋势。Hugging Face希望通过这项举措...

Read More
  1. Prev Page
  2. 13
  3. 14
  4. 15
  5. Next Page