漫话开发者 - UWL.ME 精选全球AI前沿科技和开源产品
2023-11-28 talkingdev

ZipLoRA: 低秩学习矩阵合并技术提升模型性能

本文介绍了一种名为 ZipLoRA 的技术,该技术可以将多个低秩学习矩阵(LoRAs)合并在一起,从而改善模型性能。相比于常规的微调,LoRAs 更加经济实惠,但是也会改变模型的行为。本文提出的 ZipLoRA 技术可以在保留每...

Read More
2023-11-26 talkingdev

17世纪的ChatGPT是什么样子?MonadGPT揭秘

近日,美国加州伯克利分校的研究人员开发出了一款名为MonadGPT的人工智能模型,该模型基于GPT-3,旨在探究一个问题:如果ChatGPT在17世纪得以发明,会是怎样一番景象。MonadGPT通过对17世纪的语言和文化进行研究,成...

Read More
2023-11-24 talkingdev

Andrej Karpathy的入门级LLM科普介绍视频

本次大型语言模型介绍将讨论它们是什么,它们的发展方向,与现有操作系统的比较和类比以及该领域的一些安全相关挑战。大型语言模型是如今人工智能研究中一个非常重要的部分,近年来得到了广泛关注和应用。它们的出现...

Read More
2023-11-23 talkingdev

亚马逊据称正在使用两倍于GPT-4的参数进行AI训练

亚马逊正在为进入AI竞赛做准备,推出Olympus,这是一个拥有2万亿参数的大型语言模型,旨在超越OpenAI的GPT-4和谷歌的Bard。这一举措有望将亚马逊推向人工智能技术的前沿。虽然目前尚不清楚Olympus的推出时间表,但它...

Read More
2023-11-23 talkingdev

谷歌AI首次在气象预测方面击败传统方法

近日,一项发表在《科学》杂志上的研究表明,谷歌DeepMind开发的人工智能气象模型GraphCast首次在气象预测方面击败传统气象预测方法,能够准确预测未来10天的全球天气状况。该模型基于深度学习技术,通过对大量气象...

Read More
2023-11-23 talkingdev

OpenAI事件对初创企业的影响

OpenAI在开发者生态系统中的主导地位突然受到威胁,为小型企业填补新的空缺提供了机会。微软可能会成为AI领域的赢家,但其他模型层企业,如Anthropic,也可能会利用这一机会。 OpenAI的问题可能会让投资者对AI公司持...

Read More
2023-11-23 talkingdev

开发者指南:将LLM应用程序部署到生产环境

开发LLM应用程序是一回事,成功在生产环境中部署它们是另一回事。本文通过剖析复杂性,为开发人员提供指南,帮助他们将LLM应用程序从开发环境转换到严峻的生产环境,最大限度地提高准确性。在生产环境中,LLM应用程...

Read More
2023-11-23 talkingdev

3分钟内部署任何GGUF模型

使用llama.cpp和GGUF服务器,您可以非常快速地部署一个服务于HuggingFace托管模型的端点。这意味着您可以在几分钟内将HuggingFace的最新自然语言处理模型部署到生产环境中。

Read More
  1. Prev Page
  2. 330
  3. 331
  4. 332
  5. Next Page