漫话开发者 - UWL.ME 精选全球AI前沿科技和开源产品
2023-11-01 talkingdev

苹果推出Scary Fast活动:四大重磅发布

苹果在Scary Fast活动上揭示了最新版自家芯片的全新Mac。苹果的M3、M3 Pro和M3 Max芯片是使用3纳米工艺制造的首批PC芯片。它们配备了更新的GPU,支持光线追踪、网格着色和动态缓存等内存优化功能。新的Mac产品包括24...

Read More
2023-10-31 talkingdev

AMD发布第二轮训练,为大型语言模型训练提供更强的支持

MosaicML发布了一篇关于使用AMD GPU进行大型语言模型训练的文章。该公司在本文中介绍了他们的最新研究结果,使用AMD Radeon Instinct MI100 GPU对GPT-2、GPT-3和T5等大型语言模型进行了训练。结果显示,使用AMD GPU...

Read More
2023-10-27 talkingdev

分布式映射:在HuggingFace数据集上的实现方法

数据集映射是将转换应用于每个数据点的标准方法。但是在多个GPU上同时进行映射是很困难的。本代码提供了在HuggingFace数据集上实现的优秀函数。

Read More
2023-10-23 talkingdev

深度探讨:构建基于LLM的Web应用程序

大多数组织机构没有资源在GPU上运行大型模型,但是有一个强大的开源推动力量在本地运行这些模型。本文探讨了这种推动力量以及LangChain + Ollama集成。 LLN(Local Low Rank Normalization)是一种用于处理基于卷积...

Read More
2023-10-16 talkingdev

Anyscale-将Llama 2的冷启动时间缩短至30秒

将模型从云存储加载到节点GPU通常需要大部分推理时间。通过一些巧妙的技巧,例如内存流,Anyscale将其缩短了20倍,仅需30秒即可到达Llama 2 70B。

Read More
2023-10-06 talkingdev

深度解析:全面探讨分布式训练和高效微调的一切

在多GPU和多节点系统上训练语言模型存在多种挑战,且在这些场景下积累经验也非常困难。本篇博客文章详尽深入地研究了ZeRO,FSDP,以及在大规模训练或微调模型时可能遇到的问题。我们需要理解,进行分布式训练并不仅...

Read More
2023-10-03 talkingdev

视频模型高效训练,仅需一台机器和八个标准GPU

训练优秀的视频模型通常需要巨大的资源,这种需求往往超出了学术界的承受范围。现在,研究人员已经找到了一种方法,只需要使用一台配备八个标准GPU的机器,在一天内就能完成这些模型的训练。这意味着,我们不再需要...

Read More
2023-10-03 talkingdev

Cloudflare推出全球GPU网络上的无服务器AI推断平台——Workers AI

Cloudflare近日发布了一款名为“Workers AI”的无服务器人工智能推断平台,该平台运行在其全球GPU网络上。Workers AI提供了多种流行的开源模型,并与Hugging Face进行了合作。通过无服务器计算的方式,用户可以在Cloud...

Read More
2023-09-27 talkingdev

AI的2000亿美元问题:生成性AI崛起引发的挑战和机遇

近期,由Nvidia的成功案例所代表的生成性AI的热潮预示着对GPU和AI训练的巨大需求,这也引发了该行业的重大投资。在此背景下,各大科技公司正在推动这一增长,而初创公司面临的挑战则是将关注点从基础设施转向为终端...

Read More
2023-09-27 talkingdev

LAION推出OpenLM:中等规模模型的新选择

OpenLM是一个专为训练最多可达70亿参数的中等规模语言模型设计的库和框架。它的设计理念是注重GPU速度和可修改性。作为收敛性验证,已经有在1.25T标记上训练的模型可供使用。这种新型的框架和库能够更好地满足中等规...

Read More
  1. Prev Page
  2. 12
  3. 13
  4. 14
  5. Next Page