漫话开发者 - UWL.ME 精选全球AI前沿科技和开源产品
2023-06-29 talkingdev

Salesforce开源新的70亿语言模型

Salesforce发布了一组新的语言模型,该模型在GitHub上公开发布。这些模型使用4K和8K序列长度进行了15亿个令牌的训练,参数量为70亿。与目前许多开源模型如MPT或Falcon相比,这些模型具有更好或相当的性能。此外,它...

Read More
2023-06-27 talkingdev

人工智能专家对未来行业的预测调查结果

在2016年,对人工智能专家进行了一项关于未来行业发展的调查。调查结果显示,专家们对人工智能的发展持有积极的态度,并提出了许多预测。其中,一些重点包括:1.人工智能将在各个领域得到广泛应用,包括医疗、金融、...

Read More
2023-06-27 talkingdev

LLM Library (GitHub Repo):打造大型机器学习模型优化的可扩展工具箱

LLM Library是一款可扩展、便捷、高效的大型机器学习模型微调工具箱,旨在为整个社区提供用户友好、高速可靠、易于访问的解决方案。

Read More
2023-06-26 talkingdev

ExLlama:HF Transformers实现的内存更高效的量化权重重写

ExLlama是HF Transformers实现的一种内存更高效的量化权重重写。这个重写的目的是为了在使用量化权重时能够更好地节省内存。Llama是HF Transformers的一个开源项目,但在使用量化权重时存在内存占用较高的问题。ExLl...

Read More
2023-06-23 talkingdev

马斯克和扎克伯格之间的恩怨始于一场大爆炸

埃隆·马斯克和马克·扎克伯格已经同意进行一场笼式搏斗。这两位科技亿万富翁之间的争斗始于近七年前,当时Facebook租赁的一颗卫星在SpaceX猎鹰9号火箭发射过程中被摧毁。Facebook租用该卫星的带宽,为非洲的某些地区...

Read More
2023-06-23 talkingdev

Stability发布全新Stable Diffusion模型,新版将不再出现意大利面手

稳定性人工智能发布了一种新的人工智能模型,用于生成比以往更逼真的图像。该模型名为SDXL 0.9,可以根据基于文本的提示创建图像,这些图像比以前的模型更美观,并具有更多的构图细节。据悉,Stable Diffusion的下一...

Read More
2023-06-22 talkingdev

Apple发布新版visionOS SDK,开发者工具现已可用

苹果的visionOS软件开发工具包(SDK)现已通过Xcode 15 beta 2提供。该SDK使开发者能够创建将数字内容与现实世界融合的空间计算应用程序。下个月,苹果将在库比蒂诺、伦敦、慕尼黑、上海、新加坡和东京开设开发者实...

Read More
2023-06-21 talkingdev

LOMO:高效的LLM训练(GitHub开源)

这项研究介绍了LOw-Memory Optimization(LOMO),这是一种旨在显著减少大型语言模型(LLM)训练所需资源的优化器,目前这一过程需要大量的GPU资源。LOMO的创新方法使得只需使用一台具有8个RTX 3090 GPU(每个具有24...

Read More
  1. Prev Page
  2. 220
  3. 221
  4. 222
  5. Next Page