X的相关内容 - 漫话开发者

2023-06-29 talkingdev

Salesforce开源新的70亿语言模型

Salesforce发布了一组新的语言模型，该模型在GitHub上公开发布。这些模型使用4K和8K序列长度进行了15亿个令牌的训练，参数量为70亿。与目前许多开源模型如MPT或Falcon相比，这些模型具有更好或相当的性能。此外，它...

2023-06-27 talkingdev

在2016年，对人工智能专家进行了一项关于未来行业发展的调查。调查结果显示，专家们对人工智能的发展持有积极的态度，并提出了许多预测。其中，一些重点包括：1.人工智能将在各个领域得到广泛应用，包括医疗、金融、...

2023-06-27 talkingdev

LLM Library是一款可扩展、便捷、高效的大型机器学习模型微调工具箱，旨在为整个社区提供用户友好、高速可靠、易于访问的解决方案。

2023-06-26 talkingdev

ExLlama是HF Transformers实现的一种内存更高效的量化权重重写。这个重写的目的是为了在使用量化权重时能够更好地节省内存。Llama是HF Transformers的一个开源项目，但在使用量化权重时存在内存占用较高的问题。ExLl...

2023-06-23 talkingdev

埃隆·马斯克和马克·扎克伯格已经同意进行一场笼式搏斗。这两位科技亿万富翁之间的争斗始于近七年前，当时Facebook租赁的一颗卫星在SpaceX猎鹰9号火箭发射过程中被摧毁。Facebook租用该卫星的带宽，为非洲的某些地区...

2023-06-23 talkingdev

稳定性人工智能发布了一种新的人工智能模型，用于生成比以往更逼真的图像。该模型名为SDXL 0.9，可以根据基于文本的提示创建图像，这些图像比以前的模型更美观，并具有更多的构图细节。据悉，Stable Diffusion的下一...

2023-06-22 talkingdev

苹果的visionOS软件开发工具包（SDK）现已通过Xcode 15 beta 2提供。该SDK使开发者能够创建将数字内容与现实世界融合的空间计算应用程序。下个月，苹果将在库比蒂诺、伦敦、慕尼黑、上海、新加坡和东京开设开发者实...

2023-06-21 talkingdev

这项研究介绍了LOw-Memory Optimization（LOMO），这是一种旨在显著减少大型语言模型（LLM）训练所需资源的优化器，目前这一过程需要大量的GPU资源。LOMO的创新方法使得只需使用一台具有8个RTX 3090 GPU（每个具有24...