Salesforce发布了一组新的语言模型,该模型在GitHub上公开发布。这些模型使用4K和8K序列长度进行了15亿个令牌的训练,参数量为70亿。与目前许多开源模型如MPT或Falcon相比,这些模型具有更好或相当的性能。此外,它...
Read More在2016年,对人工智能专家进行了一项关于未来行业发展的调查。调查结果显示,专家们对人工智能的发展持有积极的态度,并提出了许多预测。其中,一些重点包括:1.人工智能将在各个领域得到广泛应用,包括医疗、金融、...
Read MoreLLM Library是一款可扩展、便捷、高效的大型机器学习模型微调工具箱,旨在为整个社区提供用户友好、高速可靠、易于访问的解决方案。
Read MoreExLlama是HF Transformers实现的一种内存更高效的量化权重重写。这个重写的目的是为了在使用量化权重时能够更好地节省内存。Llama是HF Transformers的一个开源项目,但在使用量化权重时存在内存占用较高的问题。ExLl...
Read More埃隆·马斯克和马克·扎克伯格已经同意进行一场笼式搏斗。这两位科技亿万富翁之间的争斗始于近七年前,当时Facebook租赁的一颗卫星在SpaceX猎鹰9号火箭发射过程中被摧毁。Facebook租用该卫星的带宽,为非洲的某些地区...
Read More稳定性人工智能发布了一种新的人工智能模型,用于生成比以往更逼真的图像。该模型名为SDXL 0.9,可以根据基于文本的提示创建图像,这些图像比以前的模型更美观,并具有更多的构图细节。据悉,Stable Diffusion的下一...
Read More苹果的visionOS软件开发工具包(SDK)现已通过Xcode 15 beta 2提供。该SDK使开发者能够创建将数字内容与现实世界融合的空间计算应用程序。下个月,苹果将在库比蒂诺、伦敦、慕尼黑、上海、新加坡和东京开设开发者实...
Read More这项研究介绍了LOw-Memory Optimization(LOMO),这是一种旨在显著减少大型语言模型(LLM)训练所需资源的优化器,目前这一过程需要大量的GPU资源。LOMO的创新方法使得只需使用一台具有8个RTX 3090 GPU(每个具有24...
Read More