随着人工智能模型的不断发展,越来越多的研究人员开始研究如何在不影响模型准确性的前提下,提高模型的计算效率和内存利用率。LLM量化是一种后训练量化技术,可以使像OPT和LLaMA2这样的大型语言模型更具内存和计算效...
Read MoreBig Code项目发布了旗舰编码模型的另一个版本StarCoder v2。该模型具有16k上下文窗口,经过4T令牌的训练,性能强劲,但仍然低于DeepSeek编码器。StarCoder v2将在程序员社区和人工智能研究领域引起轰动,标志着Big C...
Read MoreSam Altman提出的7万亿美元的要求旨在支持推进GPT等生成式AI模型的成本迅速上升,这表明未来迭代的资源需求呈指数增长。这一雄心壮志凸显了人工智能发展的关键时刻,需要平衡快速技术进步和快速推进对安全和社会准备...
Read More很多应用程序在发展初期,一旦获得一定的关注度和增长,变量成本就会急剧上升。在增长时必须应对这些问题是非常困难的,因为开发人员必须在引擎仍在运行时有效地重建它。创始人可以通过提前规划,拥有多种基础设施选...
Read More去年,Mozilla担任了效率挑战的可扩展评估者。它确保参赛者遵守比赛规则并评估模型性能。这篇文章是语言模型评估和竞争性训练方案的良好介绍。本次比赛对推动自然语言处理技术的发展具有重要意义。
Read More最近,一种名为多视角扩散++的扩散模型引起了人们的注意。该模型可以生成一个对象的多个视图,然后将它们拼接在一起,形成一个引人入胜的3D版本。这个模型的基本原理是将对象分解成许多微小的部分,然后在每个部分上...
Read More近期,AI领域的重大进展,特别是谷歌的Gemini提供了超过一百万标记的上下文窗口,以及Groq的硬件使得GPT-3.5模型的响应几乎是即时的,这标志着AI应用迈入了实践时代,同时也凸显了领袖们理解和适应快速演变的AI应用...
Read MoreScribe近日完成了由红点风投领投的B轮融资,以加速其基于人工智能的平台的发展。该平台自动化创建视觉化的分步指南,促进组织内知识共享。超过100万个团队使用Scribe,其中包括97%的财富100强企业。该公司正在扩展其...
Read More