漫话开发者 - UWL.ME 精选全球AI前沿科技和开源产品
2024-03-04 talkingdev

关于LLM量化的全面研究

随着人工智能模型的不断发展,越来越多的研究人员开始研究如何在不影响模型准确性的前提下,提高模型的计算效率和内存利用率。LLM量化是一种后训练量化技术,可以使像OPT和LLaMA2这样的大型语言模型更具内存和计算效...

Read More
2024-03-01 talkingdev

StarCoderV2发布,具备16k上下文窗口和4T训练令其性能强劲

Big Code项目发布了旗舰编码模型的另一个版本StarCoder v2。该模型具有16k上下文窗口,经过4T令牌的训练,性能强劲,但仍然低于DeepSeek编码器。StarCoder v2将在程序员社区和人工智能研究领域引起轰动,标志着Big C...

Read More
2024-02-27 talkingdev

Sam Altman呼吁提供7万亿美元支持人工智能发展

Sam Altman提出的7万亿美元的要求旨在支持推进GPT等生成式AI模型的成本迅速上升,这表明未来迭代的资源需求呈指数增长。这一雄心壮志凸显了人工智能发展的关键时刻,需要平衡快速技术进步和快速推进对安全和社会准备...

Read More
2024-02-27 talkingdev

如何应对人工智能项目成本上涨?

很多应用程序在发展初期,一旦获得一定的关注度和增长,变量成本就会急剧上升。在增长时必须应对这些问题是非常困难的,因为开发人员必须在引擎仍在运行时有效地重建它。创始人可以通过提前规划,拥有多种基础设施选...

Read More
2024-02-26 talkingdev

Mozilla担任NeurIPS效率挑战的评估者

去年,Mozilla担任了效率挑战的可扩展评估者。它确保参赛者遵守比赛规则并评估模型性能。这篇文章是语言模型评估和竞争性训练方案的良好介绍。本次比赛对推动自然语言处理技术的发展具有重要意义。

Read More
2024-02-23 talkingdev

多视角扩散+:生成引人入胜的3D视图

最近,一种名为多视角扩散++的扩散模型引起了人们的注意。该模型可以生成一个对象的多个视图,然后将它们拼接在一起,形成一个引人入胜的3D版本。这个模型的基本原理是将对象分解成许多微小的部分,然后在每个部分上...

Read More
2024-02-22 talkingdev

AI应用步入实践时代,巨头们需紧跟时代发展

近期,AI领域的重大进展,特别是谷歌的Gemini提供了超过一百万标记的上下文窗口,以及Groq的硬件使得GPT-3.5模型的响应几乎是即时的,这标志着AI应用迈入了实践时代,同时也凸显了领袖们理解和适应快速演变的AI应用...

Read More
2024-02-22 talkingdev

Scribe获得2500万美元B轮融资

Scribe近日完成了由红点风投领投的B轮融资,以加速其基于人工智能的平台的发展。该平台自动化创建视觉化的分步指南,促进组织内知识共享。超过100万个团队使用Scribe,其中包括97%的财富100强企业。该公司正在扩展其...

Read More
  1. Prev Page
  2. 106
  3. 107
  4. 108
  5. Next Page