漫话开发者 - UWL.ME 精选全球AI前沿科技和开源产品
2024-03-20 talkingdev

全新数据压缩技术:AI模型训练数据集大幅缩减

近日,一项名为Poster Dataset Distillation的技术引起了广泛关注。该技术能够将庞大的数据集压缩成一个单一的'海报',使得人工智能模型能够通过不到一张每个类别的图片进行学习。这一创新方法大幅减少了训练AI模型...

Read More
2024-03-20 talkingdev

深度解析:SORA技术内幕

本文由前OpenAI科学家撰写,深入探讨了SORA技术及其生成视频的潜在成本。SORA是一种先进的视频生成技术,通过复杂的算法和大量的数据处理,能够创建出高质量的视频内容。文章详细介绍了SORA的工作原理,包括其如何处...

Read More
2024-03-18 talkingdev

AMD GPU上的多节点大型语言模型训练解析

本文详细介绍了Lamini公司在AMD GPU上进行大型语言模型训练的技术架构。这包括了他们所使用的调度程序、模型训练技术以及其他相关技术细节。Lamini的技术团队选择了AMD GPU作为硬件加速平台,以优化模型训练的性能和...

Read More
2024-03-18 talkingdev

Claude 3 Haiku:速度最快、成本最低的AI模型

Anthropic公司最新推出的Claude 3 Haiku AI模型,以其卓越的速度和经济性成为目前市场上最快的AI模型。该模型具备先进的视觉能力,并在各项基准测试中表现突出。Claude 3 Haiku专为企业设计,注重速度和可负担性,为...

Read More
2024-03-18 talkingdev

pg_hint_plan:为PostgreSQL执行计划优化提供新策略

开源项目pg_hint_plan为开发者提供了一种新的方法,通过在SQL注释中使用提示来调整PostgreSQL的执行计划。在PostgreSQL中,规划器通过成本基优化器估算每个可能的执行计划的成本,并执行成本最低的计划。尽管Postgre...

Read More
2024-03-15 talkingdev

如何在竞争激烈的企业AI市场中脱颖而出

在Lightspeed会议上,Glean的CEO Arvind Jain讨论了企业AI初创公司面临的挑战和策略,强调了提供真正的商业价值、在人才招聘上坚持不懈以及将产品质量置于成本和速度之上的重要性。Jain还强调,由于隐私和安全问题,...

Read More
2024-03-13 talkingdev

FastV: 优化视觉语言模型效率方法开源

该项目提出了一种改善大型视觉语言模型(例如LLaVA-1.5、QwenVL-Chat和Video-LLaVA)效率的方法,解决了“低效的注意力”问题。使用FastV这种新方法,通过修剪视觉令牌和学习自适应注意力模式来优化这些模型,从而显著...

Read More
2024-03-13 talkingdev

论文:小成本实现语言模型部分窃取

据报道,使用公共API即可窃取闭源语言模型的部分内容,例如嵌入层。这项技术只需不到2000美元的预算即可实现。

Read More
2024-03-08 talkingdev

小型基准测试:用更少的示例评估LLM

评估语言模型通常采用手动策划的基准测试。其中一些基准测试非常大,有些超过14k个示例,这导致评估成本和噪声很高。这项工作表明,您可以可靠地评估流行基准测试中的语言模型性能,只需使用100个示例即可。

Read More
2024-03-05 talkingdev

聚合器的AI风险

互联网使出版和分发成为零边际成本的活动。它创造了一个丰富的新世界,但它也创造了一种新的权力,赋予那些有能力理解这种丰富性的人一种新的权力。让任何人都可以发布,没有进一步分散权力,而是新的力量出现来控制...

Read More
  1. Prev Page
  2. 15
  3. 16
  4. 17
  5. Next Page