漫话开发者 - UWL.ME 精选全球AI前沿科技和开源产品
2024-05-01 talkingdev

语言模型中的Meta-Prompting技术

Meta-Prompting是一种能够将单个语言模型转化为多技能团队的技术。这种方法将复杂的任务分解为更简单的部分,由同一模型的专门实例处理,从而在各种任务中显著提高性能。在这种情况下,一个语言模型可以被看作是一个...

Read More
2024-04-30 talkingdev

基于Svelte和Three.js的3D框架在Web上展示

近日,一款基于Svelte和Three.js的3D框架在Web上展示,该框架名为Show HN。这个框架的创作者表示,Show HN框架的主要目的是为了提供一个易于使用、高性能的3D解决方案,让开发人员可以更容易地创建出各种惊人的3D应...

Read More
2024-04-28 talkingdev

MaxText:谷歌开源高性能机器学习模型

MaxText是一个高性能、高可扩展性的开源低级机器学习模型(LLM),完全使用Python/Jax编写,目标是在Google Cloud的TPUs和GPUs上进行训练和推理。这个项目在GitHub上公开,充分展示了其强大的功能和优秀的性能。MaxTex...

Read More
2024-04-24 talkingdev

WebGPU marching cubes:在浏览器中以原生速度运行的GPU计算

由于WebGPU标准的不断完善,现在可以在浏览器中进行高性能的GPU计算。最近,一组研究人员开发了一种基于WebGPU的算法,称为 'marching cubes',用于在浏览器中进行实时体积渲染。这项技术可以将三维图形数据转换为表...

Read More
2024-04-23 talkingdev

JEDEC发布DDR5内存规格,速率可达8800MT/S,增加抗Rowhammer特性

JEDEC(电子设备行业协会)已经发布了DDR5内存规格,其中包括DDR5-6400和DDR5-8400等速率级别,最高速率可达8800MT/S。同时,DDR5规格还增加了抗Rowhammer特性,这是一种攻击DDR内存的技术。DDR5内存将在未来几年内...

Read More
2024-04-22 talkingdev

Penzai: 用于构建、编辑和可视化神经网络的JAX研究工具包

在人工智能领域,神经网络是一种非常重要的模型。为了提高神经网络的性能,研究人员需要使用高效的工具来构建、编辑和可视化这些网络。近日,谷歌发布了名为Penzai的JAX研究工具包,旨在帮助研究人员更轻松地完成这...

Read More
2024-04-12 talkingdev

JetMoe:性能媲美Meta Llama 2 7B的AI模型,成本仅为10万美元

JetMoe是一个基于混合专家模型的新AI系统,通过使用公共数据集和合理的计算资源进行训练,其性能与Meta的Llama 2 7B模型相媲美,但成本仅为10万美元。这一突破性的技术成果不仅展示了在不牺牲性能的前提下降低AI模型...

Read More
2024-04-08 talkingdev

Cohere发布Command R+:面向企业的可扩展大型语言模型

Cohere公司近日推出了Command R+,这是一款专为企业级应用场景设计的高性能、可扩展的大型语言模型(LLM)。Command R+具备先进的检索增强生成功能,并支持引用,同时覆盖10种关键语言的多语言处理能力,以及工具使...

Read More
  1. Prev Page
  2. 32
  3. 33
  4. 34
  5. Next Page