漫话开发者 - UWL.ME 精选全球AI前沿科技和开源产品
2024-02-23 talkingdev

谷歌开源Gemma对抗Llama,底模基于Gemini

Google已经发布了其Gemma 2B和7B参数模型的权重,可通过HuggingFace获得。这些模型是仅解码器的Transformer,训练了2T和6T个令牌。它们在各种基准测试中都比Llama 2表现出色,并提供基础和指令调整版本。

Read More
2024-02-23 talkingdev

Reddit与AI公司签订新的训练协议,出售用户内容

Reddit已经与一家未透露姓名的大型AI公司签订了一份价值约6000万美元的许可协议,授权该公司可以访问Reddit大量的用户生成内容。Reddit表示,这项协议将帮助AI公司培训其算法,从而提高其在自然语言处理和语音识别等...

Read More
2024-02-23 talkingdev

Deno新JSR的JavaScript包注册表有哪些新进展?

JSR是Deno团队开发的新的包注册表。它与npm有几个重要的技术分歧。JSR专门为Deno构建,其内容受到控制,以防止滥用命名空间的滥竽充数和废弃模块。目前,访问JSR仍然受到等待列表的限制。

Read More
2024-02-23 talkingdev

英伟达股价狂飙,市值一日大涨2720亿美元,创单日最大涨幅纪录

英伟达在公布季度财报和销售前景超过分析师预期后,股价创下单日最大涨幅记录,公司市值上涨16.4%,增加了2720亿美元。其市值现在达到1.94万亿美元。此前,Meta在跟踪业绩预测方面表现出色并宣布首次股息后,创下了...

Read More
2024-02-22 talkingdev

VLM开源:增强AI对抗攻击的防御能力

近日,GitHub推出了一项新的方法,可以增强OpenFlamingo和LLaVA等多模型模型对视觉对抗攻击的防御能力。该方法通过无监督地微调CLIP视觉编码器,有效地保护这些模型免受恶意图像攻击,提高了它们在现实应用中的可靠...

Read More
2024-02-21 talkingdev

OpenLLMetry:完美支持 LLM 应用的开源监测工具

近日,OpenLLMetry-JS 在 GitHub 上发布,它是基于 OpenTelemetry 构建的一组扩展,可以完全观测您的 LLM 应用程序。OpenLLMetry-JS 为您提供了完整的可观测性,不仅可以实时监测您的应用程序,还可以帮助您诊断和优...

Read More
2024-02-21 talkingdev

可租用的GPU集群列表

本文提供了一份可租用的GPU集群列表,这些集群可按小时租用,提供高性能计算能力,适用于需要大量计算的机器学习和深度学习任务。以下是可租用的GPU集群列表: 1. AWS EC2 P3(美国) 2. Google Cloud Platform(欧...

Read More
2024-02-21 talkingdev

OpenRLHF开源,提供基于Ray的RLHF实现

近日,GitHub上有一个新的仓库OpenRLHF发布了。这是一个基于Ray的RLHF实现,专为Llama样式模型设计。该仓库集成了多种PPO稳定技巧,以提高性能。Ray是一款新型的分布式计算框架,它具有高效、易用等特点,支持快速构...

Read More
  1. Prev Page
  2. 71
  3. 72
  4. 73
  5. Next Page