Longcontext Alpaca训练技术最近取得了重大突破,通过在H100硬件上使用新的梯度累积卸载技术,成功训练了超过200,000个上下文窗口。这种创新方法使得大规模深度学习模型的训练变得更加高效,显著提高了计算资源的利...
Read MoreOpenAI宣布推出GPT-4 Turbo,该模型融合了文本和图像处理功能,为开发者提供了一个全新的AI工具。GPT-4 Turbo的问世,意味着开发者可以通过单一模型来实现对文本和图像数据的综合处理,极大地提高了开发效率和创新潜...
Read More人工智能的发展极度依赖大量数据支持,科技公司对数据的渴求速度远超数据产生的速度,有预测指出到2026年高质量数字数据可能会耗尽。为此,像OpenAI、谷歌和Meta这样的公司正在探索获取更多数据的新方法,包括使用Yo...
Read MoreMLPerf 近日更新了其推理基准测试,新增了如 Llama 2 70B 和 Stable Diffusion XL 等大型语言模型,这一变化体现了整个行业对于大型生成型人工智能的转移。在最新测试中,Nvidia 的系统,尤其是搭载了 H200 处理器的...
Read MoreQwen团队最新力作——一个具备32B参数的AI模型,现已成功训练并对外发布。该模型在各类任务中展现出卓越的性能表现,同时其设计考虑到了内存的局限性,能够适配更为普遍的中等内存硬件系统。这意味着,即便是在资源有...
Read More近日,一项名为"Anything Unsegmentable"的创新技术问世,旨在保护数字图像不受人工智能模型的非法分割。该技术的出现,对于解决因AI技术发展而日益凸显的版权和隐私问题具有重要意义。通过防止图像被AI模型分割,可...
Read MoreOpenAI最近宣布扩大其定制模型计划,通过辅助微调和定制训练模型,帮助企业客户开发适合特定使用场景的生成式AI模型。这一服务的推出,意味着企业可以根据自己的特定需求,获得更加个性化和高效的AI解决方案。生成式...
Read More近日,GitHub上出现了一个名为Unsolvable Problem Detection (UPD)的项目,旨在探索视觉语言模型中的一个新测试,即人工智能是否能识别出某些问题是无解的。这项技术的核心在于训练AI模型,使其能够区分可解和不可解...
Read More