Nvidia最近发布了一个新的工具包,可以对CUDA状态进行检查点设置,以便于传输和重启。这一工具包在GitHub上公开,对于大型AI模型的分布式训练非常有用。CUDA状态的检查点设置可以在训练过程中保存模型的状态,以便在...
Read More苹果公司近期积极扩大其人工智能能力,从谷歌公司挖来了众多AI专家,并在瑞士苏黎世秘密设立了一个AI研究实验室。这个被称为“视觉实验室”的研究机构,专注于开发能集成文本和视觉输入的先进AI模型。这一系列举措标志...
Read MoreMoondream 2模型作为一种高效的AI模型,其性能强大且体积小巧,现已发布其全功能的VLM可执行文件,名为llamafile。这款全功能的VLM可执行文件是一种完全自包含的程序,可以在边缘设备上运行。这意味着,即使在没有网...
Read More近期有研究者开发出一种被称为AAPL的新方法。它的主要功能是通过使用对抗性标记嵌入来增强AI模型识别未知物体的能力。这种方法的提出,将有利于AI在面对新物体时更好地进行识别和处理,进一步提高AI的适应性和灵活性...
Read More2024年3月的最后一周,开源大型语言模型(LLMs)迎来了一次重要的时刻。包括Databricks的DBRX,A21 Labs的Jamba和SambaNova Systems的Samba-CoE在内的多款模型相继发布。这些发布标志着开源AI模型多样化和普及化的关...
Read More由AI驱动的编码平台Augment已经从商业保密状态中启动,并且获得了2.52亿美元的融资,使该公司的估值接近9.77亿美元。该平台由前微软开发者Igor Ostrovsky创立,旨在使用先进的AI模型提高软件质量和生产力。Augment计...
Read More人工智能模型生成的错觉现象,即AI模型产生看似合理但实际错误的输出,为我们带来了巨大的挑战,当前的技术无法完全解决这个问题。这些问题源于生成型人工智能的基本设计,它依赖于识别数据中的模式,但缺乏对真实的...
Read More近日,一款名为CFExplainer的新工具引起了行业的广泛关注。该工具主要是用于提升AI模型,特别是图神经网络在理解和识别软件安全漏洞方面的能力。图神经网络的出现,让我们能够更加有效地处理和分析结构化数据,尤其...
Read More