近日,一种名为TroL的新型高效大型语言和视觉模型 (LLVMs) 在GitHub上发布,其模型规模分别为18亿、38亿和70亿参数。这些模型能够精确地处理和理解大量的语言和图像信息,其性能和效率都达到了非常高的水平。这些模...
Read More决策QA是LLMs的一项新任务,它能够基于复杂的数据分析来确定最佳的决策。在传统的决策制定过程中,我们需要人工对大量数据进行分析,这不仅耗时耗力,而且可能由于人为因素导致决策的偏差。而现在,LLMs的出现,让决...
Read MoreLogit Lens方法已经得到了增强,该方法通过分解logit输出,帮助我们理解Transformer模型的决策过程。这种方法使用“prisms”来处理残差流,注意力层和MLP层,揭示了这些部分如何影响预测,并为gemma-2b模型执行的诸如...
Read More微软最近发布了一套名为Florence-2的MIT许可的小型视觉语言模型(VLMs)。这套模型在图像标注、边界识别和分类等任务上,表现出色,大大超过了许多体型更大的模型。Florence-2模型的发布,标志着微软在人工智能和机...
Read MoreRoblox正在构建向4D生成AI的技术,这一技术超越了单一的3D对象,实现了动态交互。解决4D的挑战将需要在外观、形状、物理和脚本等多个方面进行深度理解。早期为4D系统打下基础的工具已经在平台上加速了创新的步伐。Ro...
Read More苹果在其全球开发者大会(WWDC)上揭示了其在AI领域的战略定位,重点关注隐私和安全,并在其私有云中使用自家芯片和零信任架构。苹果的AI整合了OpenAI的ChatGPT,用于超出其范围的任务,其商业模式可能让AI供应商为...
Read MoreIlya Sutskever近日成立了Safe Superintelligence Inc. (SSI)。这是一家专注于开发安全且强大的人工智能系统的创业公司。此公司的主要目标是开发出可以在没有商业压力影响下运行的AI系统。因此,SSI的成立被看作是对...
Read More在21世纪初期,使用消息队列构建分布式系统的热潮十分高涨。然而,近年来这一趋势似乎有所消退。其中一个原因是,许多公司意识到他们规模相对较小,不需要这些所谓的“可扩展性技巧”。随着更大性能的单机设备以更合理...
Read More