漫话开发者 - UWL.ME

2024-06-20 talkingdev

TroL-高效大型语言和视觉模型开源

近日，一种名为TroL的新型高效大型语言和视觉模型 (LLVMs) 在GitHub上发布，其模型规模分别为18亿、38亿和70亿参数。这些模型能够精确地处理和理解大量的语言和图像信息，其性能和效率都达到了非常高的水平。这些模...

2024-06-20 talkingdev

决策QA是LLMs的一项新任务，它能够基于复杂的数据分析来确定最佳的决策。在传统的决策制定过程中，我们需要人工对大量数据进行分析，这不仅耗时耗力，而且可能由于人为因素导致决策的偏差。而现在，LLMs的出现，让决...

2024-06-20 talkingdev

Logit Lens方法已经得到了增强，该方法通过分解logit输出，帮助我们理解Transformer模型的决策过程。这种方法使用“prisms”来处理残差流，注意力层和MLP层，揭示了这些部分如何影响预测，并为gemma-2b模型执行的诸如...

2024-06-20 talkingdev

微软最近发布了一套名为Florence-2的MIT许可的小型视觉语言模型（VLMs）。这套模型在图像标注、边界识别和分类等任务上，表现出色，大大超过了许多体型更大的模型。Florence-2模型的发布，标志着微软在人工智能和机...

2024-06-20 talkingdev

Roblox正在构建向4D生成AI的技术，这一技术超越了单一的3D对象，实现了动态交互。解决4D的挑战将需要在外观、形状、物理和脚本等多个方面进行深度理解。早期为4D系统打下基础的工具已经在平台上加速了创新的步伐。Ro...

2024-06-20 talkingdev

苹果在其全球开发者大会（WWDC）上揭示了其在AI领域的战略定位，重点关注隐私和安全，并在其私有云中使用自家芯片和零信任架构。苹果的AI整合了OpenAI的ChatGPT，用于超出其范围的任务，其商业模式可能让AI供应商为...

2024-06-20 talkingdev

Ilya Sutskever近日成立了Safe Superintelligence Inc. (SSI)。这是一家专注于开发安全且强大的人工智能系统的创业公司。此公司的主要目标是开发出可以在没有商业压力影响下运行的AI系统。因此，SSI的成立被看作是对...

2024-06-20 talkingdev

在21世纪初期，使用消息队列构建分布式系统的热潮十分高涨。然而，近年来这一趋势似乎有所消退。其中一个原因是，许多公司意识到他们规模相对较小，不需要这些所谓的“可扩展性技巧”。随着更大性能的单机设备以更合理...