DriveMLM是一种新的框架,它使用大型语言模型来提高自动驾驶的能力。这个系统将语言决策与车辆控制相结合,不仅与现有的自动驾驶系统集成,而且在模拟中表现更好。
Read MoreTransformer模型虽然强大,但是由于其不稳定性,训练起来常常会很困难。其中一个主要的问题是注意力矩阵的熵崩溃。本文介绍了一种通过简单的重新参数化来防止熵崩溃的方法。
Read MoreSnapchat为Snapchat+订阅者推出了新的AI功能,包括一个AI图片生成器,可以从文本提示中创建图片,以及一个梦幻自拍功能,可以与朋友一起创建奇幻的图片。新的AI扩展工具可以让用户自动扩展和填充照片的背景。这些功...
Read More视频理解是一个古老的领域,现在才开始获得成功。成功的主要推动因素是高质量的数据集。Meta的这项工作包括许多传感器数据源和手势。它为现有方法提供了基准性能。
Read More谷歌推出了Gemini Pro,这是其先进的AI模型Gemini Ultra的轻量级版本,在Vertex AI中公开预览,提供文本和图像处理能力以及可定制的上下文,适用于各种用例。Gemini Pro是一个快速而灵活的解决方案,可以自定义模型...
Read More本文讨论了杰夫·贝索斯最近出现在播客中,重点讨论他的领导风格和太空公司蓝色起源。贝索斯明确表示,蓝色起源需要加快速度。他已经重新调整了公司的领导层,并计划于12月18日尽快进行下一次New Shepard发射。蓝色起...
Read Morecodapi-js是一个方便快捷的工具,能够将静态代码示例转换成轻量级的小型沙盒,从而能够嵌入产品文档、在线课程或博客文章中。它可以创建任何编程语言、数据库或软件的沙盒。它大多数沙盒需要Codapi服务器,但JavaScr...
Read MoreZilla是一种多协议、事件本地代理。它通过声明式定义的无状态API,安全地将Web应用程序、IoT客户端和微服务与Apache Kafka接口。Zilla没有外部依赖项,也不依赖于Kafka消费者/生产者API或Kafka Connect。它本地支持K...
Read More