模型的相关内容 - 漫话开发者

2024-03-13 talkingdev

论文：小成本实现语言模型部分窃取

据报道，使用公共API即可窃取闭源语言模型的部分内容，例如嵌入层。这项技术只需不到2000美元的预算即可实现。

2024-03-13 talkingdev

物理智能公司（Pi）已经从隐蔽状态中浮出水面，获得了7000万美元的种子融资。该公司由一群知名的机器人和人工智能专家创立，旨在开发基础模型和学习算法，为各种机器人和具有物理驱动装置的设备提供动力。

2024-03-13 talkingdev

Cognition发布了一款名为Devin的新系统，该系统在测试AI编写代码能力的挑战性基准测试SWE-Bench上获得了14%的分数，而GPT-4则只得到了1.7%。该模型显示具有强大的上下文学习能力。

2024-03-13 talkingdev

Transformer Debugger是一种工具，它通过将自动可解释性技术与稀疏自动编码器相结合，支持对小型语言模型的特定行为进行调查。

2024-03-13 talkingdev

本文介绍了Meta的两个版本的24,576 GPU数据中心规模集群的详细信息。这些集群支持公司当前和下一代AI模型以及GenAI和其他领域的AI研究和开发。Meta的长期愿景是建立一种人工智能，这种人工智能是开放的，建立在可负...

2024-03-12 talkingdev

互联网档案馆拥有超过2亿个OCR图书页面，可供研究使用。该数据集可用于文本识别、自然语言处理、信息检索等多个领域的研究。研究人员可以使用该数据集进行模型训练、语言建模、数据分析等工作。该数据集的发布将加速...

2024-03-12 talkingdev

人工智能控制界面（AICI）使您能够构建控制器，以实时约束和指导大型语言模型的输出。通过AICI，用户可以使用自己的约束条件或限制来约束模型的输出，同时还可以通过实时反馈来调整约束条件，从而实现更好的模型输出...

2024-03-12 talkingdev

VideoElevator引入了一种新的方法，通过利用文本到图像模型的优势来增强文本到视频扩散模型。这种即插即用的方法将增强过程分为了调整时间运动和提升空间质量两个部分，从而产生了帧质量和文本对齐得到了提高的视频...