最近,研究人员在文本转图像(T2I)领域中推出了一种新的方法,称之为“无需提示的扩散”。这种系统只依靠视觉输入生成图像,无需任何文本提示。其利用了一种称为“语义上下文编码器(SeeCoder)”的独特结构来解释参考...
Read More苹果公司或许是消费级人工智能的潜在领导者,虽然他们从未明确提及过AI技术,但在以下几个方面表现出色: - **变压器键盘**:苹果公司新推出的MacBook Pro配备了变压器键盘,这意味着每个键都有自己的处理器,可以...
Read More## 新闻内容: - 虽然这个领域正在快速发展,但生成式机器学习的基础已经相当稳固。 - 这个由9部分组成的课程涵盖了很多内容,适合对该领域感兴趣的人学习。 - 最终目标是将新用户引入他们的ML云产品Vertex。即使如...
Read More最近,一篇名为“Activation-aware Weight Quantization (AWQ)”的论文在GitHub上开源。这篇论文提出了一种新的方法,可以更高效地压缩大型语言模型(LLMs),克服了高硬件要求和慢速令牌生成的问题。AWQ可以选择性地...
Read MoreLance是一种现代的机器学习数据格式。它提供了更快的随机访问、向量索引、数据版本控制等功能。Lance支持pandas、duckdb、polars和pyarrow等工具,可用于构建搜索引擎和特征库、大规模机器学习训练,以及存储、查询...
Read More最近MosaicML MPT模型仍然备受欢迎。其中一个重要的贡献是“Storywriter”模型,它可以在上下文中使用高达65k个标记。但是,使用这个模型进行推理非常缓慢。通过添加键/值缓存,我们可以将生成速度提高近10倍。 ## 内...
Read More最近的一项研究引入了一种开创性的方法,其中大型人工智能(AI)语言系统(LLMs)不仅被训练使用工具,还可以创建自己的工具以更有效地解决问题。这些LLMs开发了自己的“实用函数”,就像小型软件工具包一样,可以用于...
Read More今天,我们向大家介绍一个名为Threestudio的开源项目。这个项目采用了先进的2D文本到图像生成模型,从文本提示、单张图像和少量样本图像中创建3D内容的统一框架。 以下是该框架的三个核心要点: - Threestudio利用...
Read More