漫话开发者 - UWL.ME 精选全球AI前沿科技和开源产品
2024-03-20 talkingdev

苹果公司发布全新“MM1”人工智能模型细节

苹果公司近期公布了其新型人工智能模型“MM1”的详细信息。这一模型在训练大型语言模型方面采用了一种创新方法,能够无缝整合文本和视觉信息。这种整合方式有望提升AI模型在理解和处理复杂信息方面的能力,特别是在处...

Read More
2024-03-14 talkingdev

OpenAI计划今年发布文本到视频模型Sora

据报道,OpenAI计划在进行漏洞测试和设置安全防护措施后,于今年晚些时候公开发布其文本到视频模型Sora。Sora是一种能够将自然语言描述转化为视频的模型,这项技术在影视制作和游戏开发中有着广泛的应用前景。OpenAI...

Read More
2024-01-24 talkingdev

MM-Interleaved模型开源,可实现图文数据生成

近日,GitHub开源了MM-Interleaved模型,该模型在处理和生成交替的图文数据方面表现出色。MM-Interleaved模型能够根据输入的文本描述生成对应的图像,同时也可以从图像中提取文本。该模型使用了条件生成对抗网络(Co...

Read More
2024-01-23 talkingdev

HuggingFace开源数据过滤库Datatrove

HuggingFace发布了Datatrove,这是一个用于过滤大型文本数据集的库。它具有许多有用的原语和用于文本过滤的完整并行管道。可在C4中使用Gopher质量过滤器的示例。

Read More
2024-01-16 talkingdev

图像压缩法可以压缩文本内容

图像压缩算法通常能够找到图像中的模式并将其压缩,而现在看起来它们也是压缩ASCII文本的一种有效方法。这种方法的实质是将文本数据编码成一张图片,通过图像压缩的方式来实现文本的压缩。这种方法在一些特定场合下...

Read More
2023-12-13 talkingdev

BioCLIP:专为生物应用设计的视觉模型

近日,研究人员开发出了一种专门为生物应用设计的视觉模型BioCLIP。实验结果显示,在特定的生物任务上,BioCLIP的表现比OpenAI的clip高出近20%。此外,BioCLIP还提供了一个由1千万对图像和文本构成的训练集。 事实...

Read More
2023-11-03 talkingdev

用于RAG、微调和模型服务的开源工具包

最近,一家开发团队发布了一个名为“LLM Toolkit”的开源Python工具包,用于构建基于RAG的语言模型生成应用程序。它提供了快速的RAG微调、模型训练和服务脚本,同时支持多种文本数据输入和输出格式。该工具包的代码已...

Read More
2023-10-20 talkingdev

DALLE-3研究论文: 合成语句生成器、改进的建模以及提升的测量方法

DALLE-3研究论文揭示了其惊人性能的主要成分,包括合成标题生成器、改进的潜在扩散建模以及提升的忠实度、风格和连贯性测量方法。DALLE-3是一种生成式模型,具有非常出色的生成图像的能力,其原理是通过大量的图像和...

Read More
  1. Prev Page
  2. 3
  3. 4
  4. 5
  5. Next Page