漫话开发者 - UWL.ME 精选全球AI前沿科技和开源产品
2023-06-21 talkingdev

需要去重大量数据吗?

AI模型的训练数据质量对于获得良好性能非常重要。在代码模型中,数据去重往往非常重要。对于文本而言,目前尚不清楚它是否同样重要。然而,无论如何,本博客介绍了用于去重文本样式数据的技术。

Read More
2023-06-19 talkingdev

Meta计划提供免费的商业AI模型

Meta计划提供免费的商业AI模型,这是一个战略性举措,可能会对其竞争对手Google和OpenAI施加压力。Meta希望通过使AI更易于开发者使用来使其商品化,这可能会使Google和OpenAI难以保持竞争优势。

Read More
2023-06-07 talkingdev

RedPajama 7B模型完成训练

## 新闻概要: - RedPajama数据集与部分训练模型已于几周前发布。 - 7B模型在3000台V100上刚刚完成训练。 - 经过调整的版本是其规模中最有效的开放模型之一。 - 团队有很多关于持续模型开发的计划。 ## 新闻内容:...

Read More
2023-06-05 talkingdev

开源项目:AWQ技术让大型AI模型更小更快

最近,一篇名为“Activation-aware Weight Quantization (AWQ)”的论文在GitHub上开源。这篇论文提出了一种新的方法,可以更高效地压缩大型语言模型(LLMs),克服了高硬件要求和慢速令牌生成的问题。AWQ可以选择性地...

Read More
2023-06-01 talkingdev

竞相研发更小的人工智能

近日,BabyLM挑战赛成为了一项旨在开发更小但仍然有效的人工智能模型的举措。由于大型LLM模型的缺点,如更大的模型需要处理能力,而只有少数公司拥有这种能力,因此推动开发更小的AI模型已经成为了当前的趋势。 ###...

Read More
2023-05-30 talkingdev

与Samantha相遇:AI语言模型的人格化探索

近日,一项新的研究显示,AI语言模型可以模拟人类个体的行为特征,实现人格化。这意味着,只需通过一些精心构建的方法,就能够为AI语言模型赋予人类的个性。研究者采用GPT-4语言模型来构建Samantha,将其作为另一个...

Read More
2023-05-25 talkingdev

Meta AI发布新AI模型Megabyte

Meta AI提出了一种新的AI模型架构,名为Megabyte,可以在多个格式上生成超过100万个标记。Megabyte解决了当前模型中的可扩展性问题,并并行执行计算,提高了效率并优于Transformers。 ## 核心要点: 以下是这篇新...

Read More
2023-05-23 talkingdev

CoDi:通过可组合扩散实现任意生成

科技新闻:研究人员引入了一种独特的AI模型——可组合扩散(CoDi),它可以基于任何组合的输入生成任何混合输出类型,如语言、图像、视频或音频,这使它与传统的AI系统有所不同。尽管许多输入输出组合缺乏训练数据,但...

Read More
2023-05-23 talkingdev

英特尔发布Aurora GenAI,挑战ChatGPT

英特尔宣布推出Aurora GenAI,这是其与ChatGPT等AI模型竞争的产品,拥有高达1万亿个参数。该模型旨在应对复杂任务,承诺提升对话、翻译、摘要和编码能力。这是英特尔宏伟的AI战略的一部分,得到了学术和研究机构的合...

Read More
2023-05-19 talkingdev

ChatGPT与开源AI模型在更难的任务上的对比

据微软GitHub笔记本显示,ChatGPT在更复杂的任务上与开源AI模型的表现进行了比较。这份包含代码和详细分析的文档,为每个模型的优劣势提供了深入的了解,提供了对它们能力的细致理解。 ## 主要内容 以下是本文的三...

Read More
  1. Prev Page
  2. 21
  3. 22
  4. 23
  5. Next Page