漫话开发者 - UWL.ME 精选全球AI前沿科技和开源产品
2023-12-18 talkingdev

OpenAI-如何优化大型语言模型的效果?

本指南分享了优化大型语言模型效果的策略和技巧。这些方法有时可以组合使用以获得更好的效果。其中一些示例仅适用于最具能力的模型。获取更好效果的策略包括编写更清晰的说明、提供参考文本、将复杂任务分解成简单子...

Read More
2023-12-15 talkingdev

OpenAI与Axel Springer签署许可协议,用新闻内容训练AI模型

OpenAI与柏林出版商Axel Springer达成协议,将使用该出版商的内容来训练其生成式AI模型,并将最近由Axel Springer发布的文章添加到ChatGPT中。这项协议将使OpenAI的AI模型能够更好地理解新闻内容和语言,从而提高其...

Read More
2023-12-15 talkingdev

微软轻量可部署本地的语言模型Phi-2发布

微软的最新模型现已在HuggingFace上提供研究用途。Phi-2是一种基于Transformers的语言生成模型,它被训练用于生成各种文本,包括问答、对话和自然语言生成。该模型采用的是自回归模式,即在生成下一个单词或字符时,...

Read More
2023-12-15 talkingdev

HyperRouter方法开源,提高LLM训练效率

HyperRouter方法提高LLM训练效率。该方法通过动态调整路由器参数,进一步提高了大型语言模型训练的效率。

Read More
2023-12-15 talkingdev

论文:一种高效压缩LLM模型方法

这项研究介绍了一种使用降阶建模压缩大型语言模型的方法,可以显著减少内存和时间限制,而无需高端硬件。由于大型语言模型在自然语言处理中的应用越来越广泛,因此压缩这些模型以提高计算效率变得尤为重要。研究人员...

Read More
2023-12-15 talkingdev

FIND多用途AI模型接口开源,提升图像和数据理解能力

FIND推出了一个多用途AI模型接口,使得AI模型能够更好地理解图像和数据集,而无需更改核心模型。该接口使用了一种新的嵌入对齐方法,能够将不同任务的嵌入空间对齐起来,从而提高模型的泛化能力。这一技术的研发背后...

Read More
2023-12-15 talkingdev

Gemini多模态能力初探

Gemini在各种视觉任务中比许多开放模型表现更好。它在相同任务中似乎与GPT-V竞争力十足。

Read More
2023-12-15 talkingdev

Cerebras发布gigaGPT模型训练框架

Cerebras是一家人工智能训练芯片制造商,近日发布了一个在其系统上训练大型模型的框架,名为gigaGPT。该框架非常简单易用,不需要将大型模型分割成多个GPU和节点进行训练。

Read More
  1. Prev Page
  2. 351
  3. 352
  4. 353
  5. Next Page