漫话开发者 - UWL.ME 精选全球AI前沿科技和开源产品
2023-11-02 talkingdev

微软通过重大突破推动小型AI模型的界限

微软研究院已在其较小的语言模型Phi 1.5上增强了多模态能力,使其能够像OpenAI更大的GPT-4模型一样解释图像,但计算成本更低。Phi 1.5模型结合了文本和视觉信息,可以推断出对应的文本或图像。该模型在多个数据集上...

Read More
2023-11-01 talkingdev

OpenAI联合创始人Ilya Sutskever:如何防止超级智能的失控

OpenAI的联合创始人兼首席科学家Ilya Sutskever已经把注意力从构建下一个GPT模型转向了如何避免未来人工超级智能出现不良行为。他认为,人工智能超越人类智能的现实已经迫在眉睫,并预计这将促进人类和人工智能融合...

Read More
2023-11-01 talkingdev

论文:深度解析医学视觉问答,GPT-4与视觉的结合

该研究主要评估了GPT-4与视觉(GPT-4V)针对来自多种来源的医学图像(如X光和CT扫描)提出的问题的回答能力。这是一项极具挑战性的任务,它需要深度的医学知识和高级的视觉理解能力。GPT-4V作为一种尖端的人工智能技...

Read More
2023-11-01 talkingdev

Phind称其模型打败GPT-4,速度等同于GPT-3.5,支持16k上下文编码

据最新消息,Phind模型在编码方面的表现已经超过了目前最强的GPT-4。该模型支持16k上下文编码,在编码速度上也不逊于GPT-3.5。Phind模型是一种基于自然语言处理技术的编码器,可以用于编写各种程序代码。该模型采用...

Read More
2023-10-31 talkingdev

HF团队成功复现OpenAI的第一个RLHF代码库

HuggingFace团队成功复现了OpenAI的第一个RLHF代码库,该代码库于2019年发布,是引入了一些最初的RLHF(强化学习与人类因素)想法。这个代码库被称为“Generative Pretraining Transformer(GPT)”。通过在计算机上训...

Read More
2023-10-31 talkingdev

AMD发布第二轮训练,为大型语言模型训练提供更强的支持

MosaicML发布了一篇关于使用AMD GPU进行大型语言模型训练的文章。该公司在本文中介绍了他们的最新研究结果,使用AMD Radeon Instinct MI100 GPU对GPT-2、GPT-3和T5等大型语言模型进行了训练。结果显示,使用AMD GPU...

Read More
2023-10-31 talkingdev

微软研究小组开放GPT-3.5-turbo,参数达到20B

微软研究小组在一篇论文中提到,GPT-3.5-turbo(ChatGPT背后的模型)是一个具有20B参数的模型,该小组研究扩散模型用于代码。据称原始模型的参数为175B,因此可能进行了重新训练或蒸馏。

Read More
2023-10-27 talkingdev

GPTPilot:用AI编写可扩展应用程序的开发工具

GPT Pilot是一种AI驱动的开发工具,可以从零开始编写可扩展的应用程序。它可以让开发人员使用所需应用程序的描述来创建应用程序。GPT Pilot会逐步创建应用程序,当遇到难题时,会询问开发人员以获得澄清或帮助。仓库...

Read More
  1. Prev Page
  2. 52
  3. 53
  4. 54
  5. Next Page