漫话开发者 - UWL.ME 精选全球AI前沿科技和开源产品
2023-08-17 talkingdev

强化学习:微型故事模型的对齐工具

强化学习可能是当前对齐大型语言模型(甚至视觉模型)最好的工具。然而,当你需要大量的人类数据来训练一个奖励模型时,这就成为了一项挑战。如果你可以只使用“提示”呢?这是RLCF(强化学习计算框架)趋势的又一绝佳...

Read More
2023-08-16 talkingdev

ChatGPT能成为内容审核员吗?

OpenAI,ChatGPT的创造者,一直在使用其最先进的大型语言模型来执行公司的内容政策。对于诸如令人不安的内容、欺诈以及滥用等问题,OpenAI正在使用ChatGPT来进行自动化处理。然而,该技术仍有其局限性。在某些情况下...

Read More
2023-08-15 talkingdev

大型语言模型的日常应用

本文介绍了在编码或专业工作之外,大型语言模型的日常应用。这些应用包括将模型用于整理购物清单、总结书籍笔记、查询字典、将任务转化为子任务以及作为编辑器。文章还介绍了一些大型语言模型不太适用的方面,如生成...

Read More
2023-08-14 talkingdev

吴恩达谈论LLM世界模型的认知能力

最近的研究表明,像Othello-GPT这样的大型语言模型(LLM)能够构建世界模型,这意味着它们在一定程度上理解了世界。该网络通过在没有明确游戏规则的情况下对游戏动作进行训练,识别出了基础的8x8棋盘结构和游戏规则...

Read More
2023-08-10 talkingdev

Magentic:轻松集成LLM到你的Python代码

Magentic是一款强大的工具,它可以帮助开发者轻松地将大型语言模型(LLMs)集成到Python代码中。Magentic的特点在于,它将提示模板处理为函数,使用类型注释来指定结构化输出。然后,您可以无缝地将LLM查询和函数调...

Read More
2023-08-10 talkingdev

SimplyRetrieve开源:整合私人数据至LLM可保护隐私

大型语言模型(LLMs)的助力下,生成式AI系统取得了显著的发展。GitHub近日发布的开源工具SimplyRetrieve,为用户提供了一种易用的方法,可以通过使用检索中心生成(Retrieval-Centric Generation)方法,将私人数...

Read More
2023-08-09 talkingdev

评估大型语言模型作为代理的能力:AgentBench工具

该项目引入了AgentBench,一个用于测试大型语言模型(LLMs)在各种交互环境中的基准工具。在对25个LLMs进行的初步测试中,结果显示商业模型的表现超过了开源模型。这项研究为我们理解和评估大型语言模型的交互性能提供...

Read More
2023-08-09 talkingdev

Humanscript开源:自然语言命令解释器新篇章

Humanscript是一种脚本解释器,利用大型语言模型推断自然语言编写的命令背后的含义。这种解释器的出现,开启了人机交互新纪元,让机器更好地理解并执行人类的语言命令。Humanscript的最大特点在于,它能够理解并执行...

Read More
2023-08-08 talkingdev

MM-Vet:多模态LLMs测试工具

MM-Vet是一种新的工具,用于测试大型语言模型(LLMs)处理涉及图像和文字的任务的能力,例如从照片中解决数学问题或解释图片中的笑话。这种工具的出现,为我们提供了一个全新的角度去评估和理解LLMs在图像和文字处理方...

Read More
2023-08-07 talkingdev

论文:利用LLM技术提升婴儿级语言模型的性能

最近,一篇论文的作者们开发出了一种名为“共思”的方法,该方法利用大型语言模型来提高较小的“婴儿级”模型的训练效果。他们通过重新处理GPT-3.5-turbo的数据集,并以RoBERTa的方式训练较小的模型,使得该模型在语言测...

Read More
  1. Prev Page
  2. 31
  3. 32
  4. 33
  5. Next Page