LLM的相关内容 - 漫话开发者

2024-04-07 talkingdev

多Agent协同：LLMs随着Agent数量的增加而性能扩展

研究人员发现，当涉及到复杂的任务时，使用更多的代理人可以显着提高LLMs的性能。这项研究的结果表明，LLMs的性能随着代理人数量的增加而线性扩展。这是因为更多的代理人可以提供更多的观察和决策，使LLMs更好地理解...

2024-04-04 talkingdev

近日，知名浏览器Opera推出了一项创新功能，使用户能够在本地计算机上下载并运行大型语言模型（LLMs）。目前，该功能提供了超过150种不同的模型，涵盖50多个家族，为用户提供了前所未有的便利和灵活性。这些模型可以...

2024-04-02 talkingdev

微软在其广受欢迎的大型语言模型（LLMs）、向量数据库、提示技术以及低代码应用课程的基础上，发布了第二版的课程内容，现已上线GitHub。该课程共包含18课，虽然部分内容具有前瞻性，但依然是踏入该领域的良好起点。...

2024-04-02 talkingdev

尽管RPA（机器人流程自动化）在早期取得了一些成功，但其在企业范围内的部署并没有达到预期效果。德勤的一项调查显示，仅有3%的公司能够成功扩大其RPA项目规模。然而，人工智能的最新进展有望改变这一现状。大型语言...

2024-04-01 talkingdev

EvoEval是一套全新的基准测试工具，专为评估大型语言模型（LLMs）的编码能力而设计。该测试套件采用了比以往更加严格的测试标准，以确保对LLMs编程能力的全面检测。EvoEval的发布意味着开发者和研究人员现在可以更准...

2024-03-29 talkingdev

谷歌发布了一份数据集和基准测试，用以展示各语言模型生成事实信息的能力。本报告深入分析了如何提升模型的真实性，并揭示在多数情况下语言模型胜过人类注释者。这一发现不仅对技术领域产生重大影响，也对如何使用人...

2024-03-28 talkingdev

语言模型（LLMs）的实用性在于其速度、准确性以及遵循指令的能力。这三个特性使得通过文本输入控制的街头霸王模拟器成为了衡量不同模型在这三个方面表现的绝佳方式。GitHub上的一个项目通过这种方式为LLMs提供了一个...

2024-03-27 talkingdev

近期，由Anthropic开发的最新人工智能模型Claude-3在高级认知任务上的表现超越了普通人类智商，并且在某些领域胜过了业界知名的GPT-4模型。然而，尽管在这些复杂任务上表现出色，Claude-3在处理一些人类认为简单的谜...