漫话开发者 - UWL.ME

2023-11-09 talkingdev

使用Manifold Markets的5000个问题测试GPT-4的准确性，结果显示它的预测存在过度自信现象

近日，一项使用Manifold Markets的5000个问题测试GPT-4准确性的研究结果显示，GPT-4在预测时存在过度自信的现象。研究人员发现，GPT-4所给出的答案在很多情况下都是正确的，但其自信度却远远超过了正确率。这种过度...

2023-11-09 talkingdev

受 Actor 框架的启发，这个轻量级的 Python 库使得创建基于 LLM 动力的代理变得非常容易。Langroid 多智能体编程框架（Langroid multi-agent programming framework）最近发布了他们的 GitHub Repo，使得该项目的开...

2023-11-09 talkingdev

CogVLM-17B是一个开放式的视觉语言模型，具有100亿视觉参数和70亿语言参数。该模型在许多标准基准测试中表现出色，并在人类评估中表现良好。CogVLM-17B的性能优于以往的模型，将为计算机视觉和自然语言处理领域的发...

2023-11-09 talkingdev

OVIR-3D是一项创新技术，可以通过2D图像融合实现从文本提示中检索3D对象，无需3D数据训练，从而实现即时实时搜索功能，非常适合机器人应用。该技术的最新成果是在GitHub上发布了代码库，使更多开发者可以在其应用中...

2023-11-09 talkingdev

DARE方法可以简化语言模型（如BERT）的增强过程，允许将新功能集成到统一模型中，从而在各种语言任务中提高效率。

2023-11-09 talkingdev

PixArt是一种新的文本到图像模型，它使用T5文本编码、交叉注意力和扩散变压器，以比可比模型低得多的计算成本取得了出色的结果。这种新模型使用Transformer扩散模型，可以比使用UNet模型训练快90%。PixArt模型的训练...

2023-11-09 talkingdev

跨视角训练（SCT）可以提高小型语言模型的性能，使其能够生成先前仅可由较大模型实现的句子嵌入，从而优化性能和计算效率。

2023-11-09 talkingdev

YouTube正在测试其高级订阅服务中的新生成AI功能。这些功能包括一个对话工具，可用于提问有关内容并获得推荐，另一个工具可用于总结评论主题。