近日,WizardLM团队利用他们的Evol instruct技术显著提升了Llama代码的性能,甚至击败了Phind模型。此次成果尽管受到一些质疑,因为他们生成的指令直接提升了评估分数,而未使用固定的数据集,也没有把评估视为固定...
Read More科研人员已经开发出一种名为CALM的新测试,用来检查AI语言工具是否存在偏见。他们从不同的来源收集了大量的数据,并测试了各种AI模型,结果发现一些大型AI模型的偏见可能比较小的模型更严重。这一发现对于AI领域的研...
Read More苹果公司最新的研究成果在3D物体重建这一具有挑战性的问题上展现了惊人的性能。这项名为FineRecon的新技术,利用深度感知前馈网络,将2D图像转化为精细的3D模型。这一突破性的技术有望在许多领域得到应用,包括虚拟...
Read MoreDeepSpeed是微软推出的一个库,可以用来扩大语言模型的预训练。虽然使用起来有些复杂,但它提供了强大的抽象功能。微软最近添加了序列并行性,可以训练具有更长上下文长度的模型。这并不是一个新的突破,而是对开源...
Read More拥有海量高质量内部数据的公司已发布了精调版Llama,它在编码方面的能力非常高。这是在Meta发布其新的编程语言模型后的几天内完成的。重要的是要注意,当前GPT-4的版本在编码方面仍然优于任何开源模型。本文将新的Ll...
Read More近日,GitHub平台上发布了一个名为AutoML的网络应用程序。该应用程序是用于训练机器学习管道的工具,它采用了MLJAR AutoML技术。通过这款应用程序,用户可以更方便、快捷地对各种机器学习模型进行训练,无需深入了解...
Read More近日,一款新的工具引发了业界的广泛关注。这款工具可以自动化gpt-3.5-turbo的调优过程,用户只需一键操作,即可使用本地磁盘上的文件进行调优。这一技术的出现无疑为大数据处理和人工智能的发展带来了新的可能性。...
Read More本文探讨了为何现有的大型语言模型(LLMs)不太可能导致人工通用智能(AGI)的发展,以及为何物理学本身将阻止我们从现在的状态突然跃升到AGI。当前的LLMs,虽然在某些方面已经取得了显著的进步,但是在理解和推理的...
Read More