在接受《时代》杂志的采访中,Meta的AI首席科学家Yann LeCun谈到了人工通用智能(AGI)、开源和AI风险等话题。LeCun表示,AI的发展是一个长期过程,要实现AGI需要克服许多技术和理论上的限制,但是这是一个值得追求...
Read MoreDesign2Code是一个开源项目,它可以将各种Web设计格式,包括草图、线框图、Figma和XD,转化为干净响应式的HTML/CSS/JS代码。该项目旨在简化设计师和开发人员之间的协作,提高开发效率。通过Design2Code,设计师可以...
Read MoreGenTranslate是一种新的方法,它利用大型语言模型来提高翻译质量。它专注于基础模型生成的最佳翻译。该方法在测试中已被证明优于当前领先的翻译模型。
Read More最近,一家科技公司发布了一个训练端到端控制策略的代码库,用于使用深度强化学习训练无人机控制策略。该训练在模拟环境中进行,可以在消费级笔记本电脑上在几秒钟内完成。训练出的策略具有通用性,可以部署在真实的...
Read MoreWebLinx是一个包含10万个基于对话格式的网络交互的数据集。它的发布是为了改善基于语言模型导向的网络导航的研究。该数据集包括对话、URL、HTML和屏幕截图。它由Carnegie Mellon大学的研究人员发布,已经开源。这个...
Read More苹果推出了一款名为MGIE的开源AI模型,用于图像编辑,使用多模态大语言模型来解释文本指令并执行像素级编辑。这种模型可以将人类语言翻译成图像编辑操作,例如“使图像更亮”或“添加红色滤镜”。苹果表示,MGIE的目的是...
Read MoreMeta的首席AI科学家Yann LeCun于周日因其对人工智能世界的贡献而获得了TIME100影响力奖。在颁奖典礼前,LeCun与TIME进行了对话,讨论了实现人工通用智能的障碍、Meta开源方法的优点以及AI可能对人类造成存在风险的说...
Read MorePhidata是一个使用函数调用构建AI助手的工具包。它不仅可以帮助开发者更快地构建AI助手,还可以通过模块化设计轻松扩展其功能。Phidata基于Python语言,支持各种功能,包括自然语言处理、语音识别和图像识别。它还提...
Read More近日,Point Transformer V3(PTv3)发布了,这是一个简单而高效的3D点云处理模型。与注重复杂设计的模型不同,PTv3通过注重规模和效率,实现了更快的处理速度和更好的内存效率。该模型在GitHub上开源,让广大科技爱...
Read More自然语言处理(NLP)中,让语言模型生成自己的训练数据是一个具有挑战性但前景广阔的研究领域。SPIN是一种方法,已经显示出很大的前途。该代码已经发布,但据报道使用起来很有挑战性。
Read More