该研究介绍了一种新的技术,专注变压器,这种技术可以帮助AI模型在处理大量数据的情况下,记住并专注于相关的信息。该方法改进了AI如何理解和使用长篇的文本,他们在OpenAI的模型上的测试显示了这一点。专注变压器的...
Read More美国国防部正在成功地测试用于军事任务的大型语言模型(LLMs),旨在加速数据请求并生成新颖的解决方案。五角大楼正在与像Scale AI这样的科技初创公司合作,实验五个LLMs。这是他们在军事领域中更广泛的数据整合和数...
Read More谷歌正在梅奥诊所测试其AI工具——Med-PaLM 2,这是一款专为解答医疗信息查询而设计的工具。作为语言模型PaLM 2的一个变种,Med-PaLM 2在推理、达成共识的答案和理解方面展现出了令人鼓舞的结果,尽管在准确性上还存在...
Read MoreDragonDiffusion是一种全新的方法,旨在提高文本到图像模型的编辑精度。通过在扩散模型中利用特征对应,DragonDiffusion可以进行各种详细的图像修改,如移动和调整对象的大小,替换外观,以及拖动内容,同时保持图像...
Read More近日,InternLM在GitHub上公开了一款专为实际场景设计的基础聊天模型。该模型拥有7亿的参数,可广泛应用于各种实际场景,如客户服务、在线咨询等。InternLM的这款模型采用了先进的深度学习技术,能够理解和回应用户...
Read More最近一份技术报告详细介绍了FLACUNA,这是一种可以提高问题解决能力的语言模型。FLACUNA是通过使用一个名为FLANMINI的自定义指令数据集对VICUNA进行微调而创建的,VICUNA是另一种大型语言模型。FLACUNA的出现,对于...
Read More本论文介绍了HIPIE,一种新颖的图像分割方法,通过将不同的语义层次纳入其学习过程中,解决了复杂场景下的图像分割问题。它在各种图像理解任务中表现优于现有模型,为不同情境下的分割任务提供了统一的解决方案。
Read More我们之前在新闻通讯中提到过这个项目,但它刚刚进行了升级。受到Andrej的优秀NanoGPT项目的启发,NanoT5项目可以以比T5论文性能更快150倍的速度训练模型。如果你关心从头开始训练模型,那么这个项目绝对值得一看。
Read More