本文作者根据模型扩展的进展修改了其人工智能时间表预测。他们现在估计,到2028年有10%的机会实现人工智能通用智能,并且到2045年有50%的机会。这些变化归因于大型语言模型的有效性以及多个智能能力可能会在规模上出...
Read More机器学习工程开源书籍发布,该项目是一个开放的方法论集合,旨在帮助成功训练大型语言模型和多模态模型。该材料适用于LLM/VLM培训工程师和运营人员。书籍包含大量脚本和复制粘贴命令,以使读者能够快速解决问题。该...
Read More最近,一种名为DoraemonGPT的新型AI系统基于大型语言模型取得了重要进展,它聚焦于视频任务,提升了对于动态现实场景的理解。DoraemonGPT将视频转换为符号记忆,以进行高效的时空查询,并利用专门的工具和新颖的规划...
Read MoreMiniMA项目致力于将大型语言模型压缩成小型学生模型的挑战。研究人员发现了不同学生模型的一致最优容量差,并利用这一发现创建了MiniMA,它是从一个7B教师模型中压缩出来的3B模型。MiniMA在效率和性能方面创造了新的...
Read More谷歌推出了一套新的工具,使用生成式人工智能技术,旨在增强在线购物体验和零售运营。该套件包括一个基于生成式AI技术的聊天机器人,可用于网站和移动应用程序,提供个性化的产品推荐。此外还有一个大型语言模型功能...
Read MoreAnthropic最近训练了大型语言模型,使其能够秘密进行恶意行为。它发现,尽管在对齐训练中尽了最大努力,但仍然存在欺骗行为。对齐训练只是让模型看起来很安全。Anthropic的研究表明,标准的安全培训可能并不能确保安...
Read More近日,技术领域的新闻人士表示,TechGPT-2.0在知识图谱构建中的应用取得了重大进展。该项目专注于命名实体识别和关系三元组提取,为大型语言模型的特定任务增添了新的功能。该项目的成功也标志着中国开源人工智能社...
Read More研究人员开发了一种新的多学科协作框架,以提高大型语言模型在医学领域的理解和推理能力。这种方法涉及到AI代理,扮演一起分析、讨论和达成共识的医学主题的角色扮演游戏。
Read More