近年来,大型语言模型在自然语言处理领域取得了显著进展,但在长时间对话中保持记忆仍然是一个巨大的挑战。为了解决这一问题,研究人员提出了一种新的方法:Streaming Infinite Retentive LLM(SirLLM)。这种方法允...
Read MoreMedLFQA是一个全新的基准数据集,旨在提升大规模语言模型在医疗领域中长篇回答的事实准确性。该数据集通过提供高质量的训练数据,帮助改进语言模型的回答精度。与此同时,OLAPH框架通过自动评估和偏好优化,训练大规...
Read More微软近日宣布,他们已成功训练出一款名为Aurora的大气预测基础模型。该模型在全球天气预测测试中,分别在5天和10天的预测准确性上,创下了新的记录。Aurora模型通过先进的机器学习算法和大量的气象数据进行训练,能...
Read More微软正式发布了其Phi-3模型,并推出了Phi-3-Silica,这是一款专为Copilot+ PC中的神经处理单元优化的小型语言模型。Phi-3-Silica拥有33亿参数,能够在低功耗的情况下提供快速的本地推理。这标志着在Windows设备中直...
Read MoreDeepSeek-VL 是一个专注于现实世界应用的全新开源视觉语言模型。该模型特别针对多样化的数据进行了优化,包括来自网页截图、图表以及 OCR(光学字符识别)数据的处理。DeepSeek-VL 的设计目标是提高在复杂和多样化数...
Read MoreElon Musk的人工智能公司xAI正在提升其Grok聊天机器人的能力,使其能够支持多模态输入。此举将允许用户上传照片,并获得基于文本的回答。这一功能的加入不仅会拓宽Grok的应用场景,还将提高其在用户交互中的智能化水...
Read More在当下的商业环境中,寻找理想的商业客户至关重要。触摸AI(Touch AI)的产品正在帮助企业实现这一目标。它利用人工智能和贝叶斯模型,为企业提供了一种优化投递和转化率的有效方法。通过这种方式,企业能够更准确地...
Read More谷歌近日发布了一款名为 'Model Explorer' 的模型探索器,该工具可以帮助用户轻松查看并审查自己的模型计算图。这项新的工具对于调试和性能工程来说相当有用。Model Explorer以GitHub Repo形式存在,用户可以方便地...
Read More专家们(Experts)是一款能以最简单的方式创建并部署OpenAI助手的工具,通过将这些助手链接成工具,可以创建出一个有着扩展记忆和对细节高度关注的专家团队系统。该系统不仅能够进行深度学习,还具有高度的适应性,...
Read More谷歌近日发布了最新模型Gemini 1.5的技术报告。报告详细介绍了此次升级的主要内容和改进之处,但并未透露过多关于模型或所使用数据的信息。然而,报告中对评估和安全措施的详尽描述,让我们得以深入了解大规模对齐的...
Read More