漫话开发者 - UWL.ME 精选全球AI前沿科技和开源产品
2024-05-24 talkingdev

语言模型在财务报表分析中的应用

最近,一项新的研究表明,大语言模型可以用来帮助金融分析师更快地分析公司的财务报表。这些模型可以利用自然语言处理技术,自动识别和解释公司的财务数据,为分析师提供更准确的预测和决策。这种方法已经在一些金融...

Read More
2024-05-24 talkingdev

Cohere推出多语言Aya模型

Cohere最新发布的Aya项目包含3种不同规模的模型,能够使用101种语言进行对话,其中许多语言资源极为稀缺。Aya项目的推出对于开放和普及研究社区来说是一个巨大的进步。通过这一项目,研究人员和开发者能够更广泛地获...

Read More
2024-05-24 talkingdev

SirLLM:增强大模型长期记忆的方法开源

近年来,大型语言模型在自然语言处理领域取得了显著进展,但在长时间对话中保持记忆仍然是一个巨大的挑战。为了解决这一问题,研究人员提出了一种新的方法:Streaming Infinite Retentive LLM(SirLLM)。这种方法允...

Read More
2024-05-24 talkingdev

论文:全新ProtT3框架提升蛋白质文本理解能力

研究人员推出了ProtT3,这是一个旨在通过结合蛋白质语言模型(PLM)和传统语言模型(LM)来增强蛋白质文本理解能力的新框架。ProtT3框架集成了用于处理氨基酸序列的PLM,并利用一种名为Q-Former的跨模态投影器生成高...

Read More
2024-05-23 talkingdev

Tarsier:提升LLMs与网页交互的开源工具

Reworkd公司近日发布了一款名为Tarsier的新工具,旨在通过使用括号和ID对网页元素进行视觉标记,增强大语言模型(LLMs)的网页交互任务处理能力。Tarsier利用OCR生成的文本表示,使得没有视觉功能的LLM也能理解网页...

Read More
2024-05-23 talkingdev

MedLFQA:提升医疗AI准确性的全新数据集

MedLFQA是一个全新的基准数据集,旨在提升大规模语言模型在医疗领域中长篇回答的事实准确性。该数据集通过提供高质量的训练数据,帮助改进语言模型的回答精度。与此同时,OLAPH框架通过自动评估和偏好优化,训练大规...

Read More
2024-05-23 talkingdev

MathBench:LLM的数学能力评估新基准

MathBench是一项旨在全面评估大语言模型数学能力的新基准。这一基准的设计初衷是为了填补当前评估工具在数学领域的空白,提供一个更加系统化和科学化的评估方法。MathBench不仅涵盖了基础数学运算,还包括高级数学理...

Read More
2024-05-23 talkingdev

微软发布Phi-Silica,推进PC端AI技术革新

微软正式发布了其Phi-3模型,并推出了Phi-3-Silica,这是一款专为Copilot+ PC中的神经处理单元优化的小型语言模型。Phi-3-Silica拥有33亿参数,能够在低功耗的情况下提供快速的本地推理。这标志着在Windows设备中直...

Read More
2024-05-22 talkingdev

Braindump-构建AI游戏工具的初步探索与实践

Braindump是一款革命性的AI工具,它允许开发者通过简单的文本提示来构建俯视视角/2.5D游戏或交互式虚拟世界。这项技术可以自动生成3D模型、游戏数据和脚本,从而将用户的创意构想转化为生动的游戏内容。本文总结了Br...

Read More
2024-05-22 talkingdev

DeepSeek-VL:面向现实世界的开源视觉语言模型

DeepSeek-VL 是一个专注于现实世界应用的全新开源视觉语言模型。该模型特别针对多样化的数据进行了优化,包括来自网页截图、图表以及 OCR(光学字符识别)数据的处理。DeepSeek-VL 的设计目标是提高在复杂和多样化数...

Read More
  1. Prev Page
  2. 15
  3. 16
  4. 17
  5. Next Page