漫话开发者 - UWL.ME 精选全球AI前沿科技和开源产品
2024-05-23 talkingdev

Tarsier:提升LLMs与网页交互的开源工具

Reworkd公司近日发布了一款名为Tarsier的新工具,旨在通过使用括号和ID对网页元素进行视觉标记,增强大语言模型(LLMs)的网页交互任务处理能力。Tarsier利用OCR生成的文本表示,使得没有视觉功能的LLM也能理解网页...

Read More
2024-05-23 talkingdev

Mamba在视觉任务中的必要性探讨

Mamba作为一种强大的Transformer替代方案,因其能够在保持性能的同时使用更少的FLOPs而备受关注。然而,最新研究表明,对于某些应用来说,Mamba可能并非必需。该研究通过实验表明,一个经过精心调优的CNN基线在一系...

Read More
2024-05-23 talkingdev

MedLFQA:提升医疗AI准确性的全新数据集

MedLFQA是一个全新的基准数据集,旨在提升大规模语言模型在医疗领域中长篇回答的事实准确性。该数据集通过提供高质量的训练数据,帮助改进语言模型的回答精度。与此同时,OLAPH框架通过自动评估和偏好优化,训练大规...

Read More
2024-05-23 talkingdev

MiniCMP-V开源新版本,可在手机上处理视觉任务

近日,MiniCMP-V发布了一个基于Llama 3训练的新版本。这款8B模型在多个任务上表现出色,甚至超越了许多闭源的专有模型。新版本的MiniCMP-V不仅支持30种不同的语言,还在光学字符识别(OCR)和视觉问答(visual quest...

Read More
2024-05-23 talkingdev

论文:新神经网络架构Wav-KAN显著提升训练速度与稳健性

研究人员开发了一种名为Wav-KAN的神经网络框架,该框架采用小波函数来提升模型的可解释性和性能。与传统模型不同,Wav-KAN能够同时捕捉高频和低频数据成分,从而实现更快的训练速度和更高的稳健性。这一创新方法不仅...

Read More
2024-05-23 talkingdev

MathBench:LLM的数学能力评估新基准

MathBench是一项旨在全面评估大语言模型数学能力的新基准。这一基准的设计初衷是为了填补当前评估工具在数学领域的空白,提供一个更加系统化和科学化的评估方法。MathBench不仅涵盖了基础数学运算,还包括高级数学理...

Read More
2024-05-23 talkingdev

微软推出Aurora大气预测模型,刷新全球天气预测测试记录

微软近日宣布,他们已成功训练出一款名为Aurora的大气预测基础模型。该模型在全球天气预测测试中,分别在5天和10天的预测准确性上,创下了新的记录。Aurora模型通过先进的机器学习算法和大量的气象数据进行训练,能...

Read More
2024-05-23 talkingdev

微软发布Phi-Silica,推进PC端AI技术革新

微软正式发布了其Phi-3模型,并推出了Phi-3-Silica,这是一款专为Copilot+ PC中的神经处理单元优化的小型语言模型。Phi-3-Silica拥有33亿参数,能够在低功耗的情况下提供快速的本地推理。这标志着在Windows设备中直...

Read More
  1. Prev Page
  2. 588
  3. 589
  4. 590
  5. Next Page