MedLFQA是一个全新的基准数据集,旨在提升大规模语言模型在医疗领域中长篇回答的事实准确性。该数据集通过提供高质量的训练数据,帮助改进语言模型的回答精度。与此同时,OLAPH框架通过自动评估和偏好优化,训练大规...
Read More近日,MiniCMP-V发布了一个基于Llama 3训练的新版本。这款8B模型在多个任务上表现出色,甚至超越了许多闭源的专有模型。新版本的MiniCMP-V不仅支持30种不同的语言,还在光学字符识别(OCR)和视觉问答(visual quest...
Read More研究人员开发了一种名为Wav-KAN的神经网络框架,该框架采用小波函数来提升模型的可解释性和性能。与传统模型不同,Wav-KAN能够同时捕捉高频和低频数据成分,从而实现更快的训练速度和更高的稳健性。这一创新方法不仅...
Read MoreSpaceX即将进行的星舰任务将重点放在控制火箭的超重型助推器和星舰上阶段的重返大气层上。在上一次飞行中,这两个飞行器在下降过程中均发生解体。公司的目标是让超重型助推器在墨西哥湾实现精确控制的溅落,同时星舰...
Read MorePhi-3系列的小型模型迎来了14B版本的升级。此次升级的14B版本表现出色,其性能与Command R(104B模型)相媲美。Phi-3 14B模型的改进使其在处理复杂任务和数据分析方面有了显著提升,成为行业内备受瞩目的新星。Huggi...
Read More微软近日发布了全新Surface设备,旨在挑战苹果MacBook Air的市场地位。这款Surface设备搭载了高通的Snapdragon X Elite芯片,与苹果的顶级笔记本电脑相比,在性能测试中取得了领先。微软的Copilot Plus系列PC配备了...
Read MoreLeMeViT是一种新的方法,通过使用可学习元令牌来降低视觉Transformer的计算成本。这些元令牌能够高效地捕捉关键信息,从而显著提高推理速度。与传统的视觉Transformer相比,LeMeViT在保持高精度的同时,大幅减少了计...
Read More谷歌近日发布了一款名为 'Model Explorer' 的模型探索器,该工具可以帮助用户轻松查看并审查自己的模型计算图。这项新的工具对于调试和性能工程来说相当有用。Model Explorer以GitHub Repo形式存在,用户可以方便地...
Read More