漫话开发者 - UWL.ME 精选全球AI前沿科技和开源产品
2024-05-27 talkingdev

Mistral发布其官方模型微调开源仓库

Mistral近日宣布推出其官方模型微调仓库,这一举措将为开发者提供更方便的工具来优化和定制Mistral的模型。该官方仓库已经在GitHub上开放,用户可以通过访问该仓库获取相关资源和文档。Mistral的微调仓库支持多种机...

Read More
2024-05-27 talkingdev

论文:Lyft利用强化学习技术优化司机与乘客匹配

Lyft团队采用在线强化学习技术,通过司机未来收入来奖励司机,从而实现司机与乘客的匹配优化。这种方法使得匹配过程能够实时显著改进,每年为乘客额外创造了大约3000万美元的收入。强化学习是一种机器学习技术,它通...

Read More
2024-05-27 talkingdev

年轻创业者缺失:数字娱乐与技术优化的影响

近年来,20多岁的年轻创业者数量相较过去几十年有所下降,这可能与数字娱乐如游戏和TikTok的兴起有关,这些平台占用了他们的注意力和时间,导致他们缺乏原创性的想法。此外,科技行业在消费应用优化方面的进步可能正...

Read More
2024-05-24 talkingdev

SirLLM:增强大模型长期记忆的方法开源

近年来,大型语言模型在自然语言处理领域取得了显著进展,但在长时间对话中保持记忆仍然是一个巨大的挑战。为了解决这一问题,研究人员提出了一种新的方法:Streaming Infinite Retentive LLM(SirLLM)。这种方法允...

Read More
2024-05-23 talkingdev

MedLFQA:提升医疗AI准确性的全新数据集

MedLFQA是一个全新的基准数据集,旨在提升大规模语言模型在医疗领域中长篇回答的事实准确性。该数据集通过提供高质量的训练数据,帮助改进语言模型的回答精度。与此同时,OLAPH框架通过自动评估和偏好优化,训练大规...

Read More
2024-05-23 talkingdev

微软推出Aurora大气预测模型,刷新全球天气预测测试记录

微软近日宣布,他们已成功训练出一款名为Aurora的大气预测基础模型。该模型在全球天气预测测试中,分别在5天和10天的预测准确性上,创下了新的记录。Aurora模型通过先进的机器学习算法和大量的气象数据进行训练,能...

Read More
2024-05-23 talkingdev

微软发布Phi-Silica,推进PC端AI技术革新

微软正式发布了其Phi-3模型,并推出了Phi-3-Silica,这是一款专为Copilot+ PC中的神经处理单元优化的小型语言模型。Phi-3-Silica拥有33亿参数,能够在低功耗的情况下提供快速的本地推理。这标志着在Windows设备中直...

Read More
2024-05-22 talkingdev

DeepSeek-VL:面向现实世界的开源视觉语言模型

DeepSeek-VL 是一个专注于现实世界应用的全新开源视觉语言模型。该模型特别针对多样化的数据进行了优化,包括来自网页截图、图表以及 OCR(光学字符识别)数据的处理。DeepSeek-VL 的设计目标是提高在复杂和多样化数...

Read More
  1. Prev Page
  2. 87
  3. 88
  4. 89
  5. Next Page