漫话开发者 - UWL.ME 精选全球AI前沿科技和开源产品
2024-01-20 talkingdev

Mega Dolphin成功合并

Dolphin被广泛认为是可用性最强的未经审查的开放模型之一。它主要建立在Mixtral上。这个120B的模型是通过合并两个较小的Dolphin模型而制成的。研究发现,与Goliath 120B一起使用这种合并过程可以提高整体模型性能

Read More
2024-01-16 talkingdev

哈佛研究团队开发出充电时间为分钟级、循环寿命为数千次的新型固态电池

哈佛大学约翰·A·保尔森工程与应用科学学院的研究人员开发出了一种新的锂金属电池,可以在几分钟内充电,并且至少可以进行6,000次充电循环。锂金属电池的能量密度远高于锂离子电池,重量也要轻得多。该团队还列出了其...

Read More
2024-01-15 talkingdev

核矩阵的频谱特性

本文探讨了不同核矩阵的特征值如何改变以及它对学习属性的影响。核矩阵是机器学习中常用的矩阵,用于描述数据的相似性。在本文中,我们将分析核矩阵的频谱特性,即特征值的变化,这对机器学习模型的性能有很大的影响...

Read More
2024-01-15 talkingdev

MiniMA项目开源:高效压缩的语言模型

MiniMA项目致力于将大型语言模型压缩成小型学生模型的挑战。研究人员发现了不同学生模型的一致最优容量差,并利用这一发现创建了MiniMA,它是从一个7B教师模型中压缩出来的3B模型。MiniMA在效率和性能方面创造了新的...

Read More
2024-01-15 talkingdev

论文:自我监督学习提高歌声合成相似度和泛化性能

研究人员开发了一种新的框架来更好地理解和分析歌声。通过在孤立的人声轨道上进行自我监督学习,并专注于域外泛化,他们在歌声相似性和合成等任务上取得了进展,从而改进了现有技术。这种新方法可以通过对歌声的不同...

Read More
2024-01-15 talkingdev

斯坦福Monarch-32k检索模型发布,比闭源嵌入式模型表现更佳

Together Compute一直在探索不同的Transformer替代方案。最近,他们发布了一款检索模型,该模型的表现优于许多闭源嵌入式模型,适用于检索任务。该模型命名为Monarch Mixer 32k。它是一个基于深度神经网络的模型,可...

Read More
2024-01-12 talkingdev

本地部署AI模型现在也能拥有视觉能力

Ollama现在支持视觉模型啦,这意味着您可以在MacBook Pro上运行Llava,实现最先进的视觉和语言性能。 随着人工智能技术的发展,AI的应用场景越来越广泛。然而,由于许多私人AI的计算能力和算法限制,它们往往无法像...

Read More
2024-01-12 talkingdev

使用Distilabel技术的DPO数据集

一种新的方法可以过滤高质量的配对偏好以进行对齐。它可以显著提高基准模型的性能

Read More
2024-01-11 talkingdev

论文:谷歌研究人员提出自我对弈优化算法,致力于简化AI对齐

谷歌研究人员提出了一种名为Self-Play Preference Optimization (SPO) 的自我对弈优化算法。该算法相比传统的强化学习对齐方式更加简单。研究人员运用博弈论,找到了对噪声干扰鲁棒性强、性能表现优异的单人自我对弈...

Read More
2024-01-11 talkingdev

英特尔推出面向汽车领域的AI芯片

英特尔宣布推出面向汽车领域的人工智能芯片。这款芯片被描述为“第一代AI增强软件定义车载系统芯片”,这一消息标志着英特尔向AI PC和汽车AI应用的战略转变。这款芯片将帮助汽车制造商将车辆转变为智能移动平台,提高...

Read More
  1. Prev Page
  2. 78
  3. 79
  4. 80
  5. Next Page