漫话开发者 - UWL.ME 精选全球AI前沿科技和开源产品
2023-12-19 talkingdev

DeepEval,开源LLM应用评估框架

DeepEval是一款全能的LLM应用评估框架,可让用户轻松识别和迭代不令人满意的LLM输出。它目前提供了14+种评估指标,如幻觉、摘要、G-Eval、RAGAS等,供用户以Pytest样式或组件化方式评估整个数据集。

Read More
2023-12-19 talkingdev

论文:使用语言模型提升自动驾驶能力

DriveMLM是一种新的框架,它使用大型语言模型来提高自动驾驶的能力。这个系统将语言决策与车辆控制相结合,不仅与现有的自动驾驶系统集成,而且在模拟中表现更好。

Read More
2023-12-18 talkingdev

如果AI正在使图灵测试过时,什么可能更好?

研究人员提出了一个新颖的框架,将人工智能程序视为心理研究中的参与者。该框架有三个步骤:在一系列实验中测试程序的推理能力,测试其对自身推理方式的理解,并且如有可能,检查程序源代码的认知适应性。虽然目前的...

Read More
2023-12-15 talkingdev

Cerebras发布gigaGPT模型训练框架

Cerebras是一家人工智能训练芯片制造商,近日发布了一个在其系统上训练大型模型的框架,名为gigaGPT。该框架非常简单易用,不需要将大型模型分割成多个GPU和节点进行训练。

Read More
2023-12-15 talkingdev

SvelteKit 2发布!支持Vite 5,增加浅层路由功能

SvelteKit是使用Svelte构建应用程序的官方框架。版本2.0增加了对Vite 5的支持和其他小的改进。它还增加了浅层路由功能,允许开发人员将状态与历史记录条目关联而不会导致导航。浅层路由对于创建可以通过向后滑动或弹...

Read More
2023-12-13 talkingdev

深度解析PyTorch 2内部机制PPT

PyTorch 2是目前深度学习领域最为流行的框架之一,由Facebook AI Research开发维护。近日,一次有关PyTorch 2内部机制的精彩讲座引起了广泛关注。该讲座详细介绍了PyTorch 2的最新功能,如Dynamo、Instructor和Execu...

Read More
2023-12-13 talkingdev

FamO2O框架,提高状态自适应平衡的RL算法

研究人员引入了FamO2O框架,旨在通过确定基于状态的最佳平衡来改进和约束当前的离线到在线RL算法的能力。该框架可自适应地根据环境状态调整平衡,以确保算法在不同的环境下都能得到最优的表现。FamO2O框架可以在多种...

Read More
2023-12-12 talkingdev

Giskard开源:针对从表格到LLMs的模型测试框架

Giskard是一个开源的测试框架,用于测试从表格到LLMs的机器学习模型。它通过检查模型的输出和真实值之间的差异来评估模型的性能。Giskard不仅可以测试模型的预测能力,还可以测量它的稳定性、可解释性和鲁棒性。Gisk...

Read More
2023-12-12 talkingdev

KTO改进:更好更便宜快速的数据对齐

通常,大多数数据对齐框架需要排名偏好数据(A优先于B)。而这种数据通常很昂贵且罕见。而这种新的框架只需要每个数据点的独立是或否评级即可实现数据对齐,更加便宜、更加高效。

Read More
2023-12-11 talkingdev

Llama 2模型成功在MLX上运行

仅仅在苹果公司推出MLX框架的一天后,人们已经成功将Llama 2模型运行在了新框架上。据悉,这是由于MLX框架的开放性,使得用户可以更加方便地进行模型的迁移和使用。同时,这也展示了MLX框架在机器学习领域的强大性能...

Read More
  1. Prev Page
  2. 21
  3. 22
  4. 23
  5. Next Page