漫话开发者 - UWL.ME 精选全球AI前沿科技和开源产品
2024-01-30 talkingdev

HF发布WebDataset格式

HuggingFace最近发布了一种名为WebDataset的数据格式,它可以将多个记录组合在一起。任何具有相同前缀的内容都会被视为同一条记录。这种格式非常适合于流式传输和快速数据加载。WebDataset还可以支持使用并行处理来...

Read More
2024-01-29 talkingdev

AgentBoard提升模型评估能力,多轮LLM评估升级

近日,研发团队宣布推出了AgentBoard,一款专为多轮LLM代理设计的基准测试工具。AgentBoard不仅可以评估LLM代理的最终成功率,还提供了分析评估板以进行更详细的模型评估。这款工具可以更全面地评估LLM代理,为LLM代...

Read More
2023-06-02 talkingdev

Lance:现代机器学习数据格式

Lance是一种现代的机器学习数据格式。它提供了更快的随机访问、向量索引、数据版本控制等功能。Lance支持pandas、duckdb、polars和pyarrow等工具,可用于构建搜索引擎和特征库、大规模机器学习训练,以及存储、查询...

Read More
2023-05-19 talkingdev

Jesth成为GitHub上的热门仓库

Jesth是一种易读的数据序列化格式,可以创建包含各种类型数据的文档。最近,它成为了GitHub上的热门仓库。 以下是Jesth的三个核心特点: - Jesth是一种轻量级的数据格式,易于使用和阅读。 - Jesth支持大量的数据...

Read More
  1. Prev Page