漫话开发者 - UWL.ME 精选全球AI前沿科技和开源产品
2025-05-13 talkingdev

[开源]LLMs在多轮对话中表现显著下降(GitHub仓库)

最新研究发现,大型语言模型(LLMs)在多轮对话任务中的表现存在显著缺陷。根据微软在GitHub上公开的研究项目数据显示,由于模型可靠性和早期错误假设问题,LLMs在多轮对话中的任务表现平均下降了39%。这一发现对当...

Read More
2025-04-28 talkingdev

DeepSeek发布2025年新一代AI模型R2,引领大语言模型技术革新

DeepSeek公司近日宣布将于2025年正式推出新一代人工智能模型DeepSeek-R2,这一重大进展标志着大语言模型技术进入全新发展阶段。根据官方技术博客透露,R2模型将采用创新的混合架构设计,整合了稀疏专家模型(MoE)与密...

Read More
2024-02-28 talkingdev

AlphaMonarch 7B 模型HF发布

HuggingFace Hub 近期合并发布了 AlphaMonarch 7B 模型,这个经过调优的模型在 elo 和 static benchmarks 中表现优异。它专门为多轮对话和指令跟踪等任务而设计,将会成为自然语言处理领域的一大利器。

Read More
2023-11-06 talkingdev

Talk Llama开源:在终端上与LLaMA AI对话

最近,一个名为Talk Llama的Github仓库备受关注,该仓库提供了一种在终端上与LLaMA AI进行交互的方式。LLaMA AI是一个基于GPT-3的自然语言处理模型,它的名字是“Language Model for Multi-turn Dialogue with Latent...

Read More
2023-10-24 talkingdev

评估LLMs在多轮对话中的聊天能力

本研究评估了大型语言模型(LLMs)在进行类似于人类的多轮对话时的能力。研究人员使用了一种名为Persona-Chat的数据集,该数据集包含有关对话参与者偏好和兴趣的信息。研究结果表明,LLMs在某些方面表现出了与人类类...

Read More