漫话开发者 - UWL.ME 精选全球AI前沿科技和开源产品
2024-06-12 talkingdev

Mistral.rs开源:Rust基础推理框架性能升级

Mistral.rs是一款基于Rust的推理框架,其最新版本已经上线。这款框架在最新的版本中实现了性能的重大提升,增加了GGUF支持,并带来了更多其他改进。Mistral.rs是专为机器学习和人工智能研究者设计的一款强大工具,其...

Read More
2024-05-23 talkingdev

斯坦福HAI发布最新基础模型透明度指数

斯坦福大学人类中心人工智能研究院(Stanford HAI)发布了最新版本的基础模型透明度指数,对包括OpenAI和Google在内的14家主要人工智能开发商的透明度进行了评估。这些公司披露了之前未向公众公开的新信息,标志着在...

Read More
2024-05-20 talkingdev

xAI公开发布具有3140亿参数的Grok-1模型

xAI近期公开发布了Grok-1模型的权重和架构。Grok-1是一种混合专家模型,拥有3140亿参数。发布的模型是Grok-1预训练阶段的原始基础模型检查点,这意味着它并未针对任何特定应用进行精调。该模型是由xAI使用自定义训练...

Read More
2024-05-10 talkingdev

Buzz预训练数据集发布,更准确地理解和预测人类的行为和喜好

Buzz是一个创新型的数据集,它在预训练中融合了偏好数据。该数据集的研究者们还发布了几个利用这些数据训练的模型。他们发现,这些模型在许多人类偏好任务上表现出色。Buzz数据集的出现,无疑为人工智能研究提供了新...

Read More
2024-05-01 talkingdev

如何让你的AI数据可视化变得更智能美观

在当今的人工智能研究领域,对模型的评估分数进行可视化是至关重要的。然而,许多图表在传达预期信息方面表现得并不好。这个GitHub项目展示了一些优秀的图表,并附带了在可视化结果时应该做什么和不应该做什么的建议...

Read More
2024-04-15 talkingdev

BabyLM挑战赛:探索用婴儿级数据训练顶级文本与视觉模型

近期,科技界发起了一项名为BabyLM的挑战,旨在推动研究人员和开发者在极度有限的数据条件下,训练出性能卓越的文本和视觉模型。这一挑战的核心理念是模仿人类婴儿在成长初期所接触到的数据量,大约为1000万个token...

Read More
2024-04-10 talkingdev

戴密斯·哈萨比斯能否挽救谷歌?

DeepMind创始人戴密斯·哈萨比斯目前领导着谷歌统一的人工智能研究部门,致力于通过AlphaGo和AlphaFold等突破性成果保持科技巨头在人工智能领域的领先地位。尽管取得了成功,但将AI集成到实际产品中以及来自OpenAI的C...

Read More
2024-04-07 talkingdev

多Agent协同:LLMs随着Agent数量的增加而性能扩展

研究人员发现,当涉及到复杂的任务时,使用更多的代理人可以显着提高LLMs的性能。这项研究的结果表明,LLMs的性能随着代理人数量的增加而线性扩展。这是因为更多的代理人可以提供更多的观察和决策,使LLMs更好地理解...

Read More
2024-04-03 talkingdev

Anthropic开发新技术破解长文本模型

近期,人工智能研究公司Anthropic成功开发出一种破解长文本模型的技术。该技术通过对长文本模型进行破解,可以获取模型的内部信息。为了防范此类攻击,Anthropic已经与其他组织分享了这项发现,并对自身的安全措施进...

Read More
2024-04-02 talkingdev

苹果研究团队推出ReALM系统,性能超越GPT-4

苹果公司的人工智能研究人员开发了一种新型系统ReALM,该系统通过考虑屏幕上的内容、对话中的实体以及背景信息,增强了Siri理解上下文的能力。在基准测试中,ReALM系统的性能超过了ChatGPT 4.0。这一突破性的技术进...

Read More
  1. Prev Page
  2. 2
  3. 3
  4. 4
  5. Next Page