漫话开发者 - UWL.ME 精选全球AI前沿科技和开源产品
2024-06-26 talkingdev

苹果智能与AI极致主义:分化策略与新趋势

苹果正在对其人工智能(AI)进行细分处理,区分出'上下文'和'世界'模型。其中,像ChatGPT这样的'世界'模型,被用于处理开放式查询,但没有个人上下文。OpenAI的地位并不稳固,因为在大语言模型(LLMs)中缺乏防御壁...

Read More
2024-06-25 talkingdev

混合注意力MoA在大型语言模型中的应用

混合注意力(MoA)方法在大型语言模型中优化稀疏注意力,通过为不同的头部和层定制独特的稀疏注意力配置。该方法通过改变稀疏注意力的配置,使模型可以更有效地处理复杂的语言模型,从而提高模型的性能和效率。

Read More
2024-06-25 talkingdev

在TRL中训练视觉模型

TRL是一个Hugging Face库,专为使用强化学习训练变形金刚设计。这个示例允许您对基于视觉的语言模型如LLaVA进行相同的处理。Hugging Face是一个开源NLP(自然语言处理)社区和公司,致力于使用人工智能推动自然语言...

Read More
2024-06-24 talkingdev

NLUX:一种面向大语言模型的JavaScript对话AI库

NLUX是一种对话式人工智能JavaScript库,专为大型语言模型提供用户界面。它极大地简化了将强大的大型语言模型集成到Web应用中的过程。NLUX的特点包括React组件和钩子,大型语言模型的适配器,流式的大型语言模型输出...

Read More
2024-06-24 talkingdev

LLM101开源教程:用AI打造故事讲述者

Andrej Karpathy发布了一个新的仓库,这是他正在进行的一个新课程的大纲。课程涉及构建一个可以讲述故事的对齐语言模型。课程包括视频讲座、代码和其他学习材料。这是一个主要围绕人工智能和机器学习的课程,强调对...

Read More
2024-06-24 talkingdev

AutoCodeRover开源-自动化软件改进工具

近期,一款名为AutoCodeRover的新型工具引起了业界的关注。这款工具能够自动化进行软件的改进,包括修复缺陷和增加特性等。AutoCodeRover通过结合大型语言模型和先进的代码搜索技术,有效提升了软件改进的效率和质量...

Read More
2024-06-23 talkingdev

Llama.ttf:一种既是字体又是LLM的创新技术

Llama.ttf是一种新型字体技术,它不仅可以作为字体使用,还能充当LLM(低级语言模型)的一部分。该技术通过将LLM嵌入字体中,使得字体在呈现文本的同时,也能进行机器学习任务。这项技术的研究者表示,Llama.ttf可以...

Read More
2024-06-23 talkingdev

利用语义熵检测大型语言模型中的幻觉

随着大型语言模型的普及,越来越多的人开始依赖这些系统来生成语言内容。然而,这些系统可能会出现所谓的幻觉,即生成的内容与真实世界不符合。为了解决这个问题,研究人员提出了一种名为语义熵的新方法来检测幻觉。...

Read More
2024-06-21 talkingdev

多模态Agent攻击-我们能信任视觉语言模型

视觉启用的语言模型(VLMs)如GPT-4o和Gemini,能够赋予自主代理人完成诸如进行购物或编辑代码等任务的能力。然而,这项工作也突出了这些代理人易受到恶意攻击的脆弱性。在现实世界中,我们必须对这些具有视觉理解能...

Read More
2024-06-21 talkingdev

苹果为提升文字与图像AI性能,开源了20个机器学习模型

苹果公司最近向Hugging Face开源AI仓库贡献了20个Core Machine Learning模型,以此来提升公有模型在图像分类和深度分割方面的性能。此举紧随苹果发布Ferret大型语言模型和四个OpenELMs到Hugging Face的步伐。这一举...

Read More
  1. Prev Page
  2. 10
  3. 11
  4. 12
  5. Next Page