漫话开发者 - UWL.ME 精选全球AI前沿科技和开源产品
2024-06-20 talkingdev

开源Dot:让本地LLMs和TTS/RAG交互更便捷

近日,一个名为Dot(GitHub Repo)的开源应用引起了大家的关注。这是一个独立的开源应用,其主要目的是让用户更轻松地使用本地LLMs(语言模型)和RAG(重新生成的注意力引导)来与文档和文件进行交互。这种交互方式...

Read More
2024-06-20 talkingdev

Argilla:AI工程师与领域专家的开源协作平台

Argilla是一个为AI工程师和领域专家提供服务的协作平台,其主要目标是提供高质量的输出、全面的数据所有权以及高效的整体效率。AI工程师和领域专家可通过Argilla平台进行深度合作,实现数据的共享,以及提供最优质的...

Read More
2024-06-20 talkingdev

TroL-高效大型语言和视觉模型开源

近日,一种名为TroL的新型高效大型语言和视觉模型 (LLVMs) 在GitHub上发布,其模型规模分别为18亿、38亿和70亿参数。这些模型能够精确地处理和理解大量的语言和图像信息,其性能和效率都达到了非常高的水平。这些模...

Read More
2024-06-20 talkingdev

论文:LLMs决策制定者

决策QA是LLMs的一项新任务,它能够基于复杂的数据分析来确定最佳的决策。在传统的决策制定过程中,我们需要人工对大量数据进行分析,这不仅耗时耗力,而且可能由于人为因素导致决策的偏差。而现在,LLMs的出现,让决...

Read More
2024-06-20 talkingdev

Logit Prisms:分解Transformer输出以提高解释性

Logit Lens方法已经得到了增强,该方法通过分解logit输出,帮助我们理解Transformer模型的决策过程。这种方法使用“prisms”来处理残差流,注意力层和MLP层,揭示了这些部分如何影响预测,并为gemma-2b模型执行的诸如...

Read More
2024-06-20 talkingdev

微软发布全新顶尖视觉模型Florence-2

微软最近发布了一套名为Florence-2的MIT许可的小型视觉语言模型(VLMs)。这套模型在图像标注、边界识别和分类等任务上,表现出色,大大超过了许多体型更大的模型。Florence-2模型的发布,标志着微软在人工智能和机...

Read More
2024-06-20 talkingdev

Roblox走向4D生成AI之路

Roblox正在构建向4D生成AI的技术,这一技术超越了单一的3D对象,实现了动态交互。解决4D的挑战将需要在外观、形状、物理和脚本等多个方面进行深度理解。早期为4D系统打下基础的工具已经在平台上加速了创新的步伐。Ro...

Read More
2024-06-20 talkingdev

苹果智能策略:AI,隐私保护与安全的完美结合

苹果在其全球开发者大会(WWDC)上揭示了其在AI领域的战略定位,重点关注隐私和安全,并在其私有云中使用自家芯片和零信任架构。苹果的AI整合了OpenAI的ChatGPT,用于超出其范围的任务,其商业模式可能让AI供应商为...

Read More
  1. Prev Page
  2. 585
  3. 586
  4. 587
  5. Next Page