漫话开发者 - UWL.ME 精选全球AI前沿科技和开源产品
2025-03-17 talkingdev

[开源]HiRAG:为大型语言模型检索引入分层知识增强生成方法

HiRAG(Hierarchical Retrieval-Augmented Generation)是一种创新的分层知识增强生成方法,旨在提升检索增强生成(RAG)技术在特定领域任务中的语义理解和索引能力。RAG技术通过将外部知识库与大型语言模型(LLM)...

Read More
2025-03-17 talkingdev

[开源] Visual reasoning models:提升视觉语言模型推理能力的新工具包

近日,GitHub上发布了一个名为'Visual reasoning models'的开源工具包,旨在训练视觉语言模型(VLMs)以提升其基础逻辑和推理能力。该工具包由groundlight团队开发,主要专注于增强模型在处理复杂视觉数据时的理解和...

Read More
2025-01-21 talkingdev

DeepSeek-R1:新一代精准搜索引擎技术发布

DeepSeek-R1,作为业界领先的新一代精准搜索引擎技术,采用了最新的人工智能算法和机器学习框架,通过深度语义理解和自然语言处理技术,实现了对搜索查询的高精度解析和匹配。DeepSeek-R1的技术核心在于其独特的优化...

Read More
2024-12-31 talkingdev

Ts_zip:利用大语言模型实现文本压缩

Ts_zip是一项创新技术,它运用大型语言模型(LLM)来实现文本压缩。Ts_zip的核心理念在于通过预训练的大型语言模型对文本进行编码和解码,从而减少数据存储空间或传输带宽的需求。这种技术的优势在于其能够理解文本...

Read More
2024-04-03 talkingdev

工业领域OCR数据集发布,涵盖2600万页高质量PDF文档

近日,一个庞大的工业文档OCR数据集正式发布,该数据集包含了2600万页的高质量PDF文档,总计约180亿个标记。这些文档涵盖了工业领域的广泛内容,包括机械设计、电气工程、自动化控制等多个方面。该数据集的发布,将...

Read More
2024-03-05 talkingdev

OpenAI与Figure合作,让人形机器人更加智能化

不久的将来,人形机器人将会与人类制造工人一起工作。在这个领域中占据重要地位的Figure公司最近筹集了6.75亿美元,并与OpenAI达成协议,为其机器人开发下一代人工智能模型。这笔资金超过了Figure最初设定的金额150...

Read More
2024-03-04 talkingdev

论文:深度语义理解,从粗到细的潜在扩散图像合成方法

粗到细潜在扩散(CFLD)方法引入了一种新的姿势引导人像合成方法,通过对图像进行深度语义理解来避免过拟合,克服了现有模型的局限性。

Read More
2023-12-11 talkingdev

OneLLM: 一种理解八种不同模态的多模态AI

一种名为OneLLM的新型AI模型正在掀起波澜,它使用一种独特的方法将所有这些模态与语言对齐,理解包括图像、音频甚至脑活动在内的八种不同类型的数据。OneLLM的这种多模态理解方法可能会推动AI在语义理解方面的进一步...

Read More
  1. Prev Page
  2. 2
  3. 3
  4. 4
  5. Next Page