漫话开发者 - UWL.ME 精选全球AI前沿科技和开源产品
2025-09-26 talkingdev

Ollama推出Web搜索API,赋能模型实时信息获取与减少幻觉

Ollama近日发布了一项创新的Web搜索API,旨在为其AI模型提供实时信息访问能力,从而显著减少模型生成内容中的幻觉现象。该API通过REST端点提供,并已集成到Ollama的Python和JavaScript库中,使模型能够执行长时间的...

Read More
2025-09-24 talkingdev

大语言模型核心解码:采样与结构化输出如何协同塑造下一代AI

在大型语言模型的技术架构中,采样与结构化输出是决定模型生成质量与可控性的两大核心技术。采样指模型根据概率分布从词汇表中选择下一个标记的过程,直接影响了文本生成的多样性和创造性。而结构化输出技术则赋予模...

Read More
2025-09-16 talkingdev

开源|HuMo:文本、图像与音频驱动的统一人体视频生成框架

HuMo是一项突破性的人工智能技术,通过统一的多模态输入框架实现了人体视频生成的跨模态融合。该研究团队创新性地构建了大规模数据集并采用渐进式训练策略,成功解决了音频与视觉动作的时序同步难题。其技术核心在于...

Read More
2025-09-12 talkingdev

开源|Nano Banana图像生成示例集:展示Gemini-2.5-flash图像模型的创意潜力

GitHub热门项目「Awesome-Nano-Banana-images」近期引发人工智能社区广泛关注,该项目通过精心策划的示例库,展示了基于Gemini-2.5-flash图像生成模型「Nano Banana🍌」的多样化应用场景。该仓库收录了包括超现实主义...

Read More
2025-08-21 talkingdev

开源|Luminal:基于搜索的开源GPU编译器,可自动为AI模型生成高性能内核

Luminal是由开发者Joe及其团队构建的一款创新型开源GPU编译器,专门针对AI模型自动生成高度优化的GPU内核。与传统机器学习库不同,Luminal采用搜索式编译方法:它将高级模型代码(如PyTorch格式)转换为底层GPU代码...

Read More
2025-06-26 talkingdev

AI聊天机器人内部指令与行为准则遭泄露

近日,GitHub上出现了一个名为System_prompts_leaks的仓库,其中收集了多个AI聊天机器人和模型的泄露系统提示(system prompts),揭示了这些AI的内部指令和行为准则。这一发现引发了广泛关注,因为系统提示是AI模型...

Read More
2025-06-20 talkingdev

[论文推荐]生成式口语语言模型自然度提升新突破:端到端变分编码器实现自动韵律学习

一项发表于arXiv的突破性研究提出新型端到端变分编码器架构,通过自动学习韵律特征替代传统手工设计的音高输入,显著提升生成式口语语言模型的自然度表现。该技术摒弃了人工特征工程,直接对语义语音标记与韵律特征...

Read More
2025-06-19 talkingdev

[论文推荐]Text-to-LoRa:无需训练数据的即时Transformer定制技术

Sakana AI研究团队开发出一项突破性技术——Text-to-LoRa(T2L)系统,该系统仅需文本描述即可即时定制大型语言模型,无需传统方法所需的训练数据或耗时微调过程。该技术的核心创新在于将数百个LoRA适配器(一种高效轻...

Read More
  1. 1
  2. 2
  3. 3
  4. Next Page