漫话开发者 - UWL.ME 精选全球AI前沿科技和开源产品
2025-03-13 talkingdev

Honey Bunnies:探索AI技术在情感交互中的新应用

近日,Honey Bunnies项目引起了科技界的广泛关注。该项目通过结合LLM(大型语言模型)和agent技术,致力于打造一种全新的情感交互体验。Honey Bunnies的核心在于利用embedding技术,将用户的情感需求转化为机器可理...

Read More
2025-03-13 talkingdev

[开源] PromptPex:将AI模型提示词自动化测试的开源工具

PromptPex是一个创新的开发者工具,它将AI模型中的提示词(prompts)视为函数,并自动生成测试输入,从而实现对AI模型提示词的系统化单元测试。这一工具的诞生标志着AI开发工具链的进一步完善,尤其是在提示工程(Pr...

Read More
2025-03-13 talkingdev

Genies推出AIGC驱动系统,革新游戏资产创建流程

Game Art Forge通过引入AI生成模板,正在彻底改变游戏资产的创建方式。该系统不仅大幅提升了开发速度,还增强了可扩展性和创意控制,使开发者能够实现高度自定义的同时保持一致性。无论是独立开发者还是大型团队,都...

Read More
2025-03-13 talkingdev

谷歌发布开源权重模型Gemma 3,性能接近Gemini 1.5 Pro

谷歌近日发布了Gemma 3模型的权重和技术报告,这一模型共有四种规模,其性能与Gemini 1.5 Pro相当。Gemma 3不仅在多语言处理上表现出色,能够理解超过140种语言,还被认为是接近当前最先进的密集模型之一。这一发布...

Read More
2025-03-12 talkingdev

MovieAgent:长镜头电影生成技术突破

近日,一项名为MovieAgent的创新技术引起了广泛关注。该系统通过结合多种生成模态,利用基于角色的提示(persona-based prompting)来确保生成内容的一致性和准确性。MovieAgent进一步使用Stable Diffusion视频模型...

Read More
2025-03-12 talkingdev

Hugging Face推出LeRobot平台扩展,发布最大开源多模态汽车AI数据集

Hugging Face与Yaak合作推出了L2D数据集,这是目前最大的开源多模态数据集,专为汽车人工智能(AI)领域设计。该数据集包含了从驾驶学校收集的专家和学生驾驶策略,并通过自然语言指令增强了空间智能模型的能力。这...

Read More
2025-03-12 talkingdev

Reka发布全新推理模型Flash 3,性能媲美专有模型

Reka公司近日开源了其最新推出的Reka Flash 3模型,这是一款拥有210亿参数的多功能模型,专门针对推理、聊天、编码和指令遵循等任务进行了优化。该模型在性能上与专有模型不相上下,并配备了32k的上下文长度,使其非...

Read More
2025-03-11 talkingdev

视觉语言模型的新突破:简单可验证奖励与规模化强化学习的结合

近期,一项关于视觉语言模型(Vision Language Models)的研究引起了广泛关注。该研究通过结合简单可验证奖励机制与规模化强化学习(Scaled Reinforcement Learning),显著提升了模型的性能。研究团队在论文中详细...

Read More
  1. Prev Page
  2. 6
  3. 7
  4. 8
  5. Next Page