漫话开发者 - UWL.ME 精选全球AI前沿科技和开源产品
2024-06-03 talkingdev

Mora:挑战Sora的新一代视频生成模型开源

Mora是一款创新的视频生成模型,它利用多个视觉AI代理,旨在挑战OpenAI的领先模型Sora。Mora的独特之处在于其多代理系统,这使得它在视频内容生成的多样性和质量上表现出色。通过集成高级视觉处理技术和机器学习算法...

Read More
2024-05-27 talkingdev

论文:Lyft利用强化学习技术优化司机与乘客匹配

Lyft团队采用在线强化学习技术,通过司机未来收入来奖励司机,从而实现司机与乘客的匹配优化。这种方法使得匹配过程能够实时显著改进,每年为乘客额外创造了大约3000万美元的收入。强化学习是一种机器学习技术,它通...

Read More
2024-05-22 talkingdev

GitHub Copilot Extensions重磅发布:携手合作伙伴生态,开启无限可能

GitHub Copilot Extensions的发布为开发者带来了前所未有的便利。这项服务使得开发者能够在IDE或GitHub.com中,使用自然语言和他们偏好的工具及服务进行构建和云端部署。不再需要离开熟悉的开发环境,Copilot Extens...

Read More
2024-05-22 talkingdev

CSTA项目开源,提升视频摘要效果

本项目引入了一种新的基于CNN的时空注意力(CSTA)方法,用于改进视频摘要。与传统的注意力机制不同,CSTA通过使用2D CNN来捕捉帧的视觉重要性,从而更好地理解视频中的关系和关键属性。这种方法不仅能够有效提取视...

Read More
2024-05-21 talkingdev

SoundHound AI与Perplexity合作,提供精准、最新的网络查询回应

近日,知名的语音识别和自然语言处理技术提供商SoundHound的AI聊天助手宣布将与Perplexity进行合作。Perplexity是一家专注于提供精准、最新的网络查询回应的公司,其技术在搜索引擎、聊天机器人等领域有着广泛应用。...

Read More
2024-05-16 talkingdev

SqueezeTime-移动视频理解的新进展

SqueezeTime是一款为移动视频理解设计的轻量级网络,其独特之处在于,它能够将视频的时间轴压缩到频道维度中,从而增强了时间分析的能力。SqueezeTime网络的设计理念是,通过压缩时间轴,可以在不牺牲视频内容质量的...

Read More
2024-05-16 talkingdev

Google下一代IDE项目IDX,现已进入公开测试阶段

项目IDX是一个以AI为中心的,基于浏览器的开发环境,该项目于8月份以邀请制的形式启动。已有超过10万开发者尝试了该项服务,并现已进入公开测试阶段。Google已经将Google地图平台的集成添加到了这个IDE中,并与Chrom...

Read More
2024-05-15 talkingdev

谷歌Veo:超一分钟的1080p分辨率视频生成新模型

谷歌Deepmind最近发布了一款名为Veo的新型视频生成人工智能模型。这款AI模型拥有强大的视频生成能力,能够生成具有1080p分辨率的视频,且长度可以超越一分钟。在现有的视频生成技术中,这种能力是相当显著的。Veo利...

Read More
2024-05-15 talkingdev

Google I/O 2024新品发布:Gemini Flash、Veo视频生成、Imagen 3及最新助手Project Astra亮相

在2024年的Google I/O开发者大会上,Google发布了众多新功能,包括Gemini Flash、Veo视频生成、Imagen 3及其最新助手Project Astra。整体而言,这些改进数量惊人,包括扩大到2m的令牌上下文长度,大幅降低的模型价格...

Read More
2024-05-14 talkingdev

Glider - 开源低延迟电子墨水显示器

Glider是一款基于树莓派的开源电子墨水显示器,旨在提供低延迟的显示体验。这个项目的目的是为了创建一个可定制的、易于使用的电子墨水显示屏,可以用于显示文本、图像和Web内容。Glider的硬件设计基于树莓派4B,配...

Read More
  1. Prev Page
  2. 5
  3. 6
  4. 7
  5. Next Page