漫话开发者 - UWL.ME 精选全球AI前沿科技和开源产品
2025-07-28 talkingdev

AgenticSeek开源:完全本地的AI助手,无需API与云端依赖

GitHub项目AgenticSeek推出了一款完全本地运行的AI助手,具备语音交互、自主网页浏览、代码编写及任务规划能力。该项目定位为Manus AI的开源替代方案,强调隐私性与独立性——无需依赖云端API或支付高额月费,仅需电力...

Read More
2025-07-28 talkingdev

Meta任命ChatGPT联合创始人赵盛佳为超级智能实验室首席科学家

Meta近日宣布任命ChatGPT联合创始人赵盛佳(Shengjia Zhao)为其新成立的超级智能实验室(Superintelligence Lab)的首席科学家,以加强其在人工智能领域的布局。赵盛佳将负责主导实验室的研究方向,并与Meta首席执...

Read More
2025-07-28 talkingdev

Runway推出Aleph视频模型:支持高保真视频编辑与生成

Runway Research最新发布的Aleph视频模型标志着视频生成与编辑技术的重要突破。该模型具备上下文感知能力,可在视频中进行对象操作、视角转换、风格迁移和光照调整等高保真度编辑任务。其核心技术在于实现了对视频内...

Read More
2025-07-25 talkingdev

[开源]Qwen-MT:速度与智能并行的新一代翻译模型

Qwen-MT最新版本(qwen-mt-turbo)基于强大的Qwen3模型进行了重大升级,在翻译准确性和语言流畅度方面取得了显著提升。该模型通过利用数万亿的多语言和翻译标记,全面增强了其多语言理解和翻译能力。Qwen-MT的关键特...

Read More
2025-07-25 talkingdev

用上下文取代代码:LLM如何重塑在线购物中的查询意图判断(赞助内容)

当用户搜索“游戏电脑”时,应该展示哪些产品?过去,这依赖于基于规则的算法和计算的代码。然而,随着大型语言模型(LLM)的兴起,我们正在进入一个上下文比代码更重要的新时代。在这一新范式下,AI系统能够实时适应...

Read More
2025-07-24 talkingdev

TimeScope:你的视频大模型能处理多长的视频?

TimeScope是一个全新的开源基准测试工具,专门用于评估视觉大模型在处理长视频方面的能力。它不仅测试模型的检索能力,还涵盖了视频合成、时间定位以及细粒度运动分析等多个维度,从而提供对模型时间理解能力的全面...

Read More
2025-07-24 talkingdev

[论文推荐]Voxtral:多模态音频聊天模型新突破

Voxtral团队最新发布了Voxtral Mini和Voxtral Small两款多模态音频聊天模型,在语音理解和文本处理方面均达到业界领先水平。这两款模型能够同时处理语音音频和文本文档,在多项音频基准测试中取得了最先进的性能表现...

Read More
2025-07-24 talkingdev

[开源]GitHub推出Spark项目:无需代码即可创建AI应用

GitHub最新推出的Spark项目标志着软件开发领域的一次重大革新,该项目旨在通过人工智能技术实现"氛围编程"(vibe coding),让不具备专业编程技能的用户也能轻松创建个性化的"微应用"。这一创新工具整合了Anthropic...

Read More
  1. Prev Page
  2. 24
  3. 25
  4. 26
  5. Next Page