漫话开发者 - UWL.ME 精选全球AI前沿科技和开源产品
2025-07-25 talkingdev

用上下文取代代码:LLM如何重塑在线购物中的查询意图判断(赞助内容)

当用户搜索“游戏电脑”时,应该展示哪些产品?过去,这依赖于基于规则的算法和计算的代码。然而,随着大型语言模型(LLM)的兴起,我们正在进入一个上下文比代码更重要的新时代。在这一新范式下,AI系统能够实时适应...

Read More
2025-07-24 talkingdev

TimeScope:你的视频大模型能处理多长的视频?

TimeScope是一个全新的开源基准测试工具,专门用于评估视觉大模型在处理长视频方面的能力。它不仅测试模型的检索能力,还涵盖了视频合成、时间定位以及细粒度运动分析等多个维度,从而提供对模型时间理解能力的全面...

Read More
2025-07-24 talkingdev

[论文推荐]Voxtral:多模态音频聊天模型新突破

Voxtral团队最新发布了Voxtral Mini和Voxtral Small两款多模态音频聊天模型,在语音理解和文本处理方面均达到业界领先水平。这两款模型能够同时处理语音音频和文本文档,在多项音频基准测试中取得了最先进的性能表现...

Read More
2025-07-24 talkingdev

[开源]GitHub推出Spark项目:无需代码即可创建AI应用

GitHub最新推出的Spark项目标志着软件开发领域的一次重大革新,该项目旨在通过人工智能技术实现"氛围编程"(vibe coding),让不具备专业编程技能的用户也能轻松创建个性化的"微应用"。这一创新工具整合了Anthropic...

Read More
2025-07-23 talkingdev

[开源] Any LLM:Mozilla推出统一接口库,轻松切换不同大语言模型

Mozilla AI实验室近日在GitHub开源了Python库Any LLM,该项目旨在为开发者提供与多种大语言模型(如Mistral、OpenAI等)交互的统一接口。该工具通过标准化API调用方式显著降低了模型切换的技术门槛,其核心优势包括...

Read More
2025-07-23 talkingdev

[开源]Qwen3-Coder:全球领先的智能编码代理模型问世

通义千问团队正式发布Qwen3-Coder,这是迄今为止最先进的智能编码代理模型。该模型采用4800亿参数的混合专家架构(Mixture-of-Experts),其中激活参数达350亿,并支持超长上下文处理。在智能编码、浏览器操作和工具...

Read More
2025-07-23 talkingdev

AI市场格局明朗:LLM与垂直领域领导者浮出水面

过去12个月中,AI市场格局已显著清晰化。在大型语言模型(LLM)领域,Anthropic、Google、Meta、xAI和OpenAI已成为明确领导者;垂直赛道方面,法律科技领域的Harvey和CaseText,以及编程领域的Microsoft/GitHub与Ope...

Read More
2025-07-23 talkingdev

[开源]Gemini CLI出现幻觉导致用户文件被删除,引发开发者社区热议

近日,开发者anuraag2601在个人博客中详细记录了一次由Gemini CLI工具引发的严重事故。该工具在执行过程中出现AI幻觉现象,错误地删除了用户的文件系统内容。这一事件在Hacker News上迅速引发热议,获得145个点赞和1...

Read More
  1. Prev Page
  2. 114
  3. 115
  4. 116
  5. Next Page