漫话开发者 - UWL.ME 精选全球AI前沿科技和开源产品
2025-05-22 talkingdev

谷歌推出Gemini Diffusion:首个采用扩散模型替代Transformer的大语言模型

谷歌最新发布的Gemini Diffusion标志着大语言模型架构的重大突破,这是该公司首次采用扩散模型(Diffusion Model)完全替代传统的Transformer架构。技术文档显示,该模型在保持与Gemini 2.0 Flash-Lite相当性能表现...

Read More
2025-05-19 talkingdev

[开源] 使用SBERT建模《伏尼契手稿》结构:NLP技术探索中世纪未解之谜

一位开发者利用自然语言处理(NLP)技术对神秘的《伏尼契手稿》进行了结构性分析。该手稿是15世纪以未知文字书写的古籍,至今未被破译,其真实性也饱受争议。项目采用SBERT(Sentence-BERT)模型生成词根嵌入,结合K...

Read More
2025-05-15 talkingdev

语义计算器新尝试:词向量加减法探索(king-man+woman=?)

近日,一款基于词向量嵌入技术的语义计算器引发开发者社区关注。该工具突破传统词向量演示案例(如经典的king-man+woman=queen),通过距离计算和余弦相似度排序,全面展示词汇加减运算的语义结果。开发者透露,当前...

Read More
2025-05-05 talkingdev

[开源]WebThinker:赋能大语言模型的深度研究框架

中国人民大学自然语言处理实验室推出的WebThinker框架,标志着大语言模型(LRMs)向自主科研领域迈出关键一步。该开源项目通过构建深度研究架构,使LRMs具备三项突破性能力:1)智能化的全网信息检索系统,可自主定...

Read More
2025-05-02 talkingdev

谷歌医疗AI突破:AMIE新增医学影像分析能力,实现类医生精准诊疗

谷歌研究团队近日宣布其医疗对话AI系统AMIE(Articulate Medical Intelligence Explorer)取得重大升级,新增医学影像分析功能。这一突破性进展使AMIE在基于聊天的诊断过程中能够同步解读X光片、CT扫描等医学影像,...

Read More
2025-05-01 talkingdev

NotebookLM音频播客现已支持超过50种语言

谷歌实验室最新宣布,其AI笔记工具NotebookLM的音频概述功能已扩展至50多种语言,标志着该技术在多语言支持方面取得重大突破。这一更新使得全球更多用户能够通过语音交互快速获取文档摘要,显著提升了知识管理效率。...

Read More
2025-04-18 talkingdev

Meta发布多项AI新成果:图像编码器、视觉语言模型及3D物体定位系统

Meta公司近日重磅推出四项人工智能领域的重要技术成果:1)高性能图像编码器,可优化视觉数据的特征提取效率;2)视觉语言模型(VLM),实现跨模态理解与生成;3)基于联合嵌入预测架构(JEPA)的3D物体定位模型,突...

Read More
2025-04-16 talkingdev

MoonDream 2.0重磅升级:2B参数小模型性能超越主流开源与闭源模型

近日,轻量级视觉语言模型MoonDream迎来2.0版本重大更新。这款仅含20亿参数的VLM(Vision-Language Model)在最新测试中展现出惊人实力,其性能不仅超越多个同量级开源模型,甚至在部分基准测试中优于参数规模更大的...

Read More
  1. Prev Page
  2. 3
  3. 4
  4. 5
  5. Next Page