漫话开发者 - UWL.ME 精选全球AI前沿科技和开源产品
2025-05-02 talkingdev

微软OmniParser v2.0:全新截图解析工具性能大提升

微软近日发布了其广受欢迎的截图解析工具OmniParser的重大版本更新——OmniParser v2.0。作为一款领先的视觉信息处理工具,新版本在Screenshot Pro基准测试中表现优异,展现了微软在计算机视觉和自然语言处理领域的技...

Read More
2025-05-02 talkingdev

谷歌医疗AI突破:AMIE新增医学影像分析能力,实现类医生精准诊疗

谷歌研究团队近日宣布其医疗对话AI系统AMIE(Articulate Medical Intelligence Explorer)取得重大升级,新增医学影像分析功能。这一突破性进展使AMIE在基于聊天的诊断过程中能够同步解读X光片、CT扫描等医学影像,...

Read More
2025-05-02 talkingdev

[开源] Linkwarden:支持AI自动标签与页面存档的自托管开源书签工具

开源项目Linkwarden近日引发技术社区关注,作为一款自托管书签管理工具,其创新性整合了AI自动标签生成和网页存档两大核心功能。该项目采用FOSS(自由开源软件)模式,允许用户完全掌控数据隐私,通过本地化部署规避...

Read More
2025-05-01 talkingdev

小米MiMo推理模型开源:解锁语言模型的推理潜力

小米近日在GitHub上开源了MiMo推理模型项目,该项目旨在解锁语言模型的推理潜力,涵盖从预训练到后训练的全过程。MiMo模型通过优化训练流程和引入新的推理机制,显著提升了语言模型在复杂任务中的表现。这一开源项目...

Read More
2025-05-01 talkingdev

NotebookLM音频播客现已支持超过50种语言

谷歌实验室最新宣布,其AI笔记工具NotebookLM的音频概述功能已扩展至50多种语言,标志着该技术在多语言支持方面取得重大突破。这一更新使得全球更多用户能够通过语音交互快速获取文档摘要,显著提升了知识管理效率。...

Read More
2025-05-01 talkingdev

Inception Labs发布商用级扩散语言模型Mercury

人工智能研究机构Inception Labs近日正式发布了商用级扩散语言模型Mercury,标志着自然语言处理技术向大规模商业化应用迈出重要一步。该模型基于先进的扩散概率模型框架,通过多阶段训练策略实现了文本生成的稳定性...

Read More
2025-04-30 talkingdev

IBM开源Bamba模型:融合Transformer与SSM优势的新型大语言模型

IBM研究院近日推出开源大语言模型Bamba,该模型创新性地结合了Transformer架构的序列建模能力和状态空间模型(SSM)的推理速度优势。作为IBM Granite系列模型的技术前导,Bamba通过注意力机制与状态空间方程的混合设...

Read More
2025-04-25 talkingdev

MiniPLM框架发布:利用大模型知识提升小语言模型预训练效率

近日,自然语言处理领域迎来一项重要技术突破——MiniPLM框架正式发布。该框架创新性地提出了一种高效的小型语言模型(SLM)预训练方法,通过从大型语言模型(LLM)中提取知识进行蒸馏训练,显著提升了小模型的性能表...

Read More
  1. Prev Page
  2. 12
  3. 13
  4. 14
  5. Next Page