漫话开发者 - UWL.ME 精选全球AI前沿科技和开源产品
2025-08-10 talkingdev

实测Alexa+:多轮对话流畅但漏洞频出,基础功能反而不如旧版?

《纽约时报》科技专栏作者Kevin Roose对亚马逊最新推出的智能语音助手Alexa+进行了深度体验。这款被寄予厚望的升级版展现出两大技术特性:采用更先进的自然语言处理架构,实现了接近人类对话的交互流畅度;在多步骤...

Read More
2025-08-04 talkingdev

LangExtract:基于LLM的文本结构化信息提取库

Google近日在GitHub开源了LangExtract项目,这是一个基于大语言模型(LLM)的Python库,专门用于从非结构化文本中提取结构化信息。该库允许用户通过自定义指令,将杂乱的文本数据转化为可靠的格式化输出。其核心技术...

Read More
2025-08-01 talkingdev

Python实现MCP服务器:基于Gradio的AI购物助手开发指南

本文详细介绍了一种前沿的AI购物助手的开发过程,该助手能够浏览在线服装商店、定位特定服装,并生成虚拟试穿预览,展示服装在用户身上的效果。该技术结合了计算机视觉、自然语言处理和机器学习的最新进展,通过Grad...

Read More
2025-07-30 talkingdev

Lumana AI完成4000万美元A轮融资,将视觉语言模型与智能代理AI整合至视频监控系统

人工智能初创公司Lumana AI Inc.近日宣布完成4000万美元的A轮融资,本轮融资由Wing Venture Capital领投。该公司致力于通过人工智能技术革新视频监控领域,其核心创新在于将先进的视觉语言模型(Vision-Language Mod...

Read More
2025-07-22 talkingdev

Morphik.ai提出视觉文档检索新方法:用图像替代传统OCR解析

Morphik.ai公司创新性地提出了一种基于视觉的文档检索方法,该方法摒弃了传统的OCR(光学字符识别)和解析技术,转而采用文档页面的图像作为处理对象。通过将文档图像分割成小块,并利用视觉Transformer和语言模型,...

Read More
2025-07-22 talkingdev

[开源]MoonshotAI发布Kimi K2技术报告:突破万亿参数模型训练瓶颈

月之暗面(MoonshotAI)团队最新发布的Kimi K2技术报告揭示了其大型语言模型系列的重大技术突破。该团队创新性地开发出MuonClip技术,通过将token高效的Muon优化器与新型QK-Clip技术相结合,成功解决了万亿参数模型训...

Read More
2025-07-22 talkingdev

Gemini Deep Think 模型在国际数学奥林匹克竞赛中达到金牌标准

继OpenAI在周六宣布其模型获得金牌后,Google也宣布其Gemini Deep Think模型在国际数学奥林匹克竞赛(IMO)中解决了六道题目中的五道,并获得了赛事官方认证的金牌标准。这一突破标志着Google在人工智能领域的重大进...

Read More
2025-07-18 talkingdev

[论文推荐] 突破长文本限制:新型“Power”注意力机制实现高效训练

一项名为“Power”注意力的创新技术通过引入超参数p,实现了对状态大小的独立控制,有效解决了长上下文训练中计算成本平衡的难题。该机制在长序列任务中表现优于标准注意力,并支持定制GPU内核,在64k上下文长度下速度...

Read More
  1. Prev Page
  2. 6
  3. 7
  4. 8
  5. Next Page