自然语言处理的相关内容 - 漫话开发者

2025-07-30 talkingdev

Lumana AI完成4000万美元A轮融资，将视觉语言模型与智能代理AI整合至视频监控系统

人工智能初创公司Lumana AI Inc.近日宣布完成4000万美元的A轮融资，本轮融资由Wing Venture Capital领投。该公司致力于通过人工智能技术革新视频监控领域，其核心创新在于将先进的视觉语言模型（Vision-Language Mod...

2025-07-22 talkingdev

Morphik.ai公司创新性地提出了一种基于视觉的文档检索方法，该方法摒弃了传统的OCR（光学字符识别）和解析技术，转而采用文档页面的图像作为处理对象。通过将文档图像分割成小块，并利用视觉Transformer和语言模型，...

2025-07-22 talkingdev

月之暗面(MoonshotAI)团队最新发布的Kimi K2技术报告揭示了其大型语言模型系列的重大技术突破。该团队创新性地开发出MuonClip技术，通过将token高效的Muon优化器与新型QK-Clip技术相结合，成功解决了万亿参数模型训...

2025-07-22 talkingdev

继OpenAI在周六宣布其模型获得金牌后，Google也宣布其Gemini Deep Think模型在国际数学奥林匹克竞赛（IMO）中解决了六道题目中的五道，并获得了赛事官方认证的金牌标准。这一突破标志着Google在人工智能领域的重大进...

2025-07-18 talkingdev

一项名为“Power”注意力的创新技术通过引入超参数p，实现了对状态大小的独立控制，有效解决了长上下文训练中计算成本平衡的难题。该机制在长序列任务中表现优于标准注意力，并支持定制GPU内核，在64k上下文长度下速度...

2025-07-15 talkingdev

谷歌开发者博客宣布，其首个Gemini Embedding文本模型现已在Gemini API和Vertex AI中正式向开发者开放。这一模型提供了跨领域的统一尖端体验，支持超过100种语言，并具备2048个最大输入标记长度的处理能力。Gemini E...

2025-07-15 talkingdev

一项名为'基于能量的Transformer'（Energy-Based Transformers）的新型架构在机器学习领域取得突破性进展。该技术摒弃了传统的直接预测方式，转而采用学习验证函数来评估输入与候选输出之间的兼容性得分。这种创新架...

2025-07-09 talkingdev

Hugging Face最新推出的SmolLM3是一款完全开源的3B参数语言模型，支持六种语言，具备强大的推理能力和长上下文处理能力。该模型旨在小型模型领域实现高性能，为多语言处理和复杂推理任务提供了新的解决方案。SmolLM3...