自然语言的相关内容 - 漫话开发者

2025-07-30 talkingdev

Lumana AI完成4000万美元A轮融资，将视觉语言模型与智能代理AI整合至视频监控系统

人工智能初创公司Lumana AI Inc.近日宣布完成4000万美元的A轮融资，本轮融资由Wing Venture Capital领投。该公司致力于通过人工智能技术革新视频监控领域，其核心创新在于将先进的视觉语言模型（Vision-Language Mod...

2025-07-24 talkingdev

GitHub最新推出的Spark项目标志着软件开发领域的一次重大革新，该项目旨在通过人工智能技术实现"氛围编程"（vibe coding），让不具备专业编程技能的用户也能轻松创建个性化的"微应用"。这一创新工具整合了Anthropic...

2025-07-22 talkingdev

Morphik.ai公司创新性地提出了一种基于视觉的文档检索方法，该方法摒弃了传统的OCR（光学字符识别）和解析技术，转而采用文档页面的图像作为处理对象。通过将文档图像分割成小块，并利用视觉Transformer和语言模型，...

2025-07-22 talkingdev

月之暗面(MoonshotAI)团队最新发布的Kimi K2技术报告揭示了其大型语言模型系列的重大技术突破。该团队创新性地开发出MuonClip技术，通过将token高效的Muon优化器与新型QK-Clip技术相结合，成功解决了万亿参数模型训...

2025-07-22 talkingdev

继OpenAI在周六宣布其模型获得金牌后，Google也宣布其Gemini Deep Think模型在国际数学奥林匹克竞赛（IMO）中解决了六道题目中的五道，并获得了赛事官方认证的金牌标准。这一突破标志着Google在人工智能领域的重大进...

2025-07-21 talkingdev

Kilo Code是由Kilo-Org团队推出的开源VS Code AI编程助手，其创新性地整合了Roo Code和Cline的核心功能，并加入自主开发特性，形成功能超集。该项目支持通过自然语言生成代码、自动化任务处理等高级功能，显著提升开...

2025-07-18 talkingdev

一项名为“Power”注意力的创新技术通过引入超参数p，实现了对状态大小的独立控制，有效解决了长上下文训练中计算成本平衡的难题。该机制在长序列任务中表现优于标准注意力，并支持定制GPU内核，在64k上下文长度下速度...

2025-07-16 talkingdev

近日，GitHub上出现了一个名为`react-native-apple-llm`的开源插件，该插件允许React Native开发者直接调用苹果设备端的Foundation Models（基础模型）来完成AI任务。这一技术突破为移动应用开发者提供了更便捷的AI...