漫话开发者 - UWL.ME 精选全球AI前沿科技和开源产品
2025-07-22 talkingdev

Morphik.ai提出视觉文档检索新方法:用图像替代传统OCR解析

Morphik.ai公司创新性地提出了一种基于视觉的文档检索方法,该方法摒弃了传统的OCR(光学字符识别)和解析技术,转而采用文档页面的图像作为处理对象。通过将文档图像分割成小块,并利用视觉Transformer和语言模型,...

Read More
2025-07-22 talkingdev

[开源]MoonshotAI发布Kimi K2技术报告:突破万亿参数模型训练瓶颈

月之暗面(MoonshotAI)团队最新发布的Kimi K2技术报告揭示了其大型语言模型系列的重大技术突破。该团队创新性地开发出MuonClip技术,通过将token高效的Muon优化器与新型QK-Clip技术相结合,成功解决了万亿参数模型训...

Read More
2025-07-22 talkingdev

无需解析文档:直接使用图像进行RAG检索

从复杂的PDF中提取信息一直是个棘手的问题。行业在OCR(光学字符识别)、布局检测和解析流程上投入了大量精力和资金,却仍可能丢失最关键的信息。如今,视觉语言模型(Vision Language Models)已经足够强大,能够直...

Read More
2025-07-22 talkingdev

Gemini Deep Think 模型在国际数学奥林匹克竞赛中达到金牌标准

继OpenAI在周六宣布其模型获得金牌后,Google也宣布其Gemini Deep Think模型在国际数学奥林匹克竞赛(IMO)中解决了六道题目中的五道,并获得了赛事官方认证的金牌标准。这一突破标志着Google在人工智能领域的重大进...

Read More
2025-07-21 talkingdev

[开源]Kilo Code:融合Roo与Cline特性的开源AI编程助手,提供免费额度

Kilo Code是由Kilo-Org团队推出的开源VS Code AI编程助手,其创新性地整合了Roo Code和Cline的核心功能,并加入自主开发特性,形成功能超集。该项目支持通过自然语言生成代码、自动化任务处理等高级功能,显著提升开...

Read More
2025-07-20 talkingdev

Dor Brothers视频工作室:仅用AI工具创作颠覆性内容,全网播放量破亿

记者Stuart A. Thompson深入报道了Dor Brothers视频工作室的创新实践。这个工作室通过完全依赖AI工具制作具有颠覆性的病毒式视频,在各大平台累计获得超过1亿次观看。报道中描述了一个标志性场景:前总统特朗普在豪...

Read More
2025-07-19 talkingdev

扎克伯格重金挖角OpenAI:向10余名研究员开出3亿美元四年薪酬包,并接触知名研究员Mark Chen

据《华尔街日报》报道,Meta CEO马克·扎克伯格近期发起了一场针对OpenAI顶尖研究人员的激烈挖角行动。消息人士透露,扎克伯格已向超过10名OpenAI研究人员提供了总额达3亿美元的四年期薪酬方案,平均每人每年可获得约...

Read More
2025-07-19 talkingdev

Vy Capital宣布不再募集外部资金,该机构是马斯克旗下公司的主要支持者

据《金融时报》记者Ivan Levingston报道,管理资产约150亿美元的Vy Capital已告知外部投资者,将不再募集更多外部资金。Vy Capital是一家低调的科技投资集团,曾成功投资SpaceX和xAI等埃隆·马斯克旗下的公司,并因此...

Read More
  1. Prev Page
  2. 182
  3. 183
  4. 184
  5. Next Page