漫话开发者 - UWL.ME 精选全球AI前沿科技和开源产品
2025-11-07 talkingdev

谷歌Gemini API推出文件搜索工具:内置RAG系统,简化检索任务

谷歌近日在Gemini API中正式推出文件搜索工具(File Search),这是一个完全托管的检索增强生成(RAG)系统,直接集成于API架构中。该系统通过向量搜索技术实现高效语义匹配,并自动生成引用来源,支持包括PDF、Word...

Read More
2025-11-06 talkingdev

AWS EFA实现万亿参数模型突破:Perplexity发布分布式推理代码

人工智能研究机构Perplexity近日发布突破性代码,首次实现万亿参数混合专家模型在多个AWS服务器间的高效运行。这项技术突破使得算力基础设施相对薄弱的数据中心也能承载尖端AI模型的推理任务。当前大型语言模型面临...

Read More
2025-10-30 talkingdev

分布式SQL数据库白皮书:构建云原生与GenAI时代的数据基石

随着企业数字化转型加速,云原生架构和生成式AI技术正重塑数据基础设施格局。《分布式SQL数据库入门指南》第二版深入剖析了分布式SQL如何通过新型架构满足现代应用需求。该技术通过分布式事务处理、多副本一致性协议...

Read More
2025-10-28 talkingdev

开源|MCP-Scanner:思科AI安全团队推出MCP服务器漏洞扫描工具

思科AI防御实验室近日在GitHub开源了MCP-Scanner工具,专门用于检测MCP(Model Context Protocol)服务器的安全漏洞。该项目上线后迅速获得技术社区关注,在Hacker News平台收获127点讨论热度并引发36条专业评论,反...

Read More
2025-10-26 talkingdev

AI数据中心建设热潮冲击美国制造业复兴计划,资本与人才争夺战加剧

根据彭博社最新分析,美国人工智能数据中心建设浪潮正对经济结构产生深远影响。2025年数据显示,制造业建设支出同比下降2.5%,而数据中心投资却逆势增长近18%。这种资源倾斜现象暴露了AI基础设施扩张与传统制造业复...

Read More
2025-10-24 talkingdev

PyTorch Monarch发布:革命性分布式编程框架重塑AI集群开发范式

PyTorch团队正式推出颠覆性分布式编程框架PyTorch Monarch,该技术通过创新的‘资源本地化’设计理念,将集群编程体验提升至单机Python开发级别。框架采用网格化资源管理架构,支持在数千个GPU上实现分布式张量计算,...

Read More
2025-10-20 talkingdev

阿里云发布Aegaeon GPU池化系统,声称可降低82%英伟达GPU用量

阿里云最新推出的Aegaeon GPU池化技术系统在AI算力领域实现重大突破,通过创新的资源调度机制将大模型推理所需的英伟达GPU数量从1192片缩减至213片,降幅达82%。该系统目前已在阿里云模型市场完成beta测试,其核心技...

Read More
2025-10-19 talkingdev

Prisma Photonics获3000万美元融资,用AI光纤网络实现基础设施智能监控

以色列深度科技公司Prisma Photonics近日完成3000万美元(约合2.2亿元人民币)新一轮融资,使其总融资额达到8000万美元。该公司开创性地利用现有光纤网络结合人工智能技术,实现对关键基础设施的实时监测。通过将普...

Read More
  1. Prev Page
  2. 2
  3. 3
  4. 4
  5. Next Page