AI模型的相关内容 - 漫话开发者

2025-11-06 talkingdev

AWS EFA实现万亿参数模型突破：Perplexity发布分布式推理代码

人工智能研究机构Perplexity近日发布突破性代码，首次实现万亿参数混合专家模型在多个AWS服务器间的高效运行。这项技术突破使得算力基础设施相对薄弱的数据中心也能承载尖端AI模型的推理任务。当前大型语言模型面临...

2025-10-27 talkingdev

一位开发者在构建稀疏自编码器时遭遇了罕见的PyTorch框架底层Bug。该问题表现为模型训练损失函数持续处于平台期，经深度排查发现根本原因在于苹果硅GPU（MPS）后端执行Adam优化器时，由于内存处理机制缺陷导致部分张...

2025-10-27 talkingdev

Anthropic研究团队在《Circuits Updates – October 2025》中披露了令人振奋的发现：其大型语言模型Claude的内部神经元展现出跨模态理解能力。实验表明，当模型处理文字“眼睛”时激活的特定神经元，在遇到用@符号排列...

2025-10-27 talkingdev

据《金融时报》科技记者Cristina Criddle报道，企业支出管理平台AppZen等机构发现，员工正利用先进图像生成模型制作难以辨伪的虚假报销票据。这一趋势与生成式AI技术的突破直接相关，当前主流AI模型已能生成包含完整...

2025-10-26 talkingdev

微软近期在Windows 11公开测试版中推出的游戏副驾（Gaming Copilot）功能引发业界关注。该功能通过实时截图分析游戏场景，为玩家提供策略建议和操作辅助，但官方明确表示这些截图数据仅用于实时交互理解，不会用于训...

2025-10-23 talkingdev

最新数据显示，OpenAI开发的对话式AI模型ChatGPT在用户留存率方面实现突破性进展。其月度用户留存率从两年前的不足60%急剧上升至约90%，这一数据已超越长期被视为行业标杆的YouTube（约85%留存率）。更值得关注的是...

2025-10-20 talkingdev

阿里云最新推出的Aegaeon GPU池化技术系统在AI算力领域实现重大突破，通过创新的资源调度机制将大模型推理所需的英伟达GPU数量从1192片缩减至213片，降幅达82%。该系统目前已在阿里云模型市场完成beta测试，其核心技...

2025-10-17 talkingdev

近日，开发者通过Google AI Studio的A/B测试功能，意外捕捉到尚未正式发布的Gemini 3.0模型踪迹。该测试以SVG矢量图形生成作为核心评估标准，通过对比不同版本模型的输出质量，间接验证了新一代模型在复杂结构化数据...