漫话开发者 - UWL.ME 精选全球AI前沿科技和开源产品
2025-01-31 talkingdev

Chatbot Arena排名被操纵,GitHub仓库揭示技术漏洞

近日,研究人员通过GitHub仓库公开了一项研究,展示了Chatbot Arena的众包投票系统可以被操纵,从而影响模型排名的可靠性。研究表明,通过战略性操纵技术,某些模型可以在排行榜上被提升或降低排名。这一发现引发了...

Read More
2025-01-31 talkingdev

VIRUS方法突破LLM安全防护,开源项目引发关注

近日,一种名为VIRUS的方法在GitHub上开源,该方法旨在生成对抗性数据,以绕过大型语言模型(LLM)的审核系统,并破坏其安全对齐机制。VIRUS通过精心设计的输入数据,能够有效规避现有的内容过滤和防护措施,从而对L...

Read More
2025-01-31 talkingdev

论文:Reqo推出基于Bi-GNN与概率ML的可解释查询优化模型

近日,Reqo推出了一款全新的查询优化模型,该模型结合了双向图神经网络(Bi-GNN)与概率机器学习(ML)技术,旨在提升查询成本估算的准确性。与传统方法不同,Reqo引入了一种创新的可解释性技术,能够突出查询子图的...

Read More
2025-01-31 talkingdev

论文:SliceOcc推出新型垂直切片表示法,革新3D语义占用预测

近日,SliceOcc推出了一种创新的垂直切片表示法,专门用于密集室内环境中的3D语义占用预测。这一技术通过基于RGB摄像头的模型,实现了业界领先的性能表现。SliceOcc的方法不仅提高了预测的准确性,还在处理复杂室内...

Read More
2025-01-31 talkingdev

Acoupi:开源Python框架助力AI驱动的生物声学监测

Acoupi是一款开源的Python框架,旨在简化基于AI的生物声学监测在低成本设备上的部署。该框架集成了录音、处理和实时消息传递功能,为研究人员和开发者提供了一个高效的工具,用于监测和分析自然环境中的声音数据。通...

Read More
2025-01-29 talkingdev

深度解析DeepSeek的R1-Zero与R1技术架构

近日,DeepSeek公司发布了其最新的R1-Zero和R1技术架构,引发了业界的广泛关注。R1-Zero作为一款轻量级模型,专注于低资源环境下的高效运行,特别适用于边缘计算和物联网设备。其采用了先进的LoRA技术,能够在保持高...

Read More
2025-01-29 talkingdev

SmolGPT:基于PyTorch的轻量级LLM训练框架开源

近日,一款名为SmolGPT的轻量级PyTorch实现框架正式发布,旨在帮助开发者从零开始训练小型LLM(Large Language Model)。该框架以其简洁的设计和高效的性能吸引了广泛关注。SmolGPT通过优化模型结构和训练流程,显著...

Read More
2025-01-29 talkingdev

本地部署DeepSeek-R1模型的完整硬件+软件配置解析

本文详细介绍了一种价值6000美元的硬件配置方案,用于在本地环境中运行完整的DeepSeek-R1模型。该配置方案需要两台CPU和768GB的RAM,跨越24个RAM通道。虽然方案中并未包含GPU,但可以额外添加GPU以提高模型生成速度...

Read More
  1. Prev Page
  2. 38
  3. 39
  4. 40
  5. Next Page