漫话开发者 - UWL.ME 精选全球AI前沿科技和开源产品
2025-01-31 talkingdev

VIRUS方法突破LLM安全防护,开源项目引发关注

近日,一种名为VIRUS的方法在GitHub上开源,该方法旨在生成对抗性数据,以绕过大型语言模型(LLM)的审核系统,并破坏其安全对齐机制。VIRUS通过精心设计的输入数据,能够有效规避现有的内容过滤和防护措施,从而对L...

Read More
2025-01-31 talkingdev

论文:Reqo推出基于Bi-GNN与概率ML的可解释查询优化模型

近日,Reqo推出了一款全新的查询优化模型,该模型结合了双向图神经网络(Bi-GNN)与概率机器学习(ML)技术,旨在提升查询成本估算的准确性。与传统方法不同,Reqo引入了一种创新的可解释性技术,能够突出查询子图的...

Read More
2025-01-31 talkingdev

论文:SliceOcc推出新型垂直切片表示法,革新3D语义占用预测

近日,SliceOcc推出了一种创新的垂直切片表示法,专门用于密集室内环境中的3D语义占用预测。这一技术通过基于RGB摄像头的模型,实现了业界领先的性能表现。SliceOcc的方法不仅提高了预测的准确性,还在处理复杂室内...

Read More
2025-01-31 talkingdev

Acoupi:开源Python框架助力AI驱动的生物声学监测

Acoupi是一款开源的Python框架,旨在简化基于AI的生物声学监测在低成本设备上的部署。该框架集成了录音、处理和实时消息传递功能,为研究人员和开发者提供了一个高效的工具,用于监测和分析自然环境中的声音数据。通...

Read More
2025-01-29 talkingdev

深度解析DeepSeek的R1-Zero与R1技术架构

近日,DeepSeek公司发布了其最新的R1-Zero和R1技术架构,引发了业界的广泛关注。R1-Zero作为一款轻量级模型,专注于低资源环境下的高效运行,特别适用于边缘计算和物联网设备。其采用了先进的LoRA技术,能够在保持高...

Read More
2025-01-29 talkingdev

SmolGPT:基于PyTorch的轻量级LLM训练框架开源

近日,一款名为SmolGPT的轻量级PyTorch实现框架正式发布,旨在帮助开发者从零开始训练小型LLM(Large Language Model)。该框架以其简洁的设计和高效的性能吸引了广泛关注。SmolGPT通过优化模型结构和训练流程,显著...

Read More
2025-01-29 talkingdev

本地部署DeepSeek-R1模型的完整硬件+软件配置解析

本文详细介绍了一种价值6000美元的硬件配置方案,用于在本地环境中运行完整的DeepSeek-R1模型。该配置方案需要两台CPU和768GB的RAM,跨越24个RAM通道。虽然方案中并未包含GPU,但可以额外添加GPU以提高模型生成速度...

Read More
2025-01-28 talkingdev

Llama推理模型在GitHub Gist上的最新进展

近日,GitHub Gist上发布了一个关于Llama推理模型的最小化工作复现版本。该模型最初由OpenAI提出,并由DeepSeek发布。该模型通过数学问题的格式和正确性奖励进行训练,展示了在长时间训练后出现的“顿悟”时刻。这一进...

Read More
  1. Prev Page
  2. 50
  3. 51
  4. 52
  5. Next Page