漫话开发者 - UWL.ME 精选全球AI前沿科技和开源产品
2025-05-05 talkingdev

谷歌推出开源AI模型SpeciesNet,助力生物多样性监测

谷歌近日发布了开源AI模型SpeciesNet,该模型专为通过相机陷阱图像识别动物物种而设计。SpeciesNet此前已应用于Wildlife Insights平台,其开源将显著提升全球生物多样性监测的规模与效率。这一技术突破结合了计算机...

Read More
2025-04-04 talkingdev

[论文推荐]CLIP模型存在后门攻击漏洞:仅需少量数据即可实现近100%攻击成功率

最新研究发现,当前广泛应用的CLIP(Contrastive Language-Image Pretraining)多模态模型存在严重的安全隐患。根据arXiv最新论文披露,攻击者通过数据投毒(poisoning)方式植入后门,仅需污染0.5%的训练数据即可实...

Read More
2025-03-31 talkingdev

[开源]Awesome Vision-to-Music Generation:视觉转音乐生成技术全景图

GitHub热门项目Awesome Vision-to-Music Generation系统性地整理了视觉到音乐(V2M)生成领域的前沿进展,涵盖学术研究突破与工业级应用方案。该项目持续更新的资源库整合了三大核心要素:1)基于深度学习的跨模态生...

Read More
2025-03-19 talkingdev

[论文推荐]SmolDocling:极小型高效文档OCR模型

近日,一款名为SmolDocling的新型文档OCR(光学字符识别)模型引发广泛关注。该模型以其极小的规模和高效的性能脱颖而出,成为文档处理领域的最新突破。SmolDocling不仅能够实现闪电般的处理速度,还具备足够的准确...

Read More
2025-03-12 talkingdev

NIST选定HQC作为后量子加密第五种算法

美国国家标准与技术研究院(NIST)近日宣布,已将HQC(Hamming Quasi-Cyclic)算法选为后量子加密标准化进程中的第五种算法。这一决定标志着NIST在后量子密码学领域的进一步推进,旨在应对未来量子计算机可能带来的...

Read More
2025-02-24 talkingdev

谷歌发布SigLIP2:图像与文本编码模型的重大升级

SigLIP2作为SigLIP的升级版本,在多个方面实现了显著改进。SigLIP原本是一款广受欢迎的联合图像与文本编码模型,而SigLIP2在零样本分类性能上取得了重大突破,这一性能曾是CLIP模型的标志性成果。此次升级不仅提升了...

Read More
2025-01-24 talkingdev

OpenAI推出全新AI代理Operator,实现浏览器自动化操作

OpenAI近日发布了名为Operator的全新AI代理,该代理能够通过与浏览器交互,执行诸如输入、点击和滚动等操作。Operator基于Computer-Using Agent (CUA)模型,结合了GPT-4的视觉能力和强化学习技术,使其能够在图形界...

Read More
2025-01-22 talkingdev

新型0点击去匿名化攻击威胁Signal、Discord等平台

近期,安全研究者披露了一种新型网络攻击方式——0-click去匿名化攻击,该攻击无需用户任何交互即可实施。攻击者利用信号处理平台Signal、Discord等软件存在的安全漏洞,通过发送特制的恶意链接或文件,诱导用户点击,...

Read More
  1. Prev Page
  2. 11
  3. 12
  4. 13
  5. Next Page