最新发表在arXiv的研究论文指出,基于大语言模型(LLM)的安全评估系统存在显著脆弱性。研究表明,这类系统的评估可靠性极易受到提示词敏感性和对抗性攻击的影响。该发现对当前快速发展的AI安全评估领域具有重要警示意...
Read More微软正将Model Context Protocol(MCP)原生集成至Windows系统,并推出Windows AI Foundry平台,此举将实现AI智能体与操作系统及应用程序的直接交互。该公司采取了严格的安全控制措施,包括防范令牌窃取和提示词注入...
Read More来自arXiv的最新研究论文提出了一种名为WavReward的创新评估系统,该系统基于音频语言模型,专门用于评估语音对话系统在认知和情感指标上的表现。WavReward通过在ChatReward-30K数据集上进行训练,该数据集包含了大...
Read More最新发表在arXiv的研究论文揭示,Anthropic公司开发的Claude 3.5 Sonnet大型语言模型在说服力测试中展现出超越人类的表现。在严格控制的人机对比实验中,当双方都试图影响参与者回答测验问题时,Claude模型取得了7.6...
Read MoreOpenAI近日正式发布了名为Codex的自主编程代理系统,该系统能够在隔离的云环境中独立完成功能开发、缺陷修复以及提交拉取请求等全流程编码任务。据官方介绍,包括思科和Temporal在内的多家科技企业已开始部署该技术...
Read More开源社区近期迎来一款名为Vaev的实验性浏览器引擎项目,由skift-org团队从零开发。该引擎以极速、轻量级和安全性为核心特性,支持HTML/XHTML解析、CSS层叠规则、@page分页指令及PDF打印渲染等核心功能,甚至能处理ca...
Read More科技博主在Hold The Robot平台分享了一项突破性实验:仅通过AR眼镜和运行Linux系统的安卓设备,完成了为期两周的无笔记本编程挑战。该项目展示了移动计算与增强现实技术的融合潜力,通过Nreal等AR眼镜实现虚拟工作区...
Read MoreMeta(原Facebook)工程团队近日宣布推出Pyrefly的alpha版本,这是一款用Rust编写的开源Python类型检查器和IDE扩展工具。Pyrefly作为静态类型检查器,能够分析Python代码以确保类型安全,提升开发效率并减少运行时错...
Read More