漫话开发者 - UWL.ME 精选全球AI前沿科技和开源产品
2025-05-20 talkingdev

[论文推荐]LLM安全评估系统的鲁棒性研究揭示重大漏洞

最新发表在arXiv的研究论文指出,基于大语言模型(LLM)的安全评估系统存在显著脆弱性。研究表明,这类系统的评估可靠性极易受到提示词敏感性和对抗性攻击的影响。该发现对当前快速发展的AI安全评估领域具有重要警示意...

Read More
2025-05-20 talkingdev

微软拥抱MCP协议打造Windows AI智能体生态

微软正将Model Context Protocol(MCP)原生集成至Windows系统,并推出Windows AI Foundry平台,此举将实现AI智能体与操作系统及应用程序的直接交互。该公司采取了严格的安全控制措施,包括防范令牌窃取和提示词注入...

Read More
2025-05-19 talkingdev

[论文推荐]WavReward:基于音频语言模型的对话系统评估新方法

来自arXiv的最新研究论文提出了一种名为WavReward的创新评估系统,该系统基于音频语言模型,专门用于评估语音对话系统在认知和情感指标上的表现。WavReward通过在ChatReward-30K数据集上进行训练,该数据集包含了大...

Read More
2025-05-19 talkingdev

[论文推荐]大型语言模型说服力超越人类:Claude 3.5 Sonnet在辩论实验中表现优异

最新发表在arXiv的研究论文揭示,Anthropic公司开发的Claude 3.5 Sonnet大型语言模型在说服力测试中展现出超越人类的表现。在严格控制的人机对比实验中,当双方都试图影响参与者回答测验问题时,Claude模型取得了7.6...

Read More
2025-05-19 talkingdev

OpenAI推出自主编程代理Codex,可独立完成代码编写与测试

OpenAI近日正式发布了名为Codex的自主编程代理系统,该系统能够在隔离的云环境中独立完成功能开发、缺陷修复以及提交拉取请求等全流程编码任务。据官方介绍,包括思科和Temporal在内的多家科技企业已开始部署该技术...

Read More
2025-05-19 talkingdev

Vaev-从零构建的极速轻量浏览器引擎

开源社区近期迎来一款名为Vaev的实验性浏览器引擎项目,由skift-org团队从零开发。该引擎以极速、轻量级和安全性为核心特性,支持HTML/XHTML解析、CSS层叠规则、@page分页指令及PDF打印渲染等核心功能,甚至能处理ca...

Read More
2025-05-18 talkingdev

脱离笔记本编程:AR眼镜+安卓Linux系统的两周实践

科技博主在Hold The Robot平台分享了一项突破性实验:仅通过AR眼镜和运行Linux系统的安卓设备,完成了为期两周的无笔记本编程挑战。该项目展示了移动计算与增强现实技术的融合潜力,通过Nreal等AR眼镜实现虚拟工作区...

Read More
2025-05-18 talkingdev

Pyrefly:新型Python类型检查IDE体验

Meta(原Facebook)工程团队近日宣布推出Pyrefly的alpha版本,这是一款用Rust编写的开源Python类型检查器和IDE扩展工具。Pyrefly作为静态类型检查器,能够分析Python代码以确保类型安全,提升开发效率并减少运行时错...

Read More
  1. Prev Page
  2. 100
  3. 101
  4. 102
  5. Next Page