漫话开发者 - UWL.ME 精选全球AI前沿科技和开源产品
2023-12-12 talkingdev

Giskard开源:针对从表格到LLMs的模型测试框架

Giskard是一个开源的测试框架,用于测试从表格到LLMs的机器学习模型。它通过检查模型的输出和真实值之间的差异来评估模型的性能。Giskard不仅可以测试模型的预测能力,还可以测量它的稳定性、可解释性和鲁棒性。Gisk...

Read More
2023-11-07 talkingdev

Giskard:LLM和ML模型的开源测试框架

Giskard是一个Python库,可以自动检测从表格模型到LLM的AI模型的漏洞,包括:性能偏见、数据泄露、虚假相关性、幻觉、毒性、安全问题等等。让您的模型快速、安全地投入生产。在GitHub上安装Giskard或在Colab中尝试。

Read More
2023-08-17 talkingdev

Uber货运和Airbnb前员工共同推出AI经纪人服务,助力货运业务升级

尽管近年来自动化技术已经得到广泛应用,但每年仍有超过10亿个电话用于协调美国的货运业务。FleetWorks是一种新型的自动化系统,它利用语音合成技术、生成式AI以及与传统物流系统的集成,来自动处理这些电话。比如,...

Read More
2023-07-25 talkingdev

ChatGPT即将登陆安卓平台

ChatGPT已经在谷歌Play商店开始预注册,预计将在下周进行发布。ChatGPT是一款基于人工智能的聊天机器人,它可以理解和生成人类的自然语言,为用户提供了一种全新的交互方式。这款应用的上线对于谷歌Play商店而言无疑...

Read More
2023-06-27 talkingdev

Giskard:一个专注于机器学习模型测试的开源框架

Giskard是一个专注于机器学习模型测试的开源框架,适用于从表格模型到LLM(Language Learning Models)的各种模型。该框架提供了一套强大的工具和方法,帮助开发人员测试和验证机器学习模型的准确性和鲁棒性。Giskar...

Read More
  1. Prev Page