新加坡服务器

华侨银行调整 MAS 主导的 Veritas 项目的开源工具包

华侨银行找到了一种方法来调整 MAS 的 Veritas 开源工具包,以便人工智能/机器学习 (AI/ML) 开发人员可以更快、更频繁地测试其模型的“公平性”,并成功地回馈了优化通过 GitHub 访问该项目。

数据科学负责人 Andrea Pisoni 在法国服务器上个月底的一篇简短的 LinkedIn 帖子中透露了该银行的“首次开源贡献”。

成功的拉取请求的更多细节 – 它已于周一正式合并或批准 – 现在已通过 9 月 9 日举行的由 MAS 和华侨银行发言人参与的简报披露。

Veritas 是一项涉及新加坡政府和金融部门的大型计划,旨在“加强围绕人工智能应用以及数据管理和使用的内部治理”。

华侨银行在第二阶段进入 Veritas。

今年早些时候,Veritas 发布了一个工具包,旨在帮助金融机构自动评估其 AI 和 ML 模型的“公平性”。

“当 MAS 发布工具包时,我们希望确保该工具包能够完全集成到我们已经向数据科学家提供的机器学习工程和 MLOps 的所有不同组件中,”Pisoni 在 9 月 9 日的网络研讨会上说。

“我们当时所做的是,我们对 GitHub 存储库英国服务器进行了分叉,并且我们花费了大量的‘卡路里’[精力] 来扩展 Veritas 工具包的功能,有时我们认为会对其进行增强。

“在某个时刻,我们意识到其中一些增强功能实际上是非常好的想法,将它们分享给更广泛的社区是一个好主意。

“所以我们基本上将其中一些增强功能重新合并到开源分支中,然后将其公开。”

当 Pisoni 谈到提交拉取请求时,它的状态仍然是待批准。

GitHub 存储库已更新

本周更新了 GitHub 存储库,显示 OCBC 的优化现已纳入工具包。

华侨银行的改变旨在提高 Veritas 的业绩。

“我们没有改变方法,也没有添加新功能,”Pisoni 说。 “我们使该工具的当前功能运行得更快。”

华侨银行发布的性能测试声称,“计算 AI 公平指标”至少有 10 倍的“加速”是可能的。

“加速与数据集呈线性关系,因此您会看到小型和大型数据集的 [改进],但当然,当您拥有大型数据集时,它变得非常重要,”Pisoni 说。

“使用 1000 万行数据集,今天计算公平性大约需要 1 小时 40 分钟,而在我们进行更改后,只需要 10 分钟。”

Pisoni 说,有充分的理由希望以比最初允许的工具包更快的速度计算模型的公平性,这主要是由于创建模型的迭代和实验方式。

“这意味着现在你可以在开发过程中迭代地计算 [公平性],然后……为不同的模型组合计算多次,”他说。

“通常,你不会只计算一次公平性——你正在开发你的模型,你正在尝试不同的事情,当你尝试不同的事情时,你想计算公平性以了解你在公平性要求中所处的位置。

“所以你可能需要多次计算公平性,如果每次都需要几个小时来计算,那是行不通的。”

Pisoni 指出,开发人员——以及他们工作的机构——也希望得到关于模型公平性的快速反馈。

他说:“更有效地计算公平性可以实现我们所说的更精细的不公平识别,你可以真正去了解你的团队中哪些客户的口袋受到了不公平的对待。”

银行的“大步”

Pisoni 表示,开源优化工作的决定对银行来说是“一大步”。

“这是华侨银行第一次公开任何代码,”他说。

“你可以想象我们必须通过一些 [内部] 审批程序和一些难以回答的问题,但我很高兴地说,德国服务器华侨银行的领导层非常支持我们的创新之旅,所以希望这只是众多项目中的第一个华侨银行将做出的开源贡献。”

Pisoni 表示,华侨银行支持其改变的效用,并认为这些改变有可能使更广泛的行业以及新加坡受益; Veritas 是新加坡国家人工智能战略的一部分,也是政府的一项高知名度计划。

“不仅所有其他银行将能够更快地计算 [公平检查],而且他们的客户可能不会更多地受到不公平决策的影响,这为国家,”皮索尼说。

更多可能的贡献

Pisoni 补充说,性能提升是针对 AI/ML 模型的两阶段银行相关用例 – 信用风险