
Stripe Transformer支付模型:显著提升欺诈检测率
Stripe利用Transformer构建支付基础模型,通过自监督学习交易嵌入向量,显著提升信用卡攻击检测率至97%,并可应用于争议和授权等多种任务。
- Stripe 构建了一个基于 Transformer 的支付基础模型,效果显著。
- 传统机器学习模型(基于 BIN、邮编、支付方式等离散特征)在提升 Stripe 产品方面有局限性:需要选择特征,且每个任务(授权、欺诈、争议等)都需要单独训练。
- 新模型是自监督网络,为每笔交易学习密集、通用的向量,类似于语言模型的词嵌入。
- 该模型在数百亿笔交易上训练,将每笔收费的关键信号提炼成一个通用的嵌入向量。
- 可以将结果视为高维向量空间中支付的大量分布,每个嵌入的位置捕捉了丰富的数据,包括不同元素之间的关系。
- 相似的支付自然聚类:来自同一发卡行的交易更接近,来自同一银行的交易更近,共享同一电子邮件地址的交易几乎相同。
- 这些丰富的嵌入使得更容易发现细微的、对抗性的交易模式,并构建更准确的分类器(基于单个支付的特征及其与序列中其他支付的关系)。
- 在打击信用卡测试攻击方面,传统机器学习方法已经减少了 80% 的攻击。
- 新模型构建了一个分类器,摄取来自基础模型的嵌入序列,并预测流量切片是否受到攻击。它利用 Transformer 架构来检测交易序列中微妙的模式。
- 该方法将大型用户信用卡测试攻击的检测率从 59% 提高到 97%。
- 基础模型的真正力量在于,这些相同的嵌入可以应用于其他任务,如争议或授权。
- 支付具有语义意义,就像句子中的单词一样,交易具有复杂的顺序依赖关系和潜在的特征交互,这些是手动特征工程无法捕捉的。