如何让每一个电商都安全一点「怎样让微商产品从电商下架」

互联网 2023-02-07 10:58:51

今天给大家普及一下如何让每一个电商都安全一点「怎样让微商产品从电商下架」相关知识,最近很多在问如何让每一个电商都安全一点「怎样让微商产品从电商下架」,希望能帮助到您。

文/IT创事记 祁萌

如果黑产盗用了你的信用卡信息,然后用它去购买了一顶假发,你一定会觉得奇怪。没错,这就是地域差异。

假发是在部分国家很受欢迎的高价值商品,和iPhone、代金券一样,都是黑产偏好的那种“硬通货”——这些产品单价高、易流通,且便于在本地销赃。

要在这种地域差异中做好风控,并不是一件容易的事。售卖商品差异、消费者风险意识,以及各国对风险监管的标准不一等原因,也让跨境电商的风险管控能力在各国表现出了不同的水平。

四年前,支付宝启动“安全技术出海”时,一个重点需要考虑的问题方向就是这一点:如何高效赋能跨境平台。

有限数据下的风控

支付宝强大的风控能力在相当程度上得益于全球领先的业务需求,尤其是规模。相比之下,海外电商平台在业务新建时,通常没有足够的数据量支撑风控研究。

宋博文是支付宝大安全迁移学习项目组负责人,主要研究领域在迁移学习以及隐私保护计算方向,相关成果曾在多个顶会发表。他所在团队的一个重要职责,就是要用成熟场景的数据和经验,帮助这些企业在数据量有限的情况下,快速建模,抵御风险。

2017年入职蚂蚁金服后,宋博文主要负责蚂蚁国际场景的建模工作,包括跨境电商平台支付风险、跨境商户风险以及本地钱包风控。在那之前,他从美国纽约石溪大学统计学博士毕业。

Lazada是一个覆盖了东南亚六国的电商平台,通过在各国分设站点,服务当地商户和消费者。该平台覆盖的国家包括印度尼西亚、马来西亚、菲律宾、新加坡、泰国和越南等,每一个站点都相当大的用户量。

这是一个典型的跨境电商场景。不过和天猫消费者普遍使用第三方电子钱包——支付宝——不同,这些平台保有鲜明的当地特色,消费者普遍会使用信用卡进行网络消费,而这种消费对应的欺诈风险是信用卡的信息泄漏。

虽然各国消费偏好产生的数据存在差异性,但是风险行为在一定程度上还是存在共性,项目组的专家们希望在针对一国数据进行风险建模同时,能够借力到其他国家或区域已有的数据经验或者风险特征,来增强模型在该国家的风险识别能力,这也就是之前提到的迁移学习方法。

不要人工提纯,要原始数据

学术界对此有自己流行的做法,就是基于深度学习框架的迁移学习。深度学习模型,大家都不陌生,我们在视频网站接受到的推送视频,音乐平台推荐的新歌,或者在新闻APP上看到的推荐文章,大都与此相关。

不同之处在于数据——这些平台使用的数据是相对标准化的,例如视频、音频,或者图像文字等;而在风控场景中,数据链路通过埋点采集的数据要远为复杂——它涉及了登陆网站、浏览商品、沟通询价、支付成交等网络购物交易的各环节。

算法分析师或者策略分析师可以依赖这些基础事件,通过固定的维度抽取信息,人工提纯,进而用这些数据来搭建深度学习模型。

“但这些被人工经验提纯过的信息已经是一个高度抽象,或者有风险表达能力的信息,机器学习的空间相对较小。”宋博文说,“如果能直接在原始数据上搭建深度学习模型,减少人工的介入,它学习的空间就非常大了。”

这很容易理解,如果1位用户1天内用30款手机登陆操作,就意味着可能存在风险,因为普通人不会有这样的操作。

分析师也会这样认为,但问题是,这种“认为”本身就是人工经验干预的结果,是一个典型的人工抽取的风险特征。

在这一点上,我们此前并没有找到太好的解决方案。而课题组要做的,就是在30次登陆产生的未经加工的原始数据基础上搭建出有效的深度学习模型,提供迁移学习需要底层结构。“如果我们的模型足够稳健,它就能够学习到30次登陆中的变化情况,例如设备ID、换设备的间隔等,然后自动学习并提取风险信息。”

通过在这种更适合风控场景的模型基础上,搭建多层次结构的深度学习框架,宋博文和项目组同事实现了直接通过原始数据挖掘风险标签的目的。

这正是今年国际信息计算协会信息检索大会(ACM SIGIR)会收录《Neural Hierarchical Factorization Machines for User’s Event Sequence Analysis》(简称NHFM)一文的原因。

ACM SIGIR是专注于信息存储、检索以及传播方向的计算机领域顶级会议。在此类会议中发表论文,意味着科学家对领域前沿的研究获得了全球同行的认可。

宋博文联合署名的这篇论文由支付宝天筭安全实验室联合中科院计算所庄福振副研究员合作,它为风控领域这个棘手的欺诈识别难题提供了新颖的解决方案。

源于风控,面向全产业

支付宝在对这篇论文的介绍中写到:“我们从用户行为序列角度切入,以单次行为的属性表征信息作为基础输入,通过搭建NHFM神经网络层次因子分解机框架,提取同风险行为相关的表征信息,并对用户的支付行为做出风险预测。

“与此同时,NHFM引入attention机制,使得模型框架具备可解释性功能,可标识同风险预测相关的关键前序行为以及关键属性,降低风险分析运营的人力成本。”

在论文被ACM SIGIR收录的同时,东南亚的电商和消费者已经受益于此。应用的落地帮助他们提升了风控建设效率、用户体验,以及资金安全。

支付宝天筭安全实验室的这项研究成果不仅可以应用于跨境电商场景中来识别用户的风险支付行为,也可以应用在海外电子钱包的风控中。

“我们的第一优先级是解决风控场景的业务问题,但同时,我们也希望这个模型可以帮助到有相似时序信息预测问题的其他业务中”宋博文说。

一个学术届经常引用的公开数据集(MovieLens 1M),经常被用来通过分析用户对影片的点评行为,来“计算”用户兴趣点。商业上这一技术方案可以被用来向用户推荐影视作品。

经过测试,相较传统已有深度学习框架的成绩,“NHFM的模型识别精度至少提升了1%~2%。”宋博文说。一方面,这一数据本身意味着一个较大的水平提升;另一方面,也是更重要的一点在于,这一模型的通用性得到了验证——这是评价模型价值影响的一个重要的参考维度。

「支付宝天筭安全实验室」隶属于支付宝安全实验室。围绕智能风控和反欺诈技术,实验室探索安全领域的机器学习等前沿问题,致力于打造全球领先的智能风控体系,是守护支付宝“你敢付我敢赔”承诺的中坚力量。

【IT创事记】聚焦于企业级科技生态、策略及商业知识。你可以在各主流媒体平台看到IT创事记的同名文字专栏和【IT创事记·视频】专栏。如果你有相应的内容希望分享,记得在公众号留言告诉我们。