■ 张春峰 沈沁梅
数字技术的兴起让社会逐渐步入了数字时代,给各行各业的发展带来了机遇和挑战。消费者是市场的主体,消费者的信用评级在信息化时代日益重要。基于大数据技术,深入挖掘和分析海量信用数据,能够更加精准地进行评估,如银行、租赁公司等企业使用大数据进行信用评级有利于降低信用风险,同时也提升了信贷审批的效率。但随着大数据的广泛应用,诸多问题也开始逐渐显现,其中最为突出的是在消费信用评级中面临着对消费者隐私保护的挑战,如对消费者进行数据收集和保管时,可能存在个人信息过度收集及保管过程中信息泄露等现象。这些行为严重侵犯了消费者的隐私权。因此,在高效利用消费者信用评级模型的同时恰当地收集消费者的信息,有效进行信息保护已成为目前亟需解决的关键难题。本文针对目前消费者个人信息保护和消费者信用评级模型优化的深层次联系进行分析和探讨,分析存在的问题,从而有针对性地提出有效的平衡措施。
一、基于大数据的消费者信用评级模型概述
1.数据来源的多元化。传统的消费者信用评级当中,消费者的信用信息主要依赖于金融机构。金融机构及央行内部掌握的信贷记录和个人信息有限展示了消费者的信用。上述信贷数据在一定程度上可以表示消费者的信用状况,但在实际的操作当中仍然存在着一定的局限性,如信贷记录大部分只能够代表在金融借贷上的借贷情况,无法展示消费者在金融之外的信用状况。大数据的普及让消费者的信用评级能够通过多个方面进行展现,不再依赖于单一的信贷数据。以社交网络为例,在社交网络上,某消费者的购买口碑较好或经常参与公益性活动、互动行为良好等,则在评级方面更倾向于划分到更优良的等级,被认为更可能在信用交易中遵守承诺。同时,针对社交网络进行大数据分析和判断,可以更加快速和便捷地判断消费者的稳定性,从而为评估消费者信用风险等级提供重要的参考。有研究证明,加入社交网络数据将有效提高消费者信用评级模型预测的准确性,最高可提高10%至15%。
在电商平台,电子交易也能够成为评定消费者信用风险等级的重要评判标准。电商平台详细地记录了消费者在交易当中的各种信息,如购买的行为习惯、退货频率、交易纠纷等信息。上述信息能够充分反映消费者的信用情况,如购买的行为习惯能够详细记录消费者的消费偏好及充分表征消费者的消费能力;退货频率高且无正当理由退货的消费者则可能在信用上存在着一定的风险;对于交易纠纷较多的消费者,则可以通过了解其与商家之间的互动,从而判断消费者的信用情况。据了解,目前已有电商平台通过对消费者进行大数据分析和判断,从而建立起了配套的信用评级体系,为交易风险提供可控保障的同时根据消费者的浏览行为精准地推送商品,从而促成交易。
不仅如此,通过移动互联网设备也能够对消费者进行信用评级。移动互联网设备能够提供消费者的浏览痕迹和信息位置等数据,通过对上述信息的整理和分析,能够了解消费者的消费倾向和生活作息,从而获得消费者工作或生活是否具有稳定性等信息。因此,移动互联网设备所提供的信息能够有效帮助消费者信用评级模型更准确和全面地评估消费者的信用状况。
2.消费者信用评级模型技术和方法的创新。大数据技术的出现让传统的分析方法难以胜任,从而需要如机器学习、数据挖掘等计算方法来满足发展的需要。机器学习算法根据实际计算的需求主要可以分为决策树、神经网络等方式。上述方式均可以对消费者的信用风险进行评估。
决策树是机器学习中的一种算法,顾名思义,决策树类似于树形结构,逐步对数据进行整理和分类,能够快速从海量数据当中构建消费者的信用等级结构。决策树可以分为很多不同的节点,每一个节点都代表特征属性上的测试,通过对不同的节点进行筛选,从而进行分类得出结果,如信用卡的申请和审批,通过对消费者的众多信息进行分类,从各个节点的关键信息判断,确定消费者是否能够申请信用卡及计算信用额度。神经网络则具有非常强大的计算能力,能够理清复杂的数据关系。深度神经网络则是对神经网络的延伸和发展,在对消费者信用等级的划分上有着独特的优势。在实际的操作当中,有关消费者的信用数据可能是海量的,而深度神经网络能够从海量的数据当中获取隐藏的信用风险信息。数据挖掘技术则主要是从海量的数据当中获取不同数据之间的关联,通过深入地对消费者的消费行为和信用风险数据进行挖掘,从而能够发现其深层次的联系,如消费者对高风险理财产品经常消费则可能代表这部分消费者存在较高的信用风险。
二、消费者信用评级模型应用场景和效果
消费者信用评级模型可以分为逻辑回归模型、决策树模型等多个类型,不同类型的信用评级模型根据其应用的实际情况有着不同的侧重点,应用效果也有着显著的差别。
从信用卡的审批要点和流程中可知,逻辑回归模型适用于该场景。银行在审批信用卡时,将获取到的申请人个人信息及借贷信息进行整理,将其作为特征变量,带入逻辑回归模型当中。逻辑回归模型则根据上述数据,能够计算出申请人的违约概率,从而为银行是否通过审批提供相应的建议。在结果输出之后,违约概率如果比银行所设定的阈值要低,那么则增大了银行通过信用卡申请的概率,反之则可能增大了拒绝的概率。在银行实际的操作当中,逻辑回归模型在信用卡审批方面显现出了显著的优势,如结果稳定性和可解释性强。同时,银行能够从模型的输出结果和分析过程当中,明确各个变量与审批决策之间的关系,从而能够为银行相关政策的制定和调整提供参考价值。然而,逻辑回归模型也存在着一定的局限性,对于一些复杂的关系和过程可能无法准确地捕捉风险,这是由于假设特征变量之间存在线性关系。
从贷款审批和发放的流程中可知,决策树模型则更加适合该场景。银行和金融机构在进行贷款审批时,需要从各个方面出发,决策树模型则能够利用其优势快速地将重要性和逻辑关系理顺,从而按照相应的层次进行分级,对决策流程进行优化,使决策流程更加清晰明朗。例如,面对企业贷款审批时,决策树模型侧重于企业的行业类型,筛掉一批高风险企业,然后对企业的盈利能力和资产的负债率等进行考核。由此可见,决策树模型具有直观性和可解释性,能够让工作人员快速进行判断,提高审批效率。但决策树模型同样也有相应的局限性,如对训练数据过于拟合,则导致在新数据上的泛化能力较差,影响贷款风险评估的可靠性。
三、消费者信用评级模型优化与隐私保护平衡的策略
从技术层面真正解决隐私泄露问题。一方面,对消费者的相关信息进行加密技术处理。同态加密技术是目前推出的有效加密技术,针对数据隐私保护有着独特的效果,同时也能够帮助消费者信用评级模型进行优化。同态加密技术允许在密文上执行特定形式的代数运算,其解密结果与在明文上执行相同运算的结果完全一致。这一特性使得数据在传输和处理过程中无需先行解密,从而显著增强了数据的安全性。在消费者信用评级模型的训练过程中,通常涉及大量敏感数据,如消费者的收入、负债和消费行为等信息。如果应用同态加密技术,金融机构或信用评级机构可以将这些数据加密后上传至计算节点进行模型训练。计算节点在密文上执行各种计算操作,如梯度计算和参数更新等,并将加密的计算结果返回给数据所有者。数据所有者随后对计算结果进行解密,获得与明文计算相同的模型训练结果。另一方面,联邦学习也是目前较为流行的机器学习技术,特别是在实现数据的共享和隐私的保护上有着出色的表现,能够针对消费者评级模型优化和消费者隐私保护之间的矛盾提出有效的解决方法。联邦学习允许多个参与方在无需共享原始数据的前提下,共同构建和训练一个共享的机器学习模型,其核心机制是将模型训练过程分布到各个数据持有者处,各参与方利用本地数据进行模型训练,并将训练得到的模型参数或梯度信息上传至中央服务器。中央服务器对这些参数或梯度信息进行整合,如通过加权平均等方法生成全局模型参数,随后将这些全局参数分发给各参与方,供其作为下一轮本地训练的初始参数。通过这种循环迭代的过程,模型不断得到优化。上述方式既能够对不同方面的数据进行充分利用,对消费者信用评级模型进行优化,又能够有效保护消费者的隐私信息。
从法律和管理上对消费者的隐私信息进行保障。建立健全隐私管理制度,是优化消费者信用评级模型和保护消费者隐私的前提。《中华人民共和国个人信息保护法》《中华人民共和国网络安全法》等法律法规明确规定了个人信息处理的基本准则以及数据存储的要求等。在法律上,国家应该健全法律制度;同时相关监管部门和其他部门应该形成合力,充分保障消费者的隐私。针对数据分类和管理,需要根据数据的敏感程度,将消费者数据划分得更为细致,如消费者个人银行卡账号、身份证信息等都划分为高度敏感数据,消费者浏览网页中的历史数据及消费偏好等数据则划分为中度敏感数据。不同层级的数据分别做好不同的保密工作,对高度敏感数据做好最高级别的加密措施。与此同时,应该加强对相关员工的培训工作,定时定点对相关员工进行隐私保护培训,并且对相关法律条款进行解读,从而使相关员工能够了解和自觉履行有关数据处理在法律层面的责任和义务。在上述基础上,国家应当成立专门的部门进行监管,对数据处理流程进行监管和审计,督促有关各方将制定的各项隐私保护措施落实到位。
四、结论
数字技术给消费者信用评级模型优化带来了诸多机遇和挑战,不断完善消费者信用评级模型的同时有效保障消费者的隐私权是当前实践中的重点问题。本研究以大数据下消费者信用评级模型优化和隐私保护为切入点,旨在探索在大数据环境下如何在提升信用评级模型性能的同时有效保护消费者隐私,探究二者之间的平衡关系。本文首先对消费者信用评级模型进行了概述,同时针对不同类型的消费者信用评级模型应对不同场景时的实际运用方式展开了详细论述,最后对二者之间的平衡关系给出了相应的建议。
(张春峰:北京国樽(嘉兴)律师事务所主任;沈沁梅:浙江隆智律师事务所主任)