2018个人信用评分研究及其发展
摘要: 个人信用评分从类型上看主要分为评分、行为评分、利润评分以及考虑因素的信用评分。如何能在获取更大利润的同时将消费者信用风险控制在最小程度成为各授信机构和学术界当前研究的重点。
关键词:信用评分;申请评分;行为评分;利润评分;经济环境
中图分类号:F014.5文献标识码:A文章编号:1003-949X(2008)-06-01-03
个人信用评分研究从技术层次上来讲,主要经历了三个阶段,从简单的分类模型到预测评分模型,再到决策评分模型。而从评分的类型上看,主要分为四个类型,即申请评分、行为评分、利润评分以及考虑经济环境因素的信用评分。
一、申请评分(Application Scoring)
授信机构接受客户信用申请时,利用客户提交的申请表中的特征变量建立评分模型得到申请者的一个信用值,将该值与事先设定的标准值相比,判断该申请人逾期的可能性,从而决定是否授出信用及授信额度。这样的信用评分,称为申请评分。
建立评分模型可以运用的方法非常多,传统学方法有判别分析、线性回归、Logistic回归等;非参数方法有最近邻方法等;运筹学方面则主要采用线性规划方法。随着信息技术的发展,近年来许多数据挖掘的新方法如神经网络、决策树、遗传算法、专家系统等陆续被引入信用评分领域中。
Durand(1941)首先将判别分析方法用于信用评分,正式系统的提出使用数理统计模型辅助消费者授信决策的观念,并将Fisher(1936)提出的判别分析法用来区分“好”的贷款和“坏”的贷款,从而对贷款的信用风险进行评价,这是个人信用评估从定性分析逐步过渡到定量分析的开端。
1958年William FairEarl Isaacs利用判别分析法建立了著名的FICO信用评分系统。MyersForgy(1963)采用判别分析和回归分析方法,利用零售信贷领域消费者信用申请表中的数据对公司的信用风险进行了预测。 Orgler(1970)首次将线性回归分析引入消费者贷款的信用风险评估,利用线性回归分析设计了一个评价未偿还贷款的评分卡。Fitzpatrick(1976) 、Lucas(1992)、Henley(1995)等也先后将这种方法用于构建个人信用评分模型。MyersForgy(1963)认为这两种方法对于降低商业等机构的坏账损失有很大的帮助。Reichert (1983)也发现运用这两种方法构建的个人信用评分模型在预测消费信贷风险时都表现出了很强的稳健性。RosenbergGleit(1994)在他们的研究中也表示了与Reichert相似的赞同观点。但Eisenbeis (1977)认为只有在客户分类较少的时候,基于判别分析和多元线性回归方法建立的个人信用评分模型才会有好的效果。
Wiginton(1980)首次尝试了在信用评分模型中使用Logistic回归方法,并与判别分析法进行了比较。但由于Logistic回归法没有变量正态性假设的要求,因此被学者认为是最适合发展信用评分模型的理论。并且由于该法使用的前提假设少,建立的个人信用评分模型具有相当的准确性和稳定性,因此成为了设计个人信用评分模型的主要方法,并且延续至今。
最近邻分析方法最先是由FixHodges(1952)提出的,它是一种标准的非参数分类技术,通常被用来解决概率密度函数的估计和分类问题。它的思想很简单,就是把预测目标分为两类,当一个新的预测目标加入时,就将其并入最邻近一类中。ChatterjeeBarcun(1970)首次将最近邻法用于个人信用评分模型。Hand(1981)利用家庭贷款的数据对最近邻法与决策树进行了比较,结果最近邻法得到了相当高的预测精度。
Mangasarian(1965)第一个意识到可以将线性规划方法应用于分类问题。但是直到FreedGlover( 1981a ,b)的文章发表以后,才引起了更多人的兴趣。此后,有关的研究文献大量涌现。JoachimsthalerStam(1990)就这一领域的70多篇文献进行了综述。有些学者则对统计学方法与线性规划方法的效果进行了比较,尽管在Nath ,JacksonJones(1992)的研究中认为统计学方法要比线性规划方法好。
1990年Odom(1990) 首次将神经网络方法引入信用风险评估中。Desai等(1996,1997)、West(2000) 等人使用神经网络方法构造了个人信用评分模型,并通过实证分析验证了在各种特征变量呈复杂的非线性关系的情况下,神经网络方法具有明显的优势。
决策树方法,也叫分类树或递归分割法,通过使用一种分割方法,将原始样本集递归分割成不相交的子集,目的是使期望损失达到最小。最早将决策树方法用于信用评分的研究是Makowski(1985)。 Coffman(1986)将决策树方法与判别分析方法进行了比较,发现当变量存在相关性时,决策树方法的表现较好。CarterCatlett(1987) , Mehta(1988)等把这一方法应用到信用评分领域。
遗传算法是对一个问题的潜在解的种群进行系统的搜索,使得与解决问题相近的解保留在候选解中的可能性比其他解要大。遗传算法最早是由Holland(1975) 提出的。Albright(1994)首次将遗传算法应用于信用联盟评分卡的开发。Michalewicz(1996)提出了一些启发性的规则, Yobas, Crook,Ross (1997)运用遗传算法并使用一个不同的函数对建立信用评分模型作了探讨。
专家系统是仿效专家的决策行为的过程的集合,它由自然组成,将专家的意见汇入中,专家系统能够提高预测“坏”客户的准确性。主要的研究有Zocco(1985) , Davis(1987) , Leonard(l993a,b)、 TessmerRichey(1997) 等。Davis, EdelmanGammerman (1992) 将Bayesian专家系统用于信用卡申请者的分类问题,并将结果与神经网络方法的结果进行了比较。Talebzadeh, MandutianuWinner (1994)依据专家系统设计出了抵押贷款的个人信用评分模型。Leonard (1993)则利用专家系统成功预测了信用卡用户的违约率。Hand, Mcconway,Stanghellini(1997), SewartWhittaker(1998)等则论述了运用绘图的方法可以更容易确定个人信用风险的全部因素。
二、行为评分(behavioral scoring)
一般信用评分模式只考虑申请者本身的条件是否良好,未考虑外在环境变化。行为评分是一种统计专门技术,它是在一般信用评分的基础上考虑到时间因素发展而来的。研究的主要目标是通过预测现有授信客户的未来行为帮助借贷机构在客户时作出更好的决策。
行为评分模型主要分为两种方法,一种是申请评分模型和额外信息变量的组合,另一种是建立客户行为的概率模型。根据估计参数信息的获取方式不同,后一种方法又分为两类,一是从以前的客户中抽样,二是使用贝叶斯方法,即根据顾客自己的行为更新公司对客户的信任度。概率模型本质上是马尔可夫链,顾客可以从一个状态跳到另一个状态。
有关第一类行为评分的研究有:Cyert, DavidsonThompson(1962) 用马尔柯夫链方法研究在贷款到期以后的不同时期,预计不可回收的贷款数目(C-D-T模型)。后来不少学者对C-D-T模型进行了修正。Van Kuelen et al. (1981)的主要修正在于考虑了过期账户的部分还款事实。Corcoran (1978)指出如果对于不同特征的账户给出不同的转移矩阵,系统将会更加稳定。Fryman et al. (1985)区分了移动者(movers)和停留者(stayers)这两种客户类型,发现后者更倾向于维持现有状态。Banasik et al. (1996)的研究指出如果对客户群体的分类不是足够清晰,在实际应用中得到的信用评分并不十分有效。
关于第二类行为评分的研究,最早基于Bayesian定理的概率模型是BiermanHausman( 1970)提出的。这一模型中,还款概率不是根据以前客户的样本得
页:
[1]