前言:想要寫出一篇引人入勝的文章?我們特意為您整理了大數據人壽保險理賠數據研究范文,希望能給你帶來靈感和參考,敬請閱讀。
以四川省人壽保險公司年度理賠數據為研究對象,對該公司的年度理賠數據進行處理分析。采用spss中的頻率分析、定制表分析和探索分析等方法,對不同年齡段的賠付情況、不同賠付原因的賠付情況和不同險種的賠付盈虧狀況進行了數據分析,得出相應的解決策略并及時做出調整,避免高額度賠付。銀行、證券和保險是我國金融行業的三駕馬車,隨著我國經濟水平的提高,金融創新模式的不斷發展,國內外經濟形勢的巨大變化給行業中的各個公司帶來了機遇和挑戰,保險行業更是越來越成為其中重要一環。而疫情的爆發,對我國經濟造成了嚴重的影響。重大疫情首先影響國內需求和投資,進而改變國際貿易發展趨勢,造成生產和消費的供需雙降和金融市場資產價格波動。在當今保險與金融不斷融合發展的背景下,保險面臨的風險更加嚴峻。尹會巖認為保險具備大數據的特點:一是保險業是經營風險的行業,需利用風險模型或數理技術等對風險進行辨別;二是保險公司對風險發生的概率進行預測,而大數據的關鍵就是預測。隨著我國保險行業的不斷發展,保險已經廣為大眾所知,而壽險作為保險產品中最能直接與人們身體健康、生存發展息息相關的產品,已經逐漸滲透到我們的生活中來。目前大數據背景下,人壽保險分公司身處業務一線地位,直面客戶,掌握一手數據,但卻并未充分發揮其作用。所以為了使人壽保險公司在發展階段中更進一步,需要通過分析目前的人壽保險理賠數據,及時找出保險中存在的問題并且及時采取相應的解決策略以保證公司的利益最大化。
1研究思路
以四川省人壽保險公司年度理賠數據為研究對象,對該公司的年度理賠數據進行處理分析。采用spss中的頻率分析、定制表分析、探索分析以及自動編碼等方法,對不同年齡段的賠付情況、不同賠付原因的賠付情況和不同險種的賠付盈虧狀況進行了數據分析,得出相應的解決策略并及時做出調整,避免高額度賠付。
2數據說明
2.1數據來源
數據來源于四川人壽保險公司年度理賠數據,數據中包含機構、險種、賠款金融費用類型、費用金額、總保費等16個字段共212182條數據,19.3M。
2.2數據清洗
數據中存在許多對本次分析的無關數據,因此對數據進行了數據清洗,篩選出了我們需要的數據,把不需要與無效的數據進行了剔除。其中主要使用了賠付金額、年齡、險種等字段的數據進行分析探索。其中進行了無效字段的刪除:這些字段值為無效數據或為空或為異常數據,如:家庭人口為0。
3數據分析
3.1賠付金額與年齡的關系
3.1.1年齡的分段通過spss軟件中頻率分析功能對該數據單中所有年齡進行四分位數計算,將年齡從小到大排序并平均分成四等份,通過重新編碼將年齡分為四個區間:40歲及以下為第1個年齡段——青年組,重新編碼值為1;41歲至46歲(包含41歲和46歲)為第2個年齡段——壯年組,重新編碼值為2;47歲至54歲(包括47歲和54歲)為第3個年齡段——中年組,重新編碼值為3;55歲及以上為第4個年齡段——老年組,重新編碼值為4。
3.1.2數據分析與結果將賠款金額設為因變量、重新編碼后的年齡段設為因子進行探索分析。有分析結果得出:4組年齡段中,第1組(40歲及以下)的平均值最高,其次是第4組,第3組與第2組賠款平均值依次下降,可以說明處于第1組青年組(40歲及以下)年齡段的人獲得的賠付金額更多,其次是第4組老年組(55歲及以上)。4組數據偏度均大于0,成右偏分布(均值大于中位數大于眾數),說明同組高賠付金額的人數較少,大部分人所賠付的金額都低于平均值。且四組數據的峰度均大于0,成尖峰分布,說明同組數據之間賠款金額數目差異較大。第1組青年組的四分位距最小,賠付情況最為集中,其次是第2組壯年組,四分位距最大的為第4組老年組。由此可以得出結論:低年齡段的青年組賠付金額最集中且最高,其次是第2組。相反第4組的賠付情況出現的最少。并且第4組的賠付金額都是以低賠付為主,高賠付金額的人數較少,同一年齡段之間的賠款金額數目差異較大。40歲及以下的人群賠付金額更多并且組內賠付的金額差異較小,說明賠付情況比較集中,55歲及以上的人群雖然組內賠付的金額差異比其他組的組內賠付金額大,但是賠付的金額數目會更高。
3.2不同險種類型的賠款情況
3.2.1數據處理增加盈利虧損列,該字段數據是由總保費減對應賠款金額。由于使用定制表分析只能分析值字段數據,所以通過定義變量屬性,將險種和盈利虧損列進行自動標簽,轉換為值字段形式。
3.2.2定制表分析對盈利虧損和險種類型進行定制表分析,計算不同險種的個數和對應的盈利虧損平均值,進行排序。對不同險種的個數進行降序排序:其中賠付了10萬次以上的險種有1個,為F09;賠付次數在1萬至10萬次的險種有2個,分別為F07和S42;賠付次數在1千至1萬次的險種有3個,為F10、S43和Y15;賠付次數在1百至1千次的險種有21種;賠付次數在1百次以下的險種有39種;其中405、412、F01、S58和S71只賠付過一次。根據不同險種對盈利虧損平均值進行降序排序,有6種保險獲得盈利,分別是S91、S71、B02、S76、B01和FS3;有4種保險盈利虧損持平;其余保險呈虧損狀態,其中S42、FS1、FS2、S69、S48、S78、Y18、SS2和SS1平均賠付金額為2萬以上。根據不同險種對盈利虧損總和進行升序排序,其中虧損前三的保險為S42、F09和S51,盈利最多前三的保險為B01、B02、S91。由此可以得出如下結論:賠付金額較大的險種為:F09、F07和S42,這三種保險的賠付條款觸發率可能更高;S42保險賠付次數多,賠款金額多;FS2和S69賠付次數屬于100次以下,但是總賠付金額分別高達6萬元以上和10萬元以上;S51保險賠付次數在1百至1千次范圍中,但虧損總和卻高居第三。雖然F09賠付次數最多但是平均盈虧狀態在中等水平;B01保險賠付次數屬于1百至1千次但盈利總和處于第一位。
3.3費用類型與賠款金額的關系
3.3.1費用類型處理將費用類型通過數據菜單欄中的定義變量屬性歸類后分成3類——意外、疾病和其他。其中意外包括下落不明、勞動安全事故、溺水、火災等,疾病包括胃癌、肺炎、惡性腫瘤、消化系統等等,其他包括自殺、他殺等等。
3.3.2不同費用類型與賠款金額的關系通過頻率分析對三種不同費用類型進行統計,由圖1可以得知:因各種疾病進行的賠付數量占總比的96.2%,遠遠大于因其他和意外進行的賠付次數;而因意外進行的賠付次數又大于因其他進行的賠付次數。將賠款金額設為因變量、費用類型設為因子進行探索分析得出:3種費用類型的偏度均大于0,且3種費用類型峰度也均大于0,均呈右偏尖峰分布。其中疾病的峰度和峰度都大于其他兩種費用類型。3種費用類型的平均值大小為:疾病遠小于意外小于其他。結果顯示不同類型的賠付最大值為疾病大于其他大于意外,通過比較三種費用類型的最大值可知,因疾病而賠付的最多金額會非常昂貴。由此得以得到以下結論:因疾病而進行賠付的次數遠大于其他和意外這兩種費用類型的賠付次數,說明因病賠付的客戶數量遠遠超過因意外和其他賠付的客戶數量。疾病賠付的金額相比其他兩種賠付類型較小,但是極端值比多,說明因重大疾病而進行的賠付金額會較大。
4結論及建議
總體上來看,賠付的金額大多數都是以低賠付為主,高賠付金額的人數較少。對高齡人群進行的賠付次數較少但賠付金額較大,青壯年人群被賠付的次數多并且賠付的金額較大。從分析結果中可以得出,因病賠付的客戶數量遠遠超過因意外和其他賠付的客戶數量,雖然疾病賠付的金額相比其他兩種賠付類型賠付的金額較少,但是極端值較多。說明一般疾病所進行的賠付金額數目較小,但是患重大疾病賠付的金額數目會比較高。主要原因可能是青壯年所處的年齡段相比于其他年齡段而言是疾病的高發段,而到了老年階段則會因為身體素質使得患病率大大提升。因此建議,本著年齡越大保費越高的原則,稍微提升40歲及以下年齡段保險的保費,更多地、重點地服務一些壯年、中年人群,尤其是中年人群。從公司自身保險情況來看,F09、F07和S42保險的賠付條款觸發率會更高,其中S42保險賠付次數多并且賠款金額多,而F09雖然賠付次數多但是平均盈虧狀態在中等水平,有很大的提升空間;建議可以重新斟酌F07和S42這兩種保險的賠付條款與賠付金額數目和F09的賠付觸發條款。FS2、S69和S51保險雖然賠付的次數不多但是每次賠付的金額數目會較高;如果公司中有與之性質相似的保險可以多推薦顧客購買那些性質相似的保險來達到保障公司利益的效果。其中B01保險賠付次數較少,處于盈利狀態且盈利的程度較大,所以可以大力推廣該種保險。
作者:葉盈影 楊杉 單位:四川大學錦城學院計算機與軟件學院