본문 바로가기

Market Insight

[논문 단숨에 읽기] InsurTech, 예측분석을 보험계리업에 적용해 보자 -1

이 콘텐츠는 국제 보험 계리사협회(International Actuarial Association)의 회원 조직인 Society of Actuaries 에서 출간한 「보험 어플리케이션에서 예측 모델링 시 고려해야 할 사항」 Considerations for predictive modeling in Insurance Applications 을 번역 및 에디팅했습니다. 논문은 온라인 상에 공개되어 있으며 논문 제목을 구글링해보시면 전문을 보실 수 있습니다.

오역의 여지가 있다고 생각되시는 부분이 있거나 함께 더 의논하시고 싶은 부분이 있으시면 주저없이 댓글로 남겨주세요 :) !

[논문 단숨에 읽기] InsurTech, 예측분석을 보험계리업에 적용해 보자 콘텐츠는 총 4개의 소주제 구성됩니다. 이번 아티클에서는 1번 소주제 - Background & Introduction 을 다룹니다. 논문의 Section 1과 Section 2.1, 그 외에도 논문의 전반적인 방향성에 대해 설명하는 구절을 모아 이번 아티클에서 소개합니다. 이해를 돕기 위해 논문에서 설명하는 내용 외에도 각종 예시와 설명하는 구절들을 추가했습니다.

1. Background & Introduction
2. 예측 모델링 10단계 (문헌조사 + 예측 분석시 고려사항 9단계)
3. 케이스 스터디 요약
4탄- 보험 예측분석 관련 Hands on (코드 출처: Kaggle blog) - 발행 완료

 

선형회귀로 개인별 생명 보험 가격 예측하기

Disclaimer 이 문서는 원작자의 허락 하에 Kaggle 블로그의 Anne Aguirre 의 원문 아티클을 Watson studio notebook에서 번역 및 에디팅 한 글입니다. 사용 개발 도구 : IBM Watson Studio Notebook의 무료 계정(L..

it-ist.tistory.com

 

1. Background & Introduction- 왜 보험(계리업)인가

*Note) 보험계리사란?

보험계리사 또는 수리사라고 하며 피보험자의 사고, 화재, 사망률 등의 통계 기록을 연구하여 적정 보험료 또는 인상률, 보험 위험률 등을 산출하는 직업 종사자를 뜻함

데이터가 전 산업군에 "혁신"의 키워드로 떠오른지는 오래되었지만 왠지 "보험 통계"라고 하면 어렵게 느껴집니다. 보험이라는 분야의 특수성과 전문성, 개인정보 이슈 등으로 국내에서는 이렇다 할 케이스가 나오지 않고 있습니다. 하지만 그에 관한 관심도와 필요성은 올라가고 있으며, 어려워만 하지 말고 하나씩 풀어나가는 접점을 찾고자 하는 시도가 필요합니다.

이러한 움직임의 일환으로 미국 계리사 협회 (SOA, Society of Actuaries)가 세계적인 보험 계리 서비스업체 밀리만 Milliman과 함께 이번 연구를 진행했습니다.현재 기업별로 예측분석을 받아들여 보험 업무에 적용하는 정도는 차이가 있습니다.

Max Kuhn의 정의에 따르면 예측 모델링이란 "정확한 예측을 하는 수학적인 툴 또는 모델을 발전시켜 나가는 프로세스"입니다.  확실한 것은 미래에 보험분야에서 예측 분석 통계나 방법론은 계속해서 발전하고 기회가 생겨나기 때문에 현재에 머무르기만해서는 안된다는것입니다. 이 논문에서는 보험통계의 이해관계자들이 모두 최대한의 결과를 얻어내기 위해 따라야 할 예측 모델링 프로세스를 소개합니다.

 

예측모델링 프로세스 9단계

1. 프로젝트 목적의 명시

2. 데이터 수집 및 전처리

3. 알고리즘 선별

4. Feature engineering 및 Feature 선별

5. 모델 평가 및 측정

6. 모델 배포

7. 모델 거버넌스

8. SW 선별

9. 유지

 

*주의 - 예측 모델링은 거의 모든 단계에서 연구자의 주관과 판단이 필요합니다. 많은 문제들에 있어서 여러 해답이 존재할 수 있습니다. 이논문은 주어진 상황에서 필요한 의사결정을 어떻게 해야할지에 대한 제언이자, 실무자들이 반드시 고려해야 할 사항들로서의 가이드입니다.

사실 보험계리사는 원래 수학/통계 전문직입니다. 문제는 오늘날의 데이터가 예전의 데이터와 양/구조(정형, 반정형, 비정형 데이터)/출처(기존 보험회사가 취급했던 것 이상의 데이터를 접목 가능함)의 면에서 완전하게 다르다는 것입니다. 이제는 그저 엑셀에서 차트를 만드는 것이상으로, 종합적인 이해를 할 수 있는 솔루션이 필요하게 된 것입니다.

국내에서도 기존에 취급하지 않던 데이터로 보험상품을 고도화하는 사례가 등장했습니다. 아래 링크에서 볼수 있듯이, SK T맵과 카카오 내비게이션은 사용자 안전운전 점수를 측정해서 그 점수에 따라 운전자 보험료가 과금됩니다.

 

자율주행 시대..."SKT VS 카카오, 내비 '진검승부' 승자는?"

 

biz.newdaily.co.kr

이제 보험은 빅데이터 비즈니스입니다. 머신러닝이라는 혁명은 새로운 차원에서 데이터로 레버러지 할 수있는 기반이 되어 준 것입니다. 2017-2018년에 SOA가 수행한 연구에 따르면 예측분석은 마케팅, 언더라이팅, 사후 이슈 관리 등 넓은 범주에서 사용되고 있습니다.

 

 

논문에서 이어 갈 예측 모델링에 대해 설명하기 전에, 우선 (기존에 사용하던) 보험 계리 모델과 (새로운 패러다임으로서) 예측 모델의 공통점과 차이점을 짚어 볼 필요가 있습니다. 사실 예측 모델은 기존 보험 계리사들이 사용하던 모델들의 일부 하위집합입니다. 다만 현재 예측 모델이 주목을 받는 이유는 기존 계리업 영역의 바깥에 있었던 출처들에서 얻은 정보를 처리하는 방법(머신러닝, 딥러닝, 프로그래밍 언어를 사용한 고급 모델) 입니다.

해당 논문은 보험계리업에서의 예측모델링 시도를 위해 적절한 문헌을 적재적소에 활용했습니다. 모델 선별과 평가에서는 기술 문서들을, 운영 및 프로젝트 관리면에서는 SAS(통계 프로그램, 기존 빅데이터 이전 시절부터 이용해왔던 모델링 툴) 의 통합적인 많이 인용되어 온 문서, 최근 연구 트렌드를반영한 블로그, 회사들의 백서, 아티클등 다양한 소스들을 참고하여 예측모델링 프로세스 9단계 를 설명합니다. 9단계에 대한 실무진들의 의견 및 문헌 연구에 비롯한 설명은 아티클 2탄에서이어집니다.

반응형