Πρόβλεψη της καθαρής αξίας των πελατών στον κλάδο Ασφάλισης Οχημάτων
Ένας κρίσιμος παράγοντας για την αναγνώριση του προφίλ ενός πελάτη είναι η καθαρή αξία του στην εταιρεία (Customer Lifetime Value – CLV), δηλαδή η διαφορά μεταξύ του συνολικού ποσού των εσόδων που έχει λάβει η εταιρεία από τον πελάτη και των δαπανών που έχει κάνει για εκείνον κατά τη διάρκεια της σχέσης τους.
Η πρόβλεψη για το πόσο θα κοστίσει σε μια ασφαλιστική εταιρεία κάθε πελάτης και πόσο κέρδος μπορεί να της αποφέρει μπορεί να δώσει μια σαφή εικόνα για το ύψος των χρημάτων που αξίζει να δαπανήσει για την απόκτηση, τη διατήρηση και την εξυπηρέτησή του. Οι πλέον σύγχρονες και πιο ακριβείς μέθοδοι μοντελοποίησης του CLV διενεργούνται μέσω της τεχνητής νοημοσύνης (Artificial Intelligence) και της στατιστικής μηχανικής μάθησης (Statistical Machine Learning).
| Των Σωτηρίου Μπερσίμη & Χρήστου Μπουντούλη* |
Τα δεδομένα
Η ανάλυση αφορά δεδομένα από 9.134 πελάτες κλάδου ασφάλισης οχημάτων μιας ασφαλιστικής εταιρείας του εξωτερικού. Συγκεκριμένα, στο αρχείο δεδομένων εμπεριέχονται πληροφορίες για χαρακτηριστικά όπως: Κωδικός πελάτη, περιοχή διαμονής, τύπος ασφαλιστικής κάλυψης, μηνιαίο ασφαλιστήριο, χρόνος (σε μήνες) από την τελευταία ασφαλιστική απαίτηση, χρόνος (σε μήνες) από τη σύναψη του πρώτου ασφαλιστηρίου συμβολαίου, αριθμός ανοιχτών παραπόνων, αριθμός εν ενεργεία ασφαλιστηρίων που έχει σύμβαση ο πελάτης, είδος ασφαλιστηρίου συμβολαίου, τύπος προσφοράς ανανέωσης, κανάλι πώλησης, συνολικό ποσό ασφαλιστικών αποζημιώσεων, φύλο, οικογενειακή κατάσταση, επίπεδο εκπαίδευσης, ημερομηνία λήξης του συμβολαίου, επαγγελματική κατάσταση, εισόδημα, κλάση οχήματος, μέγεθος οχήματος, η απάντηση των πελατών στην προσφορά για ανανέωση ή όχι του ασφαλιστηρίου συμβολαίου αυτοκινήτου και η καθαρή αξία του πελάτη (CLV).
Σκοπός της ανάλυσης
Αξιοποιώντας τεχνικές και μεθόδους της αναλυτικής των δεδομένων και της μηχανικής μάθησης, σκοπός της ανάλυσης είναι η διαμόρφωση κατάλληλου προβλεπτικού μοντέλου, ούτως ώστε να προβλέπεται η μελλοντική καθαρή αξία των πελατών και να βελτιστοποιούνται οι διαδικασίες διαχείρισής τους.
1ο βήμα – Περιγραφή των δεδομένων (Descriptive analytics)
Από το σύνολο των 9.134 πελατών της ασφαλιστικής εταιρείας, το 51% (Ν=4.658) είναι γυναίκες και το υπόλοιπο 49% (Ν=4.476) είναι άντρες, με το μέσο εισόδημα των ασφαλισμένων να είναι ίσο με $37.657. Όσον αφορά το επίπεδο εκπαίδευσης των ασφαλισμένων, το 28,7% (Ν=2.622) έχουν σπουδές μέχρι και δευτεροβάθμια εκπαίδευση, το 29,35% (Ν=2.681) έχουν τελειώσει κάποιο κολέγιο, το 30,08% (Ν=2.748) έχουν πτυχίο πανεπιστημιακού ιδρύματος και το υπόλοιπο 11,87% (Ν=1.083) έχουν μεταπτυχιακό ή διδακτορικό δίπλωμα. Η πλειοψηφία των ασφαλισμένων είναι εργαζόμενοι, με ποσοστό 62,38% (Ν=5.698), το 25,36% (Ν=2.317) είναι άνεργοι, το 9,16% (Ν=837) είναι άνεργοι λόγω προβλημάτων υγείας ή ανικανότητας για εργασία και το υπόλοιπο 3,1% (Ν=282) έχουν συνταξιοδοτηθεί. Αναφορικά με την οικογενειακή κατάσταση των πελατών, το 58% (Ν=5.298) είναι έγγαμοι, το 27% (Ν=2.467) είναι άγαμοι και το υπόλοιπο 15% (Ν=1.369) είναι διαζευγμένοι. Από διερευνητική ανάλυση στα ιστορικά δεδομένα των πελατών, παρατηρήθηκε ότι το 73,5% (Ν=6.713) έχει το πολύ 3 ασφαλιστήρια συμβόλαια με την ασφαλιστική εταιρεία, με το μέσο μηνιαίο ασφάλιστρο να είναι ίσο με €93,3 και τη μέση διάρκεια παραμονής των πελατών, από την πρώτη σύμβαση μέχρι και την ημέρα επικοινωνίας για πρόταση ανανέωσης του ασφαλιστηρίου συμβολαίου, να είναι ίση με 48 μήνες. Επιπλέον, η μέση αξία (σε όλη τη διάρκεια της ζωής τους – CLV) των πελατών της ασφαλιστικής εταιρείας είναι ίση με €8.005, ενώ το μέσο συνολικό ποσό ασφαλιστικών απαιτήσεων των πελατών να είναι περίπου ίσο με €434.
2o βήμα – Εντοπισμός των κρίσιμων παραγόντων που δύνανται συνδυαστικά να χρησιμεύσουν στη μοντελοποίηση των δεδομένων (Diagnostic analytics)
Αναλύοντας τα δεδομένα με τη χρήση κατάλληλων ελέγχων, προέκυψε ότι υπάρχει σημαντική διαφοροποίηση της καθαρής αξίας των ασφαλισμένων σε σχέση με το επίπεδο εκπαίδευσης, την εργασιακή τους κατάσταση, καθώς και τον αριθμό παραπόνων. Συγκεκριμένα, παρατηρήθηκε ότι όσο αυξάνεται το επίπεδο εκπαίδευσης του ασφαλισμένου μειώνεται η καθαρή του αξία (βλ. Σχήμα 1), η διάμεση τιμή της οποίας είναι: €6.131 για άτομα που έχουν στην κατοχή τους έως και απολυτήριο Λυκείου, €5.792 για απόφοιτους κολεγίου, €5.642 για πτυχιούχους Α.Ε.Ι/Τ.Ε.Ι, €5.718 για κατόχους μεταπτυχιακού διπλώματος και €5.494 για κατόχους διδακτορικού.
Αναφορικά με την καθαρή αξία των πελατών σε σχέση με την εργασιακή τους κατάσταση (βλ. Σχήμα 2), παρατηρήθηκε ότι οι εργαζόμενοι είχαν διάμεση καθαρή αξία ίση με €5.864, οι άνεργοι €5.620, οι άνεργοι για λόγους υγείας €5.259, οι ανίκανοι για εργασία λόγω ειδικών αναγκών €5.623 και οι συνταξιοδοτημένοι €5.395. Σχετικά με τον αριθμό παραπόνων (βλ. Σχήμα 3), παρατηρήθηκε ότι οι ασφαλισμένοι με αριθμό παραπόνων από 0 έως 2 είχαν διάμεση καθαρή αξία ίση με €5.817, δηλαδή περίπου 14% υψηλότερη σε σχέση με την αντίστοιχη εκείνων με πάνω από 2 παράπονα, των οποίων η διάμεση αξία ήταν ίση με €5.099.
Σε συνέχεια της διερευνητικής ανάλυσης, παρατηρήθηκε ότι το ετήσιο εισόδημα έχει μια αδύναμη θετική συσχέτιση με την καθαρή αξία των πελατών. Δηλαδή, καθώς αυξάνεται το εισόδημα του πελάτη, η καθαρή αξία του έχει μια ελαφριά τάση προς αύξηση, ωστόσο, αυτό δικαιολογείται από το γεγονός ότι πελάτες με μεγαλύτερο εισόδημα μπορούν να διαθέσουν χρήματα για αγορά περισσότερων καλύψεων ή και συμβολαίων, κάτι που αναβαθμίζει την αξία τους. Δεν προέκυψαν κάποιες άλλες στατιστικά σημαντικές σχέσεις μεταξύ των διαθέσιμων χαρακτηριστικών και της καθαρής αξίας των ασφαλισμένων, ωστόσο, όπως θα αποδειχθεί ακολούθως, οι υπάρχουσες είναι αρκετές, για να μπορέσουμε να χτίσουμε ένα μοντέλο που θα μπορεί να προβλέψει με μεγάλη επιτυχία τη μελλοντική αξία τόσο ενός νέου, όσο και ενός υφιστάμενου πελάτη.
3ο βήμα – Διαμόρφωση του μοντέλου παλινδρόμησης για την πρόβλεψη της καθαρής αξίας των πελατών (Customer Lifetime Value prediction)
Η ανάλυση θα στηριχθεί στη μέθοδο της Ανάλυσης Παλινδρόμησης (Regression Analysis), από τις μεθόδους της εποπτευόμενης μάθησης (supervised learning) στον τομέα της στατιστικής μηχανικής μάθησης (statistical machine learning). Συγκεκριμένα, για τη δημιουργία του μοντέλου πρόβλεψης της καθαρής αξίας των πελατών, εφαρμόστηκε η τεχνική παλινδρόμησης με Τυχαία Δάση (Random Forest regression), μία αρκετά διαδεδομένη τεχνική, η οποία βασίζεται σε δέντρα αποφάσεων. Το σύνολο δεδομένων χωρίστηκε (με αναλογία 70% – 30%) σε σύνολο δεδομένων εκπαίδευσης (70%), το οποίο χρησιμοποιήθηκε για την εκπαίδευση του μοντέλου, και σε σύνολο δεδομένων δοκιμής (30%), το οποίο χρησιμοποιήθηκε για την αξιολόγησή του.
Στον Πίνακα 1 παρουσιάζεται η αξιολόγηση του τελικού μοντέλου, με το μέσο απόλυτο σφάλμα της εκτίμησης (Mean Absolute Error – MAE), τη ρίζα του μέσου τετραγωνικού σφάλματος της εκτίμησης (Root Mean Squared Error – RMSE) και τον συντελεστή προσδιορισμού (Adjusted R Squared), μετρικές αξιολόγησης που έχουν αναφερθεί αναλυτικά σε προηγούμενο άρθρο (βλ. τεύχος Ιουνίου 2022).
Από τα αποτελέσματα προέκυψε ότι η ερμηνευτική δυνατότητα του μοντέλου στο σύνολο δεδομένων εκπαίδευσης είναι ίση με 88,6% και στο σύνολο δεδομένων δοκιμής είναι ίση με 88,4%, βάσει του προσαρμοσμένου συντελεστή προσδιορισμού. Αυτό σημαίνει ότι ανεξάρτητες μεταβλητές του μοντέλου ερμηνεύουν το 88,40% της μεταβλητότητάς του με εξαρτημένη τη μεταβλητή «Καθαρή αξία πελάτη (CLV)».
Στο τελικό μοντέλο δεν χρησιμοποιήθηκαν όλες οι μεταβλητές. Τα χαρακτηριστικά που χρησιμοποιήθηκαν και αποδείχθηκαν ισχυροί προγνωστικοί παράγοντες ήταν με τη σειρά αναφοράς τους: 1) ο αριθμός συμβολαίων του ασφαλισμένου, 2) το ασφάλιστρο, 3) οι μήνες που πέρασαν από την τελευταία αξίωση, 4) το εκπαιδευτικό επίπεδο, 5) η εργασιακή κατάσταση, 6) η περιοχή διαμονής, 7) το είδος συμβολαίου, 8) ο αριθμός παραπόνων, 9) το εισόδημα και 10) το μέγεθος του οχήματος (βλ. Σχήμα 4).
Η πρόβλεψη για την αναμενόμενη καθαρή αξία ενός πελάτη είναι πολύτιμη πληροφορία για τις ασφαλιστικές εταιρείες, καθώς συνδέεται άμεσα με τη διαχείριση των πελατών. Συγκεκριμένα, οι ασφαλιστικές εταιρείες μπορούν να λάβουν πιο εμπεριστατωμένες αποφάσεις σχετικά με τη διατήρηση των πελατών τους στην εταιρεία/συμβόλαιο, αποφασίζοντας, για παράδειγμα, να μην προχωρήσουν σε επαναπροσφορές για διατήρηση ή σε προωθητικές ενέργειες και επικοινωνία με πελάτες, των οποίων η αναμενόμενη καθαρή αξία στην εταιρεία είναι χαμηλή και, επομένως, δεν θα αξίζει να κινήσουν διαδικασίες για τη διατήρησή τους. Αυτό μπορεί να οδηγήσει σε μεγάλη εξοικονόμηση χρημάτων από κόστη προώθησης, διοικητικά και λοιπά κόστη. Από τα παραπάνω προκύπτει ότι το μοντέλο πρόβλεψης της καθαρής αξίας του πελάτη είναι άρρηκτα συνδεδεμένο με το μοντέλο πρόβλεψης ανανέωσης συμβολαίου, ο συνδυασμός των οποίων οδηγεί σε πιο ακριβείς αποφάσεις.
*Ο κ. Σωτήριος Μπερσίμης είναι Αναπληρωτής Καθηγητής στο Πανεπιστήμιο Πειραιώς.
*Ο κ. Χρήστος Μπουντούλης είναι επιστήμονας των Δεδομένων στην εταιρεία Covariance, με εξειδίκευση στον ασφαλιστικό κλάδο.
Διαβάστε επίσης:
Η αξιοποίηση των Big Data στον ασφαλιστικό κλάδο
Ανίχνευση ασφαλιστικής απάτης στην ασφάλιση κατοικίας
Ανίχνευση ασφαλιστικής απάτης στην ασφάλιση αυτοκινήτων
Μοντέλα πρόβλεψης του ύψους των ασφαλιστικών απαιτήσεων στην ασφάλιση υγείας
Πρόβλεψη πώλησης Ασφάλισης Οχήματος σε πελάτες με Ασφαλιστήρια Υγείας
Ασφάλιση αυτοκινήτου: Ποιοι πελάτες θα ανανεώσουν το ασφαλιστήριό τους;
Kατηγοριοποίηση των πελατών βάσει επικινδυνότητας στον κλάδο Ασφάλισης Αυτοκινήτου
Ακολουθήστε την Ασφαλιστική Αγορά στο Google News