Άρθρα

Ανίχνευση ασφαλιστικής απάτης στην ασφάλιση αυτοκινήτων

Ο κίνδυνος πρόκλησης οικονομικών ζημιών από δόλιες απαιτήσεις είναι ένα ζήτημα που απασχολεί όλες τις ασφαλιστικές εταιρείες, ενώ επηρεάζει σημαντικά τους ασφαλισμένους, δεδομένου ότι η αύξηση των απαιτήσεων προς μια ασφαλιστική εταιρεία οδηγεί μοιραία σε αύξηση των ασφαλίστρων. Σύμφωνα με έρευνα του FBI, η ασφαλιστική απάτη (εκτός του κλάδου ασφάλισης υγείας) κοστίζει κατά μέσο όρο $400 έως $700 σε μια οικογένεια που διαμένει στις Η.Π.Α., υπό τη μορφή αυξημένων ασφαλίστρων.

Η ανίχνευση της ασφαλιστικής απάτης δεν είναι εύκολη υπόθεση και οι παραδοσιακές μέθοδοι έχουν αποδειχθεί αναποτελεσματικές, χρονοβόρες και κοστοβόρες. Ωστόσο, όλο και περισσότερες ασφαλιστικές εταιρείες εντάσσουν στον λειτουργικό τους μηχανισμό σύγχρονα εργαλεία αντιμετώπισης της ασφαλιστικής απάτης, τα οποία στηρίζονται στη Στατιστική Μηχανική Μάθηση και στην Τεχνητή Νοημοσύνη.

| Των Σωτηρίου Μπερσίμη & Χρήστου Μπουντούλη* |

Τα δεδομένα

Η ανάλυση αφορά απαιτήσεις από συμβόλαια ασφάλισης αυτοκινήτων. Το αρχείο εμπεριέχει δεδομένα από 1.000 περιπτώσεις ασφαλιστικών απαιτήσεων προς μία ασφαλιστική εταιρεία των ΗΠΑ, η οποία προέβη σε ενδελεχή έλεγχο, διακριβώνοντας εάν υπήρξε απόπειρα ασφαλιστικής απάτης. Από τον ενδελεχή έλεγχο διαπιστώθηκε ότι το ολικό ποσοστό απόπειρας ασφαλιστικής απάτης ήταν 24,7%, δηλαδή, περίπου 1 στις 4 των ασφαλιστικών απαιτήσεων ήταν απόπειρα ασφαλιστικής απάτης (Σχήμα 1).

Ανίχνευση ασφαλιστικής απάτης στην ασφάλιση αυτοκινήτων

Στο αρχείο δεδομένων συνολικά περιλαμβάνονται 36 χαρακτηριστικά, που ομαδοποιούνται στις ακόλουθες κατηγορίες: (α) χαρακτηριστικά του συμβάντος από το οποίο προήλθε η απαίτηση, (β) χαρακτηριστικά του συμβολαίου, (γ) χαρακτηριστικά του ασφαλισμένου και (δ) χαρακτηριστικά των αυτοκινήτων που ενεπλάκησαν στο συμβάν.

Συγκεκριμένα, στο αρχείο δεδομένων εμπεριέχονται δεδομένα για χαρακτηριστικά όπως: Χρονικό διάστημα (σε μήνες) που ο ασφαλισμένος ήταν πελάτης στην ασφαλιστική, Ηλικία ασφαλισμένου, Αριθμός ασφαλιστηρίου, Πολιτεία των Η.Π.Α. που κατοικεί ο ασφαλισμένος, Ετήσιο ασφάλιστρο, Ανώτατο όριο κάλυψης, Τ.Κ. ασφαλισμένου, Φύλο, Επίπεδο εκπαίδευσης, Επάγγελμα ασφαλισμένου, Προσφιλής ενασχόληση του ασφαλισμένου, Οικογενειακή κατάσταση ασφαλισμένου, Ημερομηνία ατυχήματος, Είδος συμβάντος, Τύπος σύγκρουσης, Σοβαρότητα ατυχήματος, Αρχές που έλαβαν γνώση, Πολιτεία που έγινε το συμβάν, Πόλη που έγινε το συμβάν, Ακριβής τοποθεσία που έγινε το συμβάν, Ακριβής ώρα που έλαβε χώρα το συμβάν, Αριθμός οχημάτων που εμπλέκονται στο συμβάν, Καταστροφή ιδιοκτησίας, Σωματικές βλάβες, Μάρτυρες, Αναφορά της αστυνομίας, Συνολικό ποσό αξίωσης, Αξίωση τραυματισμού, Αξίωση ιδιοκτησίας, Αξίωση οχήματος, Κατασκευαστής οχήματος, Μοντέλο οχήματος, Έτος κατασκευής οχήματος και, τέλος, εάν το αίτημα αποζημίωσης αποτέλεσε απόπειρα ασφαλιστικής απάτης.

Σκοπός της ανάλυσης

Σκοπός της ανάλυσης είναι, αρχικά, η διερεύνηση των δεδομένων και στη συνέχεια η διαμόρφωση κατάλληλου μοντέλου, βάσει των διαθέσιμων δεδομένων, ούτως ώστε μελλοντικά το μοντέλο αυτό να υποδεικνύει αυτόματα περιπτώσεις πιθανής ασφαλιστικής απάτης.

1ο βήμα – Περιγραφή των δεδομένων (descriptive analytics)

Στο Σχήμα 2 παρουσιάζεται η κατανομή αιτήσεων αποζημίωσης ανά κατηγορία συμβάντος και στο Σχήμα 3 παρουσιάζεται το ποσοστό ασφαλιστικής απάτης ανά κατηγορία συμβάντος.

Ανίχνευση ασφαλιστικής απάτης στην ασφάλιση αυτοκινήτων
Ανίχνευση ασφαλιστικής απάτης στην ασφάλιση αυτοκινήτων

Συγκεκριμένα, το 41,9% (Ν=419) των αιτημάτων αφορά σύγκρουση μεταξύ οχημάτων, εκ των οποίων το 27,2% (Ν=114) ήταν ασφαλιστική απάτη, ενώ με μικρότερο ποσοστό, της τάξης του 40,3% (Ν=403), ακολουθούν τα αιτήματα που αφορούν ατυχήματα με ένα εμπλεκόμενο όχημα, εκ των οποίων το 29% (Ν=117) ήταν ασφαλιστική απάτη. Περίπου το 8,4% (Ν=84) των αιτημάτων, εκ των οποίων το 9,5% (Ν=8) ήταν ασφαλιστική απάτη, αφορά παρκαρισμένα αυτοκίνητα. Το 9,4% (Ν=94) των αιτημάτων αφορούν περιπτώσεις κλοπής οχημάτων, με το 8,5% (Ν=8) από αυτά να αποτελούν ασφαλιστική απάτη.

Αναφορικά με το ύψος της αποζημίωσης, το οποίο είναι ένα από τα σημαντικότερα χαρακτηριστικά των δεδομένων μας, παρατηρήθηκε ότι η μέση ζημία είναι προσεγγιστικά ίση με $52.761, ενώ η διάμεση ζημία είναι ίση με $58.055.

2ο βήμα – Εντοπισμός των κρίσιμων παραγόντων που δύνανται να αξιοποιηθούν στην πρόβλεψη της ασφαλιστικής απάτης (diagnostic analytics)

Αναλύοντας τα δεδομένα (Σχήμα 4), προέκυψε ότι υπάρχει στατιστικά σημαντική διαφοροποίηση στη διάμεση αξία των αιτημάτων αποζημίωσης, ανάμεσα στα αιτήματα που αποδείχθηκε ότι αποτελούσαν απόπειρα ασφαλιστικής απάτης και σε αυτά που δεν αποτελούσαν.

Ανίχνευση ασφαλιστικής απάτης στην ασφάλιση αυτοκινήτων

Συγκεκριμένα, η διάμεση απαίτηση στην περίπτωση απόπειρας ασφαλιστικής απάτης ήταν $61.290 και στην περίπτωση της ειλικρινούς δήλωσης περίπου $56.520. Δηλαδή, στην περίπτωση της αποδεδειγμένης απόπειρας απάτης, η διάμεση απαίτηση ήταν περίπου 10% μεγαλύτερη από την αντίστοιχη της ειλικρινούς δήλωσης.

Επίσης, εφαρμόζοντας τους κατάλληλους στατιστικούς ελέγχους, παρατηρήθηκε ότι υπάρχει στατιστικά σημαντική διαφοροποίηση στην κατανομή της ασφαλιστικής απάτης ανά κατηγορία συμβάντος (βλ. Πίνακα 1).

Ανίχνευση ασφαλιστικής απάτης στην ασφάλιση αυτοκινήτων

Συγκεκριμένα, παρατηρήθηκε ότι η πιθανότητα απόπειρας ασφαλιστικής απάτης κατ’ αναλογία σε ατυχήματα με πάνω από ένα εμπλεκόμενα οχήματα ήταν σχεδόν 1,86 φορές μεγαλύτερη από την αντίστοιχη πιθανότητα απάτης σε συμβάντα που αφορούν παρκαρισμένα αυτοκίνητα και 2,2 φορές μεγαλύτερη από την αντίστοιχη πιθανότητα απάτης στην περίπτωση κλοπής οχημάτων. Το ίδιο παρατηρήθηκε και σε ατυχήματα με ένα εμπλεκόμενο όχημα, όπου η πιθανότητα απόπειρας ασφαλιστικής απάτης ήταν κατ’ αναλογία σχεδόν 2 φορές μεγαλύτερη από την περίπτωση που αφορά τα παρκαρισμένα οχήματα και 2,4 φορές μεγαλύτερη από την περίπτωση που αφορά τα οχήματα που έχουν δηλωθεί για κλοπή.

Ένα αξιόλογο εύρημα είναι ότι υπάρχει σημαντική διαφοροποίηση στην κατανομή της ασφαλιστικής απάτης σε σχέση με το γεγονός της παρουσίας στον χώρο του συμβάντος κάποιας Αρχής (Σχήμα 5).

Ανίχνευση ασφαλιστικής απάτης στην ασφάλιση αυτοκινήτων

Συγκεκριμένα, παρατηρήθηκε ότι η πιθανότητα ασφαλιστικής απάτης, σε περίπτωση που καμία Αρχή δεν έσπευσε στο συμβάν (π.χ. Τροχαία), είναι σχεδόν 3,5 φορές μικρότερη σε σχέση με το να έσπευσε στο συμβάν ασθενοφόρο, 3,1 φορές μικρότερη σε περίπτωση που επενέβη η Πυροσβεστική και 2 φορές μικρότερη αν επενέβη η Αστυνομία.

Συνεχίζοντας τη διερευνητική ανάλυση, παρατηρήθηκε ότι υπάρχει στατιστικά σημαντική διαφοροποίηση της ασφαλιστικής απάτης σε σχέση με το μέγεθος της ζημίας. Συγκεκριμένα, παρατηρήθηκε ότι στις περιπτώσεις που το μέγεθος της ζημίας είναι μεγάλο, το ποσοστό των αιτήσεων ασφαλιστικής απάτης αγγίζει το 60,5%, ενώ μόλις το 39,5% αφορούν ειλικρινείς δηλώσεις. Όσον αφορά τις περιπτώσεις που έχει επέλθει ασήμαντη ζημία, μικρή ζημία και ολική καταστροφή, το ποσοστό ασφαλιστικής απάτης κυμαίνεται μεταξύ 6,7% και 12,9% (Σχήμα 6).

Ανίχνευση ασφαλιστικής απάτης στην ασφάλιση αυτοκινήτων

Επιπλέον, δεν προέκυψε κάποια στατιστικά σημαντική σχέση μεταξύ των βασικών δημογραφικών χαρακτηριστικών του ασφαλισμένου (Φύλο, Ηλικία, Επίπεδο εκπαίδευσης, Επάγγελμα, Οικογενειακή κατάσταση) και της αποδεδειγμένης ύπαρξης ασφαλιστικής απάτης, παρά μόνο μικρές διαφοροποιήσεις.

3ο βήμα – Διαμόρφωση μοντέλου πρόβλεψης της ασφαλιστικής απάτης (predictive analytics)

Για τη δημιουργία ενός μοντέλου πρόβλεψης της ασφαλιστικής απάτης, εφαρμόστηκε ο αλγόριθμος “Extreme Gradient Boosting (XGBoost)”, ο οποίος είναι ένας αλγόριθμος εποπτευόμενης μηχανικής μάθησης, που χρησιμοποιεί τα δέντρα αποφάσεων και την τεχνική της ενίσχυσης κλίσης (Gradient Boosting), στην οποία κάθε δέντρο εκπαιδεύεται χρησιμοποιώντας την πληροφορία από τα προηγούμενα δέντρα.

Όπως φαίνεται και στο Σχήμα 7, κάθε δέντρο απόφασης εκπαιδεύεται, αξιοποιώντας τα σφάλματα του προηγούμενου δενδροειδούς μοντέλου και, στη συνέχεια, διορθώνει επαναληπτικά.

Ανίχνευση ασφαλιστικής απάτης στην ασφάλιση αυτοκινήτων

Απώτερος σκοπός, φυσικά, είναι η βελτιστοποίηση της συνάρτησης απώλειας, βάσει της οποίας γίνεται και η αξιολόγηση του τρόπου με τον οποίο ο αλγόριθμος ταξινομεί τα δεδομένα. Ο λόγος που ο XGBoost προτιμάται σε σχέση με άλλες μεθόδους δέντρων αποφάσεων είναι λόγω της υπολογιστικής του ταχύτητας και της απόδοσής του.

Υπάρχουν διάφορες μετρικές για την αξιολόγηση των μοντέλων ταξινόμησης και η επιλογή τους εξαρτάται από τη φύση των δεδομένων, καθώς και από τη φύση του προβλήματος. Οι μετρικές που χρησιμοποιήθηκαν, στην εφαρμογή αυτή, για την αξιολόγηση του μοντέλου πρόβλεψης της ασφαλιστικής απάτης, είναι οι εξής:

  • Ορθότητα (Accuracy): Το ποσοστό των ορθά ταξινομημένων απαιτήσεων.
  • Ακρίβεια (Precision): Το ποσοστό των απαιτήσεων που ορθώς ταξινομήθηκαν από το μοντέλο ως ύποπτες, στο σύνολο αυτών που ταξινομήθηκαν ως πιθανή απάτη.
  • Ανάκληση (Recall): Το ποσοστό των απαιτήσεων που ταξινομήθηκαν ως ύποπτες και αποτελούν ασφαλιστική απάτη, στο σύνολο των περιπτώσεων απάτης.
  • Ειδικότητα (Specificity): Το ποσοστό των παρατηρήσεων που δεν αποτελούν ασφαλιστική απάτη και δεν ταξινομήθηκαν ως ύποπτες.
  • Καμπύλη ROC (ROC Curve): Η καμπύλη ROC παρουσιάζει τη σχέση μεταξύ ευαισθησίας και ειδικότητας. Οι ταξινομητές που δίνουν καμπύλες πιο κοντά στην πάνω αριστερή γωνία του γραφήματος εμφανίζουν καλύτερη απόδοση. Όσο πιο μεγάλο είναι το εμβαδό κάτω από την καμπύλη (Area under the curve -AUC), τόσο καλύτερη απόδοση εμφανίζει το μοντέλο (Σχήμα 8).
Ανίχνευση ασφαλιστικής απάτης στην ασφάλιση αυτοκινήτων

Το τελικό μοντέλο που προκύπτει δίνει ένα score σε κάθε αίτημα αποζημίωσης. Με βάση το score αυτό, ένα αίτημα αποζημίωσης ταξινομείται ως πιθανή απόπειρα απάτης ή ως πιθανά ειλικρινής δήλωση.

Τα αποτελέσματα της ανάλυσης για τα ιστορικά στοιχεία, τα οποία φαίνονται στον Πίνακα 2, έδειξαν ότι ταξινομήθηκε σωστά το 87% των ασφαλιστικών απαιτήσεων (Ορθότητα). Συγκεκριμένα, φαίνεται ότι, από το σύνολο των περιπτώσεων που ταξινομήθηκαν ως ύποπτες, το 84% από αυτές αποτελεί στην πραγματικότητα ασφαλιστική απάτη (Ακρίβεια). Επιπλέον, ένα πολύ σημαντικό μέτρο αξιολόγησης για τα μοντέλα ανίχνευσης ασφαλιστικής απάτης είναι η ανάκληση, από την οποία προκύπτει ότι, από το σύνολο των ασφαλιστικών απαιτήσεων που αποτελούν ασφαλιστική απάτη, το 92% εξ αυτών ταξινομήθηκε σωστά από το μοντέλο. Στο Σχήμα 8 παρατίθεται η διαγραμματική παρουσίαση της καμπύλης ROC.

Ανίχνευση ασφαλιστικής απάτης στην ασφάλιση αυτοκινήτων

Υπενθυμίζεται ότι τα ιστορικά δεδομένα διερευνήθηκαν στο σύνολό τους, ένα προς ένα, ως προς την πιθανότητα να αποτελούν απόπειρα απάτης, κάτι που ενέχει μεγάλο κόστος και απαιτεί πολύ χρόνο. Με τη χρήση του μοντέλου, ο έλεγχος θα γίνεται άμεσα και το κόστος που θα επιβαρύνει την εταιρεία θα είναι εξαιρετικά μικρό. Συγκεκριμένα, η εταιρεία θα ήλεγχε μόνο τα 230 αιτήματα (αντί το σύνολο αυτών) και θα είχε σημαντικά μικρότερο κόστος. Το μέσο κόστος ελέγχου είναι $5.000 και, συνεπώς, ο έλεγχος των 230 αιτημάτων κοστίζει περίπου $1.150.000 (αντί $5.000.000 για τα 1.000 αιτήματα).

Ουσιαστικά, θα έχανε μόλις 20 περιπτώσεις απάτης, αναλαμβάνοντας την υποχρέωση αποζημίωσής τους με κόστος περίπου $1.000.000. Επομένως, το συνολικό όφελος της εταιρείας από τη χρήση του μοντέλου, έναντι του ενδελεχούς ελέγχου, ανέρχεται περίπου σε $3.000.000, πέραν του εξαιρετικά μεγάλου οφέλους σε χρόνο.

*Ο κ. Σωτήριος Μπερσίμης είναι Αναπληρωτής Καθηγητής στο Πανεπιστήμιο Πειραιώς.

*Ο κ. Χρήστος Μπουντούλης είναι επιστήμονας των Δεδομένων στην εταιρεία Covariance, με εξειδίκευση στον ασφαλιστικό κλάδο.


Διαβάστε επίσης:

Η αξιοποίηση των Big Data στον ασφαλιστικό κλάδο

Ανίχνευση ασφαλιστικής απάτης στην ασφάλιση κατοικίας

Μοντέλα πρόβλεψης του ύψους των ασφαλιστικών απαιτήσεων στην ασφάλιση υγείας

Πρόβλεψη πώλησης Ασφάλισης Οχήματος σε πελάτες με Ασφαλιστήρια Υγείας

Ασφάλιση αυτοκινήτου: Ποιοι πελάτες θα ανανεώσουν το ασφαλιστήριό τους;


Ακολουθήστε την Ασφαλιστική Αγορά στο Google News

Εγγραφείτε στο NewsLetter μας