علم داده در صنعت بیمه
بسیاری از دادههای موجود در صنعت بیمه نیاز به تجزیه و تحلیل انواع داده ها در مقیاس بزرگ و ناهمگن از جمله متغیرهای پیوسته، گسسته و شمارشی دارند. علم داده، علمی، میان رشتهای است بین علم آمار و علوم کامپیوتر است. به بیان دیگر،علم داده، علمی برای یکپارچهسازی آمار، تحلیل داده، یادگیری ماشین و یادگیری عمیق، مدلسازی آماری است. از سویی دیگر، تحلیل تعداد ادعای خسارت و عوامل تشکیل دهندهی خطر برروی این پاسخ، برای شرکتهای بیمه حایز اهمیت میباشد. برای این منظور، برخی از مدلها با پاسخهای شمارشی با استفاده از توزیع سریهای توانی مانند مدل رگرسیون پواسون و مدل رگرسیون دوجملهای منفی و توزیع سریهای توانی آماسیده صفر مانند مدل رگرسیون پواسون آماسیده صفر و رگرسیون دوجملهای منفی آماسیده صفر برای تحلیل دادههای بیمه شخص ثالث با تعداد صفر زیاد استفاده میشود. یکی از موضوعهای مهم در بیمهی شخص ثالث تحلیل و انتخاب مدل مناسب برای برازش برروی دادههای تعداد ادعای خسارت میباشد. تحلیل رگرسیون با پاسخهای شمارشی اجازهی شناسایی عاملهای ریسک و پیشگویی فراوانی مورد انتظار ادعاها با توجه به ویژگیهای قرارداد را میدهد. در بیمه منظور از پاسخ ها، تعداد ادعاهای خسارتی است که شخص بیمه گذار به شرکت های بیمه گزارش می دهد. شرکت های بیمه برای به دست آوردن حق بیمه از مدل های شمارشی شناخته شده مانند مدل پواسون برای تعداد ادعای خسارت استفاده می کنند که این مدل ها در بیمه اتومبیل به دلیل آنکه این نوع داده ها دارای صفرهای زیادی می باشند کارایی پایین تری نسبت به مدل های آماسیده صفر دارد. بیشتر این صفرها به دلیل گزارش دروغین بیمه گذارها برای استفاده از سیستم تخفیف آخر سال می باشد. مدل های آماسیده صفر (که در بخش دوم این مدل ها معرفی می شود) به دلیل اینکه یک پارامتر احتمالی را برای این صفرها در نظر می گیرد توانایی برآورد احتمال این ادعاهای دروغین را بر اساس سابقه ی بیمه گذار که همان متغیرهای تبیینی و تعداد ادعای خسارت سال های گذشته بیمه گذار می باشد دارد. همچنین محاسبه حق بیمه از مهم ترین مسایل نظریه ریسک در علوم بیم سنجی محسوب می شود. این امر خود به شدت متاثر از مدلی است که برای توصیف وضعیتی در یک حوزه ی بیمه به کار گرفته می شود. با توجه به نکاتی که بیان شد استفاده از علم آمار در علوم بیم سنجی پیشینه ای طولانی در دنیا دارد. اما این موضوع در کشور ایران بسیار جدید و نوع می باشد. استفاده از علم آمار در علوم بیم سنجی در شرکت های بیمه کشور بسیار محدود می باشد. به عبارت دیگر پژوهش های آماری در صنعت بیمه کشور جوان است و هنوز به طور جدی مورد توجه شرکت های بیمه قرار نگرفته است.