В данной работе рассматриваются основные этапы обработки и методы отбора признаков для их дальнейшего использования в алгоритмах машинного обучения для построения моделей, которые предназначены для прогнозирования платежеспособности клиентов банка. В работе были рассмотрены такие способы отбора признаков как: расчет коэффициентов WoE (Weight of Evidence) для признаков с последуюш;ей оценкой предсказательной силы отобранных факторов с помош;ью расчета коэффициента IV (information value) и оценка важности признаков с помош;ью алгоритма случайного леса совместно с методом RFE (recursive feature elimination), основанного на логистической регрессии.
Информационные технологии и математическое моделирование (ИТММ-2021) : материалы XX Международной конференции имени А. Ф. Терпугова, 1−5 декабря 2021 г.. Томск, 2022. С. 56-62