Một mô hình học sâu cho bài toán xếp hạng tín dụng

Chỉ số đề mục

Lĩnh vực nghiên cứu

Khoa học máy tính

Dạng tài liệu

BB

Tác giả

Hoàng Thanh Hải, Thân Quang Khoát⁽¹⁾

Nhan đề

Một mô hình học sâu cho bài toán xếp hạng tín dụng

Nhan đề tiếng anh

A deep learning approach for credit scoring

Nguồn trích

Tạp chí Khoa học và Công nghệ - Đại học Thái Nguyên

Năm xuất bản

2024

Số

07

Trang

58 - 64

ISSN

1859-2171

Từ khóa

Xếp hạng tín dụng, Học sâu, Lợi nhuận, Mất cân bằng dữ liệu, Thiếu hụt dữ liệu

Từ khóa tiếng anh

Credit Scoring, Deep Learning, Profit, Data Imbalance, Data Shortage

Tóm tắt

Cho vay tín dụng là hoạt động kinh doanh chủ yếu của một ngân hàng. Do đó, các ngân hàng cần một mô hình có độ chính xác cao để quyết định khách hàng nào được cho vay. Trong những năm gần đây, việc sử dụng học sâu để lựa chọn khách hàng phù hợp thu hút được sự quan tâm lớn. Tuy nhiên, việc thiếu hụt dữ liệu, sự đa dạng của loại dữ liệu, hay mất cân bằng trong dữ liệu có thể làm giảm độ chính xác của các mô hình phân loại dựa trên học sâu. Mục tiêu nghiên cứu của chúng tôi trong bài báo này là xây dựng một mô hình phân loại tín dụng dựa trên học sâu. Chúng tôi sử dụng bộ dữ liệu được công bố trên kho lưu trữ UC Irvine Machine Learning, một kho lưu trữ các bộ dữ liệu được sử dụng nhiều trong học máy. Kiến trúc mô hình được thiết kế để phù hợp với hai loại dữ liệu đầu vào của mô hình, dữ liệu định tính và dữ liệu định lượng. Mô hình được đề xuất có độ chính xác tương đối cao trong lớp các mô hình học sâu trên cùng bộ dữ liệu. Chúng tôi cũng xem xét lợi nhuận thu được của ngân hàng khi sử dụng mô hình. Kết quả cho thấy mô hình mang lợi mức lợi nhuận đáng kể cho ngân hàng.

Tóm tắt tiếng anh

Granting credit to customers is the core business of a bank. Hence, banks need adequate models to decide to whom to approve a loan. Over the past few years, the usage of deep learning to se-lect appropriate customers has attracted considerable research attention. However, the data shortage, type of features, and data imbalance could decrease deep learning model performance f-rom the accuracy perspective. This study aims to build a classifier for credit scoring based on deep learning. We use a credit scoring dataset publicly available on the UC Irvine Machine Learning Repository, a source of machine learning datasets commonly used by researchers. The model architecture is designed to be suitable for two kinds of input features, categorical and numerical ones. Our proposed model gave a relatively high accuracy among recent deep-learning-based models on the same dataset. We also consider the bank profit when applying the model, which is the ultimate goal of lenders. We found that if the banks use our model, they could gain a significant profit.

Kí hiệu kho

TTKHCNQG, CTv 178

File toàn văn

Xem toàn văn