Lọc theo danh mục
  • Năm xuất bản
    Xem thêm
  • Lĩnh vực
liên kết website
Lượt truy cập
 Lượt truy cập :  30,197,999
  • Công bố khoa học và công nghệ Việt Nam

Khoa học máy tính

BB

Hoàng Thanh Hải, Thân Quang Khoát(1)

Một mô hình học sâu cho bài toán xếp hạng tín dụng

A deep learning approach for credit scoring

Tạp chí Khoa học và Công nghệ - Đại học Thái Nguyên

2024

07

58 - 64

1859-2171

Cho vay tín dụng là hoạt động kinh doanh chủ yếu của một ngân hàng. Do đó, các ngân hàng cần một mô hình có độ chính xác cao để quyết định khách hàng nào được cho vay. Trong những năm gần đây, việc sử dụng học sâu để lựa chọn khách hàng phù hợp thu hút được sự quan tâm lớn. Tuy nhiên, việc thiếu hụt dữ liệu, sự đa dạng của loại dữ liệu, hay mất cân bằng trong dữ liệu có thể làm giảm độ chính xác của các mô hình phân loại dựa trên học sâu. Mục tiêu nghiên cứu của chúng tôi trong bài báo này là xây dựng một mô hình phân loại tín dụng dựa trên học sâu. Chúng tôi sử dụng bộ dữ liệu được công bố trên kho lưu trữ UC Irvine Machine Learning, một kho lưu trữ các bộ dữ liệu được sử dụng nhiều trong học máy. Kiến trúc mô hình được thiết kế để phù hợp với hai loại dữ liệu đầu vào của mô hình, dữ liệu định tính và dữ liệu định lượng. Mô hình được đề xuất có độ chính xác tương đối cao trong lớp các mô hình học sâu trên cùng bộ dữ liệu. Chúng tôi cũng xem xét lợi nhuận thu được của ngân hàng khi sử dụng mô hình. Kết quả cho thấy mô hình mang lợi mức lợi nhuận đáng kể cho ngân hàng.

Granting credit to customers is the core business of a bank. Hence, banks need adequate models to decide to whom to approve a loan. Over the past few years, the usage of deep learning to se-lect appropriate customers has attracted considerable research attention. However, the data shortage, type of features, and data imbalance could decrease deep learning model performance f-rom the accuracy perspective. This study aims to build a classifier for credit scoring based on deep learning. We use a credit scoring dataset publicly available on the UC Irvine Machine Learning Repository, a source of machine learning datasets commonly used by researchers. The model architecture is designed to be suitable for two kinds of input features, categorical and numerical ones. Our proposed model gave a relatively high accuracy among recent deep-learning-based models on the same dataset. We also consider the bank profit when applying the model, which is the ultimate goal of lenders. We found that if the banks use our model, they could gain a significant profit.

TTKHCNQG, CTv 178