Ứng dụng mô hình học máy và học sâu trong nhận dạng và phân loại quả xoài

Chỉ số đề mục

65

Lĩnh vực nghiên cứu

21101 - Kỹ thuật thực phẩm

Dạng tài liệu

BB

Tác giả

Nguyễn Đức Phong⁽¹⁾

Nhan đề

Ứng dụng mô hình học máy và học sâu trong nhận dạng và phân loại quả xoài

Nhan đề tiếng anh

Machine learning and deep learning models applied to identification and classification of mango

Nguồn trích

Kiểm nghiệm và An toàn Thực phẩm

Năm xuất bản

2024

Số

3

Trang

429-437

ISSN

2615-9252

Từ khóa

Phân loại xoài, Học máy, Học sâu, 1D-CNN, Phổ Vis- NIR.

Từ khóa tiếng anh

Mango classification, Machine learning, Deep learning, 1D-CNN, Vis-NIR spectra

Tóm tắt

Nghiên cứu này kế thừa các số liệu đã công bố trên trang https://data.mendeley.com/ datasets/46htwnp833/2 về dữ liệu phổ vùng khả kiến - hồng ngoại gần (Vis-NIR) ở khoảng bước sóng từ 309 nm đến 1149 nm của 11691 quả xoài tại Úc, lấy từ 10 giống xoài, thuộc 2 vùng trồng. Nghiên cứu đã phát triển các mô hình học máy với mã nguồn mở Python như: phân tích thành phần chính (PCA) kết hợp với máy vector hỗ trợ (SVM), cây quyết định (DT), rừng ngẫu nhiên (RF) và mạng thần kinh nhân tạo (ANN); mô hình bình phương tối thiểu từng phần kết hợp với phân tích biệt thức (PLS-DA), cùng với mô hình học sâu mạng thần kinh tích chập 1 chiều (1D-CNN) với các bước tiền xử lý dữ liệu phổ toàn phần bao gồm đạo hàm bậc hai và làm mịn bằng thuật toán Savitzky-Golay, cân bằng dữ liệu thông qua kỹ thuật tạo mẫu tổng hợp mới cho mẫu thiểu số (SMOTE). Kết quả cho thấy sử dụng thêm kĩ thuật tiền xử lý số liệu SMOTE trước khi chạy các mô hình học máy đã làm tăng đáng kể khả năng phân loại.

Tóm tắt tiếng anh

This study utilizes the data published on the website https://data.mendeley.com/ datasets/46htwnp833/2, which includes visible-near-infrared (Vis-NIR) spectral data at wavelengths ranging from 309 nm to 1149 nm for 11691 mangoes in Australia, collected from 10 mango varieties across 2 different growing regions. The research developed machine learning models with open-source programming language Python such as: principal component analysis (PCA) combined with support vector machines (SVM), decision trees (DT), random forests (RF), and artificial neural networks (ANN); partial least squares model combined with discriminant analysis (PLS-DA); and a deep learning model 1-dimensional convolutional neural network (1D-CNN). The preprocessing steps were carried out based on the full spectral data with second derivative, smoothing using the Savitzky-Golay algorithm, and data balancing via a new Synthetic Minority Oversampling Technique (SMOTE). The results demonstrated that applying the SMOTE data preprocessing technique before running the machine learning models significantly enhanced classification accuracy. Furthermore, using a 1D-CNN model with a complex structure provided higher classification efficiency than conventional machine learning models.

Kí hiệu kho

TTKHCNQG, CTv 166

File toàn văn

Xem toàn văn