



- Công bố khoa học và công nghệ Việt Nam
50
Khoa học máy tính
BB
Lê Văn Hòa
Phân lớp các quan điểm sử dụng một số phương pháp học máy cho văn bản tiếng Việt
Classification of sentiments using some machine learning methods for Vietnamese text
Tạp chí Khoa học và Công nghệ - Đại học Thái Nguyên
2024
15
51 - 58
1859-2171
Bài báo này sử dụng một số phương pháp học máy khác nhau để đánh giá khả năng phân lớp quan điểm cho dữ liệu tiếng Việt. Dữ liệu này là các câu bình luận trực tuyến về lĩnh vực du lịch. Ngoài ra, thực nghiệm còn so sánh và đánh giá kết quả phân lớp quan điểm các câu bình luận khi áp dụng các kỹ thuật nâng cao ngữ nghĩa cho văn bản tiếng Việt. Dữ liệu đưa vào thực nghiệm được thu thập từ các fanpage Facebook trong lĩnh vực du lịch và các website đánh giá trực tuyến như Tripadvisor.com.vn và Foody.vn. Thực nghiệm sử dụng 4 thuật toán học máy: K-Nearest Neighbor, Support Vector Machines, Naïve Bayes và Decision Tree. Kết quả cho thấy phương pháp học máy Support Vector Machines cho kết quả phân lớp quan điểm tốt nhất khi so sánh với các phương pháp K-Nearest Neighbor, Naïve Bayes, Decision Tree. Bài báo này có giá trị đối với các ứng dụng phân lớp quan điểm trong lĩnh vực du lịch.
This paper uses several different machine learning methods to evaluate the sentiment classification capability for Vietnamese datasets. The datasets consist of online comments in the field of tourism. Additionally, the experiments compare and evaluate the sentiment classification results of the comments when applying semantic enhancement techniques for Vietnamese texts. The datasets used in the experiments were collected f-rom Facebook fanpages in the field of tourism and online review websites such as Tripadvisor.com.vn and Foody.vn. The experiments use four machine learning algorithms: K-Nearest Neighbor, Support Vector Machines, Naïve Bayes, and Decision Tree. The results showed that the Support Vector Machines machine learning method provides the best sentiment classification performance compared to K-Nearest Neighbor, Naïve Bayes, and Decision Tree methods. This paper is valuable for sentiment classification applications in the field of tourism.
TTKHCNQG, CTv 178