Lọc theo danh mục
  • Năm xuất bản
    Xem thêm
  • Lĩnh vực
liên kết website
Lượt truy cập
 Lượt truy cập :  21,123,515
  • Công bố khoa học và công nghệ Việt Nam

Nguyễn Văn Lễ, Mạnh Thiên Lý, Nguyễn Thị Định, Nguyễn Thị Thanh Thủy

IMPROVEMENT OF K-MEANS ALGORITHM AND APPLICATIONS FOR STUDENTS TO CHOOSE MAJORS BASED ON CREDITS SYSTEM

CẢI TIẾN THUẬT TOÁN K-MEANS VÀ ỨNG DỤNG HỖ TRỢ SINH VIÊN CHỌN CHUYÊN NGÀNH THEO HỌC CHẾ TÍN CHỈ

Tạp chí Khoa học Công nghệ và Thực phẩm

2018

1

K-Means là thuật toán được ứng dụng rất hiệu quả trong nhiều bài toán phân cụm dữ liệu. Nhóm tác giả áp dụng thuật toán này để phân cụm chuyên ngành trên tập dữ liệu điểm số, tuy nhiên thuật toán kém hiệu quả trong một số trường hợp nên độ chính xác không cao. Vì vậy, trong bài báo này, nhóm tác giả đề xuất phương pháp phân cụm trên tập dữ liệu nhóm điểm đặc trưng cho mỗi chuyên ngành. Ngoài ra, cải tiến thuật toán K-Means để loạibỏ phần tử nhiễu nhằm giảm thời gian tính toán của thuật toán. Kết quả phân cụm sẽ hỗ trợ sinh viên Khoa Công nghệ Thông tin, Trường Đại học Công nghiệp thực phẩm Thành phố Hồ Chí Minh lựa chọn chuyên ngành phù hợp.Từ khóa K-Means, phân cụm dữ liệu, chọn chuyên ngành, khoảng cách Euclid, trọng tâm.

K-means algorithm is very effectively used in many applications about databaseclustering. The authors applied this algorithm to professional clustering on the score data set,but the authorithms were inefficient in some cases, so the accuracy was not high. Therefore, in this paper, a clustering method on the group data set specific to each discipline was proposed. In addition, the improvement of K-Means algorithm for removing noise items was done in order to reduce the computation time of the algorithm. The result of this clustering will support students of Faculty of Information Technology, Ho Chi Minh City University of Food Industry in choosing their majors.Keywords K-Means, clustering, choose specialized, Euclidean distance, centroids.