Lọc theo danh mục
  • Năm xuất bản
    Xem thêm
  • Lĩnh vực
liên kết website
Lượt truy cập
 Lượt truy cập :  19,963,624
  • Công bố khoa học và công nghệ Việt Nam

27

Toán học ứng dụng

Phan Thành Huấn

Dup-apriori: thuật toán hiệu quả khai thác tập phổ biến dựa trên giao dịch trùng lặp

Dup-apriori: an efficient algorithm for mining frequent itemsets based on duplicate transactions

Tạp chí Khoa học và Công nghệ (Đại học Đà Nẵng)

2022

11.2

50-55

1859-1531

Thuật toán Apriori là thuật toán kinh điển được dùng cho khai thác tập phổ biến từ dữ liệu giao dịch nhị phân – giai đoạn quan trọng trong khai thác luật kết hợp. Đây là thuật toán được nhiều nhóm nghiên cứu quan tâm cải tiến, cũng như sử dụng khai thác trên nhiều loại dữ liệu khác nhau. Trong bài viết này, tác giả trình bày tiếp cận mới trong cải tiến hiệu quả thuật toán Apriori dựa trên giao dịch trùng lặp - giúp đẩy nhanh tốc độ tính toán và giảm thiểu quá trình truy xuất dữ liệu. Thuật toán cải tiến được gọi là DUP-Apriori. Tác giả tiến hành thực nghiệm thuật toán trên bộ dữ liệu thực của UCI và dữ liệu giả lập của trung tâm nghiên cứu IBM Almaden, cho thấy thuật toán cải tiến hiệu quả so với thuật toán gần đây.

The Apriori algorithm is the classic algorithm used for frequent itemset mining from binary dataset - important phase in association rule mining. This is an algorithm that many research groups are interested in improving, as well as using mining on many different types of dataset. In this paper, the author presents a new approach in improving the efficiency of the Apriori algorithm based on duplicate transactions - to speed up computation and reduce database access. The improved algorithm is called DUP-Apriori. Experimenting the algorithm on real dataset of UCI and simulated dataset of IBM Almaden research center, shows that the algorithm improves efficiency compared to the recent algorithm.

TTKHCNQG, CVv 465