Lọc theo danh mục
  • Năm xuất bản
    Xem thêm
  • Lĩnh vực
liên kết website
Lượt truy cập
 Lượt truy cập :  24,697,234
  • Công bố khoa học và công nghệ Việt Nam

Khoa học máy tính và thông tin

Trần Minh Thái(1), Trần Anh Duy, Lê Thị Minh Nguyện

Khảo sát phương pháp ẩn luật kết hợp trong dữ liệu giao dịch

A survey of hiding association rule methods in transaction datasets

Tạp chí Khoa học (Trường Đại học Ngoại ngữ - Tin học Thành phố Hồ Chí Minh)

2022

1

14-24

2354-113X

Khai thác dữ liệu bảo toàn tính riêng tư (Privacy-Preserving Data Mining - PPDM) là một lĩnh vực nghiên cứu tương đối mới trong cộng đồng khai thác dữ liệu và đã tồn tại khoảng hơn một thập kỷ. PPDM nghiên cứu các hiệu ứng phụ của phương pháp khai thác dữ liệu có nguồn gốc từ sự xâm nhập vào sự riêng tư của các cá nhân và tổ chức. Một số phương pháp tiếp cận để giải quyết vấn đề này đã được nghiên cứu và áp dụng. Các phương pháp được đề xuất có thế được phân loại theo hai hướng nghiên cứu chính đó là ẩn dữ liệu và ẩn tri thức. Ẩn dữ liệu là hướng nghiên cứu về tính riêng tư trong các dữ liệu thô hay thông tin, có thể được đảm bảo trong quá trình khai thác dữ liệu. Các phương pháp của nhóm này tác động vào bản thân dữ liệu nhằm mục đích làm ẩn các thông tin nhạy cảm bằng các phương pháp khác nhau. Ấn tri thức liên quan đến các phương pháp nhằm bảo vệ các kết quả khai thác dữ liệu nhạy cảm chứ không phải chính dữ liệu thô. Đây là hướng ứng dụng chính của các công cụ và thuật toán khai thác dữ liệu. Trong đó, ẩn luật kết hợp là một hướng nghiên cứu trong nhóm ẩn tri thức. Trong bài báo này, chúng tôi tập trung vào việc trình bày bài toán liên quan đến ẩn luật kết hợp. Bên cạnh đó, tác giả khảo sát các kỹ thuật ẩn luật kết hợp và so sánh các phương pháp đã được đề xuất nhằm làm rõ sự thay đổi hướng tiếp cận của các phương pháp ẩn luật. Cuối cùng, các phương pháp thực nghiệm cùng với các độ đo được sử dụng để so sánh hiệu quả của các thuật toán cũng được trình bày cụ thể trong bài báo.

Privacy-Preserving Data Mining (PPDM) is a new area of research in the data mining community and has been focused on for over a decade. PPDM studies the side effects of data mining methods that stem from intrusions into the privacy of individuals and organisations. Several approaches to solving this problem have been studied and applied. The proposed methods can be classified according to two main research directions: data hiding and knowledge hiding. Data hiding is a research direction on the privacy of raw data or information, which can be guaranteed during data mining. The methods of this group work on the data itself to hide sensitive information by different methods. Knowledge hiding refers to protecting the results of mining sensitive data instead of the raw data itself. It is the main application direction of data mining tools and algorithms. In which, association rule hidden is a research direction in a knowledge hidden group. In this paper, we focus on presenting the problem related to hidden association rules. Besides, we investigate the association rule hiding techniques and compare the proposed methods to clarify the change of approach of the hiding rule methods. Finally, the experimental methods performed with the measures used to compare the efficiency of the algorithms are also presented in the paper.

TTKHCNQG, CVv 488