chapter 10 algoritme for association rules
DESCRIPTION
Chapter 10 ALGORITME for ASSOCIATION RULES. Market Basket Analysis. Apriori. Case. Sulidar Fitri , M.Sc. REFERENCES. Budi Santosa . Data Mining: Teknik Pemanfaatan Data Untuk Keperluan Bisnis . 2007. Graha Ilmu Yogyakarta - PowerPoint PPT PresentationTRANSCRIPT
Data Mining © Sulidar Fitri, Ms.C
STMIK AMIKOM Yogyakarta
Chapter 10
ALGORITME for
ASSOCIATION RULES
Sulidar Fitri, M.Sc
Market Basket AnalysisMarket Basket AnalysisAprioriAprioriCaseCase
Data Mining © Sulidar Fitri, Ms.C
STMIK AMIKOM Yogyakarta
REFERENCES• Budi Santosa. Data Mining: Teknik
Pemanfaatan Data Untuk Keperluan Bisnis. 2007. Graha Ilmu Yogyakarta
• Jiawei Han and Micheline Kamber. Data Mining: Concepts and Techniques. 2006. Department of Computer Science University of Illinois at Urbana-Champaign. www.cs.uiuc.edu/~hanj
• Ian H. Witten, Eibe Frank, Mark A. Hall. Data Mining Practical Machine Learning Tools and Techniques Third Edition.2011. Elsevier
• WEKA
Data Mining © Sulidar Fitri, Ms.C
STMIK AMIKOM Yogyakarta
INTNRODUCTION
• DATA MINING– Proses untuk menemukan dataset baru pada
dataset yang sangat besar.
• TOPIK– ASSOCIATION RULES (ATURAN ASOSIASI)– FREQUENT ITEMSETS
Data Mining © Sulidar Fitri, Ms.C
STMIK AMIKOM Yogyakarta
• Menggunakan algoritme klasik : IF - THEN
ATURAN ASOSIASI
Data Mining © Sulidar Fitri, Ms.C
STMIK AMIKOM Yogyakarta
ATURAN ASOSIASI
• Analisis Afinitas = “apa bersama apa”• Bisa digunakan untuk menentukan kebiasaan “
suatu produk apa akan dibeli bersama apa”• Market Basket Analysis• Contoh: – Studi transaksi di supermarket– Jika membeli Susu Bayi makan akan membeli
Sabun Mandi
Data Mining © Sulidar Fitri, Ms.C
STMIK AMIKOM Yogyakarta
ATURAN ASOSIASI DALAM TRANSAKSI• Menemukan asosiasi produk dalam database
transaksi suatu supermarket. (database Market Basket)
• Contoh Kasus:– Para manajer ingin mengetahui kelompok items apa yang
sering dibeli untuk membuat layout katalog belanja.
• Solusi:– Gunakan aturan asosiasi dalam hubungan “if-then” atau
“jika-maka”.– Aturan tersebut dihitung dari data yang sifatnya
probabilistic berdasarkan data market basket
Data Mining © Sulidar Fitri, Ms.C
STMIK AMIKOM Yogyakarta
KASUS
• Suatu toko yang menjual pakaian olah raga, sedang melakukan promosi padapenjualan topi. Jika seorang pelanggan membeli lebih dari satu macam topi dari 6 pilihan yang ada akan mendapat diskon.
• Manajer toko tersebut ingin melihat warna apa yang dibeli bersama oleh pelanggan, mengumpulkan data dan menyimpan dalam database.
Data Mining © Sulidar Fitri, Ms.C
STMIK AMIKOM Yogyakarta
Data items Topi tersebut berupa:
• Catatan transaksi pembelian
Transaksi1 merah putih hijau2 putih orange3 putih biru4 merah putih orange5 merah biru6 putih biru7 putih orange8 merah putih biru hijau9 merah putih biru10 kuning
Warna
Data Mining © Sulidar Fitri, Ms.C
STMIK AMIKOM YogyakartaIde dari Aturan Asosiasi:
• Periksa semua kemungkinan “IF - THEN”• Pilih yang paling mungkin (most likely) sebagai
indicator dari hubungan ketergantungan antar item.
• Antecedent =“Jika” dan consequent = “maka”• Kemungkinan aturan:– “Jika Merah, maka Putih ”– {Merah, Putih} = {Biru}
Data Mining © Sulidar Fitri, Ms.C
STMIK AMIKOM Yogyakarta
Secara praktis,Hanya kombinasi yang terjadi dengan frekuensi yang sangat tinggi yang akan diperhatikan
itu yang disebut:FREQUENT ITEM SET
Data Mining © Sulidar Fitri, Ms.C
STMIK AMIKOM Yogyakarta
FREQUENT ITEM SET• Berhubungan dengan SUPPORT• SUPPORT: jumlah transaksi yang mengandung
item• Support digunakan untuk mengukur seberapa
tingkat dukungan data terhadap validitas aturan yang dikembangkan.
• Dinyatakan dalam prosentase (%)• Contoh:– {Merah, Putih} adalah 4/10 atau 40%
Data Mining © Sulidar Fitri, Ms.C
STMIK AMIKOM Yogyakarta
Mengukur Aturan yang Kuat
Data Mining © Sulidar Fitri, Ms.C
STMIK AMIKOM Yogyakarta
Contoh Confidence• Suatu supermarket memiliki 100.000
titik transaksi. Dari jml tersebut ada 1000 transaksi yang mengandung jeruk dan obat flu. Dari 1000 transaksi ada 800 yang mengandung mie instant.
• Aturan asosiasi jika jeruk dan obat flu dibeli maka mie instant juga dibeli pada belanja yang bersamaan => – Support= 800/100.000– Confidence = 800/1000
Data Mining © Sulidar Fitri, Ms.C
STMIK AMIKOM Yogyakarta
• SUPPORT: Peluang transaksi yang dipilih secara random dari database akan mengandung semua item dalam antecendent maupun consequent atau P (antecedent dan consequent).
Data Mining © Sulidar Fitri, Ms.C
STMIK AMIKOM Yogyakarta
P (consequent | antecedent)P (consequent | antecedent)
Data Mining © Sulidar Fitri, Ms.C
STMIK AMIKOM Yogyakarta
Lift Ratio
Data Mining © Sulidar Fitri, Ms.C
STMIK AMIKOM Yogyakarta
Susunlah aturan asosiasi dari set item {merah, putih, hijau} !!
Transaksi1 merah putih hijau2 putih orange3 putih biru4 merah putih orange5 merah biru6 putih biru7 putih orange8 merah putih biru hijau9 merah putih biru10 kuning
Warna
Data Mining © Sulidar Fitri, Ms.C
STMIK AMIKOM Yogyakarta
Jika kita Terapkan syarat minimum confidence 75%, maka hanya aturan 2,3, dan 6 yang akan memenuhi
Jika kita Terapkan syarat minimum confidence 75%, maka hanya aturan 2,3, dan 6 yang akan memenuhi
Data Mining © Sulidar Fitri, Ms.C
STMIK AMIKOM YogyakartaAda beberapa algoritme yang sudah
dikembangkan mengenai aturan asosiasi, namun
ada satu algoritme klasik yang sering dipakai yaitu
algoritma apriori (Shmueli et al., 2007)
April 20, 2023 Data Mining: Concepts and Techniques 20
Apriori: A Candidate Generation-and-Test Approach
Apriori pruning principle: If there is any itemset which is infrequent, its superset should not be generated/tested! (Agrawal & Srikant @VLDB’94, Mannila, et al. @ KDD’ 94)
Method: Initially, scan DB once to get frequent 1-itemset Generate length (k+1) candidate itemsets from
length k frequent itemsets Test the candidates against DB Terminate when no frequent or candidate set can
be generated
April 20, 2023 Data Mining: Concepts and Techniques 21
The Apriori Algorithm—An Example
Database TDB
1st scan
C1L1
L2
C2 C2
2nd scan
C3 L33rd scan
Tid Items
10 A, C, D
20 B, C, E
30 A, B, C, E
40 B, E
Itemset sup
{A} 2
{B} 3
{C} 3
{D} 1
{E} 3
Itemset sup
{A} 2
{B} 3
{C} 3
{E} 3
Itemset
{A, B}
{A, C}
{A, E}
{B, C}
{B, E}
{C, E}
Itemset sup{A, B} 1{A, C} 2{A, E} 1{B, C} 2{B, E} 3{C, E} 2
Itemset sup{A, C} 2{B, C} 2{B, E} 3{C, E} 2
Itemset
{B, C, E}
Itemset sup
{B, C, E} 2
Supmin = 2