Basket size là gì

  • Các package sử dụng trong Basket Analysis.

library[arules] library[arulesViz] library[reshape2] library[dplyr]

  • Basket Analysis.

    • Dữ liệu sử dụng sản phẩm khách hàng - Product holding

folder % arrange[desc[lift]] %>% head[]

## rules support confidence lift ## 1 {fx,tgkkh} => {gd_quocte} 0.01258754 0.8404423 61.242164 ## 2 {gd_quocte} => {fx} 0.01258754 0.9172414 61.145567 ## 3 {fx} => {gd_quocte} 0.01258754 0.8391167 61.145567 ## 4 {gd_quocte,tgkkh} => {fx} 0.01258754 0.9172414 61.145567 ## 5 {card_credit,i2b} => {gd_noibo} 0.01071834 0.6937213 5.810431 ## 6 {card_credit,i2b,tgkkh} => {gd_noibo} 0.01071834 0.6937213 5.810431
  • Nhận xét: Ở đâu xuất hiện thêm chỉ số Lift có ý nghĩa:

    \[Lift[A=>B] = \frac{confidence[A=>B]}{support[B]}=\frac{support[A=>B]}{support[A].support[B]} = a\]

    • Nếu: Lift > 1 khi KH mua sản phẩm A sẽ làm tăng khả năng mua thêm sản phẩm B a lần.

    • Nếu: Lift < 1 khi KH mua sản phẩm A sẽ làm giảm khả năng mua thêm sản phẩm B a lần.

    • Nếu: Lift = 1 khi KKH mua sản phẩm A sẽ không làm tăng khả năng mua sản phẩm B [A và B là 2 sản phẩm độc lập với nhau]

  • Tuy nhiên, trong thực tế, tùy mục đích là tìm các rule để tăng khả năng bán được sản phẩm nên chúng ta chỉ quan tâm tới các rule mà có hệ số Lift > 1.

  • Loại bỏ các rule trùng lặp

# Bước 3: Loại bỏ những rule trùng lặp. subset.matrix {tgkkh} 0.96867310 0.9686731 1.000000 ## 6 {gd_quocte} => {fx} 0.01258754 0.9172414 61.145567 ## 13 {pro_none} => {i2b} 0.01802953 0.5277008 2.098687 ## 15 {card_credit} => {gd_noibo} 0.01925989 0.6237548 5.224410 ## 16 {card_credit} => {i2b} 0.01545050 0.5003831 1.990044 ## 21 {gd_noibo} => {i2b} 0.06009843 0.5033690 2.001918

  • Bài toán xác định 3 trường hợp mà người phân tích muốn quan tâm:

  • Bài toán 1: Khách hàng sẽ mua sản phẩm nào tiếp theo khi mua sản phẩm Credit Card.

sub.rule1 % inspect[]

## lhs rhs support confidence lift ## 15 {card_credit} => {gd_noibo} 0.01925989 0.6237548 5.224410 ## 16 {card_credit} => {i2b} 0.01545050 0.5003831 1.990044
  • Bài toán 2: Khách hàng sử dụng sản phẩm gì trước khi sử dụng sản phẩm Giao dịch nội bộ.

sub.rule2 % inspect[]

## lhs rhs support confidence lift ## 21 {gd_noibo} => {i2b} 0.06009843 0.503369 2.001918
  • Bài toán 3: Những sản phẩm nào mà khách hàng hay mua cùng nhau.

as[rule.final,"data.frame"] %>% arrange[desc[lift]] %>% as.data.frame[]

## rules support confidence lift ## 1 {gd_quocte} => {fx} 0.01258754 0.9172414 61.145567 ## 2 {card_credit} => {gd_noibo} 0.01925989 0.6237548 5.224410 ## 3 {pro_none} => {i2b} 0.01802953 0.5277008 2.098687 ## 4 {gd_noibo} => {i2b} 0.06009843 0.5033690 2.001918 ## 5 {card_credit} => {i2b} 0.01545050 0.5003831 1.990044 ## 6 {} => {tgkkh} 0.96867310 0.9686731 1.000000
  • Visualization mối quan hệ giữa các rule.

plot[rule.final,method = "graph"]

Video liên quan

Chủ Đề