Skip Headers

EXPLORE

E-MINER PROGRAM (마이닝)

Go to Documentation Home
HOME
Go to Book List
Miner_home
Go to Table of Contents
연구회
Go to Index
자료실
Go to Master Index
SAS
Go to Feedback page
MAIL

Go to previous page
Previous
Go to next page
Next

5. 연관성 분석(Association)


* 연관성 분석은 데이터안에 존재하는 품목간의 연관성 규칙을 발견하는 과정이다. 연관성 규칙은 상품을 구매하거나 서비스를 받는등의 일련의 거래나 사건들의 연관성에 대한 규칙이다.


1. 연관성 분석
1-2. 데이터 처리작업
2. 시차연관성 분석
2-2. 데이터 처리작업

1. 연관성 분석

MAIN

 

 

* 데이터 원본은 Input Data에서 만들어진 VIEW데이터;

data EMDATA.VIEW_ZMK / view=EMDATA.VIEW_ZMK;
 set EMSAMPLE.BNKSERV;
run;

* 1. 연관성 규칙;
proc dmdb data =EMDATA.VIEW_ZMK
          out =_null_
          dmdbcat=EMPROJ.dm_DGM00000
          normlen=256 maxlevel=100001;
     id ACCT;
     class SERVICE(Desc);
     target SERVICE;
run;

* Create data view with dmdb name;
data EMDATA.dm_DGM00000 / view=EMDATA.dm_DGM00000;
 set EMDATA.VIEW_ZMK;
run;

proc sort data=EMDATA.VIEW_ZMK( keep=SERVICE ACCT)
          out=_emtrain ;
     by ACCT;
run;
* 4개의 항목(아이템) 생성;
options nocleanup;
Proc Assoc dmdbcat= EMPROJ.dm_DGM00000
           data = _emtrain
           out = EMDATA.ASCRGEY1 (label = "Output from Proc Assoc")
           items=4;
     customer ACCT;
     target SERVICE;
run;

options nocleanup;
Proc Rulegen in = EMDATA.ASCRGEY1
             out= EMDATA.RLAAT6S4 (label = "Output from Proc Rulegen")
             minconf = 10;
run;
quit;

proc dmdb data = EMDATA.RLAAT6S4
          dmdbcat= EMPROJ.TMP_XDRE
          batch;
     var set_size support conf lift count;
run;
quit;


맨 위로 이동 맨 위로 이동


1-2. 데이터 처리 작업

MAIN

 

 

* 기초 데이터 생성;
proc sql;
  create view EMDATA.RU_DHZ2R as
    select *
    from EMDATA.RLAAT6S4
    where set_size gt 1 and exp_conf < conf ;
quit;

proc sql;
  reset noprint;
    select count(*) into :_tmpa
    from EMDATA.RU_DHZ2R;
quit;

proc sql;
  create view EMDATA.AS1_TBSM as
    select count, rule, set_size
    from EMDATA.RLAAT6S4
    where set_size = 1;
quit;

proc sql;
  create view EMDATA.AS2_2V25 as
    select *
    from EMDATA.RLAAT6S4
    where set_size = 1;
quit;

proc sql;
  reset noprint;
    select count(*) into :_tmpa

    from EMDATA.AS1_TBSM;
quit;

proc sql;
  create view EMDATA.STA_FTRW as
    select round(support, .01) as support,
           round(conf, .01) as conf,
           round(lift, .01) as lift ,
           set_size
    from EMDATA.RLAAT6S4;
quit;

proc sql;
  create view EMDATA.RU_FWH11 as
    select *
    from EMDATA.ASCRGEY1
    where set_size = 1;
quit;


맨 위로 이동 맨 위로 이동


2. 시차 연관성 분석

MAIN

 

* 시계열자료와 같이 사건들이 어떤 순서로 일어나며 이 사건들 사이의 연관성에 관신이 있을 때 고려되는 것이 시차 연관 규칙이다.

 

* 기초 데이터 생성;
data EMDATA.VIEW_ZMK / view=EMDATA.VIEW_ZMK;
 set EMSAMPLE.ASSOCS;
run;

proc dmdb data = EMDATA.VIEW_ZMK
          out = _null_
          dmdbcat= EMPROJ.dm_DGM00000
          normlen=256 maxlevel=100001;
     id CUSTOMER;
     class PRODUCT(Desc);
     target PRODUCT;
run;

* Create data view with dmdb name;
data EMDATA.dm_DGM00000 / view=EMDATA.dm_DGM00000;
 set EMDATA.VIEW_ZMK;
run;

proc sort data =EMDATA.VIEW_ZMK( keep=PRODUCT CUSTOMER TIME)
          out =_emtrain ;
     by CUSTOMER TIME;
run;

options nocleanup;
Proc Assoc dmdbcat= EMPROJ.dm_DGM00000
           data   = _emtrain
           out    = EMDATA.ASCV12SK (label = "Output from Proc Assoc")
           items  = 4;
     customer CUSTOMER;
     target PRODUCT;
run;
quit;

options nocleanup;
Proc sequence data   = _emtrain
              dmdbcat= EMPROJ.dm_DGM00000
              assoc  = EMDATA.ASCV12SK
              out    = EMDATA.RLS0JZQR (label = "Output from Proc Sequence")
              nitems = 3;
     customer CUSTOMER;
     target   PRODUCT;
     visit    TIME;
run;
quit;


맨 위로 이동 맨 위로 이동


2-2. 데이터 처리 작업

MAIN

 

* 기초 데이터 생성;
proc sql;
  create view EMDATA.RU_Y02VE as
    select *
    from EMDATA.RLS0JZQR ;
quit;

proc sql;
  create view EMDATA.RU_FZ8DC as
    select *
    from EMDATA.ASCV12SK
    where set_size = 1;
quit;


맨 위로 이동 맨 위로 이동