데이터가 아래와 같을 때, 변환하는 과정을 Pivoting이라고 한다. 데이터베이스에 들어가는 로그는 업데이트를 하면 안된다. 그렇기 때문에 아래로 길어야하는  ROW 데이터 형식으로 로그형식을 나타내야한다. 단점은 사원번호가 변경되야할 경우가 있는데, 그럴경우는  row 포맷은 사용할 수 없다. 계속 축적되야하는 경우네는 row포맷으로 넣는다.

------------------

사원번호, 요일, 매출액

2019253322,월,100

2019253322,화,200

2023738232,월,200

2023738232,화,300 


----------------


아래의 wide포맷은 row 포맷으로부터 바꿔 사용할 수 있다. 그렇게 될경우 전체 사원번호를 관리하기도 편하다. 사원정보는 변경되할 필요는 wide포맷으로 넣는다.

------------------

사원번호, 월, 화,수

100,100,200, 0

200,200,300,250

------------------

반응형

'Data science' 카테고리의 다른 글

Regular expression  (0) 2019.03.12
머신러닝 모델 분류  (0) 2019.03.12
SVM (Support Vector machine)  (0) 2019.02.23
Decision Tree (의사결정나무)  (2) 2019.02.15
Pandas Dataframe Manipulation  (0) 2019.02.14

+ Recent posts