2월 목표로 설정했던 일들을 거의 지키지 못하는 나날이 계속되고 있습니다. 설 연휴까지 끼어있어서 생활 리듬은 계속 어긋나고, 할 일들을 쌓여 있고, 계속 피곤한 상태입니다. 반밖에 남지 않았지만 남은 기간이라도 알차게 사용하려고 합니다.
DB에 raw 데이터를 입력하고 과거 데이터의 집계 테이블을 만드는 작업을 진행하고 있습니다. 이런 작업은 Python과 SQL이 가장 효율적인 것 같습니다. Pandas를 이용하면 데이터를 수월하게 정제하여 DB에 저장할 수 있습니다. 그리고 중간 집계 작업을 진행하여 DB에 저장하는 것은 SQL이 가장 편리하네요.
일자별로 데이터를 집계하여 저장하는 작업을 위해 DB에 Calendar 테이블을 만들고, 날짜를 기준으로 outer join으로 처리하는 작업을 진행했습니다. 오랜만에 진행하는 SQL 작업이라 시간이 많이 걸렸습니다.
막혔던 부분들을 잊어버리지 않게 잘 정리해봐야겠습니다.