이것저것/공공데이터 일경험 수련생(2021년)

2021년 10월 25일_SQL 진단 업무일지

Iam_im2 2021. 10. 25. 21:56
728x90

<배정업무>
개방데이터 품질 진단 및 개선(SQL)

<배정파일>
문화○○_○○○○본부_○○○○_관람객_수_현황_20○○년
○○-○○30. ○○첨단○○○○단지 6월 용지별 ○○ 현황
19○○년 ○○지 공시지가


등등







1. 업무
육안진단 업무를 하던 사람들은 오늘부터 파일데이터 도구 진단(GDQ File진단도구 활용)으로 업무가 전환됐다. SQL진단은 그대로 업무를 수행한다. 오늘은 배정받은 파일 수는 평소보다 적었으나, 각 파일 당 컬럼수가 22개~127개였다. 127개의 컬럼이 있는 파일을 여는 순간 몹시 막막했다. 그나마 127개 컬럼이 있는 파일은 동일 패턴이었으나 21개 컬럼이 있는 파일은 각 항목마다 각기 다른 SQL구문으로 오류검출을 해야했다. 게다가 매니저님은 오늘 휴일이라서 정말이지 말도 안되게 힘든 날이었다. 파이썬을 좀 공부해서 업무 효율성을 높여야겠다.




[19○○년 ○○지 공시지가]
테이블명 : F10001○○○○
데이터건수 : 449,925건
컬럼 수 : 22개

<오류>
숫자 표기 오류다. 값이 자연수 '42'인데, '0042'라고 입력되어있다. 2개 컬럼에 이러한 오류건수가 47개, 100개있었다.

728x90