이것저것/공공데이터 일경험 수련생(2021년)

2021년 10월 28일_SQL 진단 업무일지

Iam_im2 2021. 10. 28. 21:43
728x90

<배정업무>
개방데이터 품질 진단 및 개선(SQL)

<배정파일>
새○○○○청_새○○사업 매립 정보_20○○○○30.csv
새○○○○청_새○○ 광역○○시설 설치정보_20○○○○10.csv
서울특별시 ○○구_공장등록 현황.csv
○○귀가 일자별 ○○.csv
서울특별시_○○구_길관광정보_20○○○○19.csv
서울특별시_○○구_길관광정보_20○○○○08_15○○○○93○○○○7_2392.csv



등등


 






1. 업무
어제부터 진척도관리시스템이 파일제출이 정상작동한다. 대략 일주일만에 진단결과보고서를 제대로 된 칸에 제출하고 있다. 보고서란에 진단결과보고서를 업로드하면 진척도 관리시스템에서 오류율을 검사하는 과정이 있었는데, 시스템에서 이 과정을 없애버렸다. 덕분에 업로드가 빨라졌다.




[서울특별시 ○○구_공장등록 현황.csv]
테이블명 : F1000○○9○○

<오류>
면적 컬럼값에 소수점이 두 번찍히는 오류가 있었다.





[○○귀가 일자별 ○○.csv]
테이블명 : F100019○○4

<오류>
일자 컬럼이 YYYY-MM-DD 형식을 따라야 하는데, 94건이 모두 ○○.○○.○○. 형식으로 기입되어있었다.
오류율 100%짜리 컬럼이었다.





[새○○○○청_새○○사업 매립 정보_20○○○○30.csv]
테이블명 : F1000○○○○4

[새○○○○청_새○○ 광역○○시설 설치정보_20○○○○10.csv]
테이블명 : F1000○○5○○

<기타>
컬럼 중에 [총소요시간]컬럼이 있는데, 이걸 문자열로 처리해야할지, 날짜데이터로 처리해야할 지 고민되어 매니저님에게 문의했다. '시간','분'이라는 값이 있기때문에 문자열로 보고 SQL진단제외항목으로 처리하라는 답변을 받았다.

728x90