<배정업무>
개방데이터 품질 진단 및 개선(SQL)
<배정파일>
새○○○○청_새○○사업 매립 정보_20○○○○30.csv
새○○○○청_새○○ 광역○○시설 설치정보_20○○○○10.csv
서울특별시 ○○구_공장등록 현황.csv
○○귀가 일자별 ○○.csv
서울특별시_○○구_길관광정보_20○○○○19.csv
서울특별시_○○구_길관광정보_20○○○○08_15○○○○93○○○○7_2392.csv
등등
1. 업무
어제부터 진척도관리시스템이 파일제출이 정상작동한다. 대략 일주일만에 진단결과보고서를 제대로 된 칸에 제출하고 있다. 보고서란에 진단결과보고서를 업로드하면 진척도 관리시스템에서 오류율을 검사하는 과정이 있었는데, 시스템에서 이 과정을 없애버렸다. 덕분에 업로드가 빨라졌다.
[서울특별시 ○○구_공장등록 현황.csv]
테이블명 : F1000○○9○○
<오류>
면적 컬럼값에 소수점이 두 번찍히는 오류가 있었다.
[○○귀가 일자별 ○○.csv]
테이블명 : F100019○○4
<오류>
일자 컬럼이 YYYY-MM-DD 형식을 따라야 하는데, 94건이 모두 ○○.○○.○○. 형식으로 기입되어있었다.
오류율 100%짜리 컬럼이었다.
[새○○○○청_새○○사업 매립 정보_20○○○○30.csv]
테이블명 : F1000○○○○4
[새○○○○청_새○○ 광역○○시설 설치정보_20○○○○10.csv]
테이블명 : F1000○○5○○
<기타>
컬럼 중에 [총소요시간]컬럼이 있는데, 이걸 문자열로 처리해야할지, 날짜데이터로 처리해야할 지 고민되어 매니저님에게 문의했다. '시간','분'이라는 값이 있기때문에 문자열로 보고 SQL진단제외항목으로 처리하라는 답변을 받았다.
'이것저것 > 공공데이터 일경험 수련생(2021년)' 카테고리의 다른 글
2021년 11월 01일_업무일지 (0) | 2021.11.01 |
---|---|
2021년 10월 29일_SQL 진단 업무일지 (0) | 2021.10.29 |
2021년 10월 27일_SQL 진단 업무일지 (0) | 2021.10.27 |
2021년 10월 26일_SQL 진단 업무일지 (0) | 2021.10.26 |
2021년 10월 25일_SQL 진단 업무일지 (0) | 2021.10.25 |