이것저것/공공데이터 일경험 수련생(2021년)

2021년 10월 14일_개방데이터 파일 SQL진단 업무일지

Iam_im2 2021. 10. 14. 19:35
728x90

<배정업무>
개방데이터 품질 진단 및 개선(SQL)

<배정파일>
○○청_채용공고_20○○10○○
○○청_메타항목_202○○026
201○년 범죄의 발생 검거상황(○○도지방경찰청)
201○년 범죄의 발생 검거상황(○○○도지방경찰청)

등등




오늘도 구글링으로 SQL 구문을 적어가며 배웠다. 구글링하면 정말 좋은 참고자료가 많이나온다.
가이드대로 하면 참 편하겠지만, 가이드대로만하면 공공데이터 일경험수련생 업무를 하면서 얻는게 없을 것 같아 이것 저것 넣어가면서 SQL구문을 만들어보고 있다.
쿼리박스에서 SQL구문 오류가 나오면 너무 슬프다.

???대체 뭐가 틀린거지?!?





201○년 범죄의 발생 검거상황(○○○도지방경찰청)
테이블명 : F10000○○○2
데이터건수 : 186건
컬럼 수 : 5개


<오류내역>
○○건수, ○○건수, ○○인원 남, ○○인원 여에 오류건수가 41~85개 있었다.
모두 항목의 빈 값을 표현한 오류였다. 개방데이터 품질 진단 및 개선 가이드에서는 빈 값은 별도의 문자로 표기하지 않아야한다. „ 또는, “”, 로 표기하는게 맞다. 그러나 이 파일은 빈 값에 모두 "-" 표시를 해놨다.






[201○년 범죄의 발생 검거상황(○○도지방경찰청)
테이블명 : F10000○○○1
데이터건수 : 182건
컬럼 수 : 5개

<오류내역>
위의 오류와 같은 유형의 오류다. ○○건수, ○○건수, ○○인원 남, ○○인원 여에 오류건수가 27~60개 있었다.
모두 항목의 빈 값을 표현한 오류였다. 개방데이터 품질 진단 및 개선 가이드에서는 빈 값은 별도의 문자로 표기하지 않아야한다. „ 또는, “”, 로 표기하는게 맞다. 그러나 이 파일은 빈 값에 모두 "-" 표시를 해놨다.








[○○청_채용공고_20○○10○○]
테이블명 : F10000○○○4
데이터건수 : 3583건
컬럼 수 : 21개


<오류내역1>
공고종료일자 컬럼은 YYYY-MM-DD 데이터 유형을 따라야하는데, 1개 값이 9999-12-31 이 있었다. 유효하지 않은 값이므로 오류다.


<오류내역2>
공고게시일자 컬럼은 YYYY-MM-DD HH:MM 형식이어야한다. 오류값은 YYY-MM-DD H:MM 형식이라서 걸러졌다. 오류값은 총 11개가 검출됐다.


728x90