이것저것/공공데이터 일경험 수련생(2021년)

2021년 10월 20일_SQL 진단 업무일지

Iam_im2 2021. 10. 20. 19:28
728x90

<배정업무>
개방데이터 품질 진단 및 개선(SQL)

<배정파일>
○○업계 지원(1989-20○○)
○○업계 지원 내역(1989-20○○)
한국○○○○㈜_○○○ 발전 실적_201○○○31
한국○○○○㈜_○○○ 발전 실적_현황_201○○2○1
한국○○○기술원_○○○산업 對 일본 수출 현황_201○○○31
한국○○○기술원_○○○산업 對 일본 무역수지_201○○2○1


등등







1. 업무
오늘은 평소 업무량의 두 배를 배정 받았다.
이게(ง ᵕᴗᵕ)ว 무슨 ٩(ˊᗜˋ*)و 일이죠 (ง ᵕᴗᵕ)ว매니저님٩(ˊᗜˋ*)و 

다행이다. 다른 수련생들도 오늘은 기존 업무량의 두 배를 받았다고 한다.



[○○업계 지원(1989-20○○)]
테이블명 : F1000○○○○8

<오류내역>
개방데이터 품질진단 가이드에의하면, 빈 값을 별도의 문자로 표기하지 않아야한다. 이 파일은 빈 값을 모두 '-'표시처리했기에 오류값으로 검출했다. 또한, 이 파일은 진단가이드와 행렬이 반대로 바뀐 데이터로 진단 제외파일에 해당한다. 진단 제외파일은 행렬이 바뀐 상태를 캡처하고, 캡처 이미지를 정비 파일란에 업로드 하면 된다.

 



[○○업계 지원 내역(1989-20○○)]
테이블명 : F1000○○○○9

<오류내역>
위와 같은 형식의 표기 오류다. 개방데이터 품질진단 가이드에의하면, 빈 값을 별도의 문자로 표기하지 않아야한다. 이 파일은 빈 값을 모두 '-'표시처리했기에 오류값으로 검출했다. 또한, 이 파일은 진단가이드와 행렬이 반대로 바뀐 데이터로 진단 제외파일에 해당한다.  진단 제외파일은 행렬이 바뀐 상태를 캡처하고, 캡처 이미지를 정비 파일란에 업로드 하면 된다.






[한국○○○○㈜_○○○ 발전 실적_현황_201○○2○1]
테이블명 : F1000○○○○9

<기타>
엑셀서식오류 파일이다. '○○명' 컬럼이 데이터입력값(20○○-01-14)과 표시값(14-Jan), 쿼리박스에서의 출력값(Jan-14)이 모두 다른 형태다. 기술매니저님에게 문의한 결과, 메모장에서 해당 파일을 확인하면 쿼리박스에서 출력되는 값과 동일하게 나오므로 쿼리박스에서 출력되는 값을 기준으로 품질진단을 하면 된다.

 




[한국○○○○㈜_○○○ 발전 실적_현황_201○○2○1]
테이블명 : F1000○○○○0

<기타>
엑셀서식오류 파일이다. '○○명' 컬럼이 데이터입력값(20○○-03-01)과 표시값(Mar-○○), 쿼리박스에서의 출력값(20○○-03)이 모두 다른 형태다. 기술매니저님에게 문의한 결과, 메모장에서 해당 파일을 확인하면 쿼리박스에서 출력되는 값과 동일하게 나오므로 쿼리박스에서 출력되는 값을 기준으로 품질진단을 하면 된다.

728x90