728x90

이것저것/공공데이터 일경험 수련생(2021년) 65

2021년 12월 15일_업무일지

개방데이터 품질 진단 및 개선(파일) 한국○○재단 논문, 저역서 저자 정보.csv ○○도시공사 시설물 정보(20○○년 11월).csv 한국○○재단 검색엔진 매핑 테이블.csv ○○시의회_의원현황.csv 한국○○○○재단_A○○○○th_○○콘텐츠.csv ○○○북도 ○○시_가상계좌수납통계.csv ○○시_태양광발전소현황_20○○1025.csv ○○광역시_보건환경연구원_수질측정망_20○○1025.csv 1. 업무 [○○○북도 ○○시_가상계좌수납통계.csv] 테이블명: N2○○○○○2○7 데이터 건수 : 33 칼럼 수 : 11 입금건수, 입금금액 칼럼에 천단위 구분자를 사용한 오류가 각 33개씩 있어서 정비했다. [○○도시공사 시설물 정보(20○○년 11월).csv] 테이블명: N2○○○○○2○1 데이터 건수 : ..

2021년 12월 14일_업무일지

개방데이터 품질 진단 및 개선(파일) ○○광역시 ○○구_U-옥외광고물통합관리시스템_전수조사 대상 정보_20○○1018.csv ○○광역시_○○소방서 대형화재취약대상 현황_20○○1018.csv ○○광역시_공공청사 도로명주소 현황_최종(업로드용).csv ○○시시설관리공단_공영주차장 정기권 현황_20○○0930.csv 1. 업무 [○○시시설관리공단_공영주차장 정기권 현황_20○○0930.csv] 테이블명: N2○○○○○5○2 데이터 건수 : 2 칼럼 수 : 19 월정기권총수입 칼럼에 천단위 구분자를 사용한 오류가 있어서 정비했다.

2021년 12월 13일_업무일지

개방데이터 품질 진단 및 개선(파일) ○○○도 ○○군 음식물류 쓰레기 다량 배출사업장 현황.csv ○○광역시_○○구_세대 및 인구 현황_202○○109.csv ○○도시공사_빅데이터분석_영구임대아파트_입주자_○○여부_학습_과거이력_데이터(20○○년~20○○년).csv ○○광역시_○구_부동산 중개업소 현황_20○○1○09.csv 1. 업무 [○○광역시_○○구_세대 및 인구 현황_202○○109.csv] 테이블명: N2○○○○○5○7 데이터 건수 : 23 칼럼 수 : 10 세대수, 전체 인구수, 남자 인구수, 여자 인구수, 전월 인구수 칼럼에 수량 데이터 값에 천단위 구분자를 입력한 오류가 각 23건씩 있어서 정비했다. 오류 예시) 17,044 정비 예시) 17044

2021년 12월 10일_업무일지

개방데이터 품질 진단 및 개선(파일) 장애인 (19○○.01.01-19○○.12.31).csv 도로노선(R○○_ROUT_○○).csv 최저임금 (19○○.01.01-19○○.12.31).csv ○○_○○군_지방세납세자현황_20○○1231.csv ○○_○○군_지방세납부현황_20○○1231.csv ○○○연금공단_연금정지자수 추이.csv 1. 업무 [도로노선(R○○_ROUT_○○).csv] 테이블명: N2○○○○○5○3 데이터 건수 : 5,638 칼럼 수 : 150 노선지정일자, 지적고시일자, 로딩일자 칼럼에 날짜 데이터 값이 부정확하게 입력된 오류가 각 82,46,2건 있었다. 년월일은 'YYYY-MM-DD'형식을 따른다. 노선지정일자, 지적고시일자, 로딩일자 칼럼의 일자가 부정확하나 원본데이터의 정상값을 ..

2021년 12월 09일_업무일지

개방데이터 품질 진단 및 개선(파일) ○○도 ○○군_길고양이 중성화(TNR) 관리내역.csv ○○○도_휴양림_20○○1027_16○○31○○69○○8_○○89.csv TBI0○○_○○_상담_지식재산_사전_체크리스트_정보.csv 식물바이오정보(백두대간).csv ○○365열린도서관도서정보_202○○027.csv TBI0○○_○○상담신청정보 (2).csv 1. 업무 [○○도 ○○군_길고양이 중성화(TNR) 관리내역.csv] 테이블명: N2○○○○○7○5 데이터 건수 : 97 칼럼 수 : 13 포획일시, 중성화일시 칼럼에 시간값이 한자리로 표시되는 오류가 있었다. 년월일시분은 'YYYY-MM-DD HH24:MI'형식을 따른다. 그러나 포획일시, 중성화일시 칼럼의 시각이 한자리값으로 표시되는 오류가 있어서 정비했..

2021년 12월 08일_업무일지

개방데이터 품질 진단 및 개선(파일) 한국○○○○진흥원_통합사업관리_NT○○ 논문.csv ○○도_주유소 현황.csv ○○도_전기사업업체현황.csv 한국○○○○진흥원_통합사업관리_NT○○ 지식재산권.csv ○○광역시 ○구_카페현황.csv ○○시 숙박업.csv ○○광역시 ○구_식품위생업소현황.csv ○○도_인공어초 설치 좌표 현황.csv 1. 업무 오늘은 배정 받은 업무의 75%에 오류값이 있었다. 그동안 당일 배정 받은 업무 대비 오류값이 가장 많은 날이었다. 여는 파일의 대부분에서 오류가 나와 뭔가 잘못 설정한 줄 알았다. [○○도_인공어초 설치 좌표 현황.csv] 테이블명: N2○○○○○8○7 데이터 건수 : 900 칼럼 수 : 12 시설년도 칼럼에 연도값이 '0'으로 입력되는 오류가 1개 있었다. [..

2021년 12월 07일_업무일지

개방데이터 품질 진단 및 개선(파일) 한국○○○전(주)_대기○○물질 배출량 조회서비스_20○○.csv 한국○○○전(주)_신재생○○지 설비 정보_20○○.csv 목조주택표준설계도목록.csv 한국○○○전(주)_신재생○○지 건설 및 개발 정보_20○○0831.csv 1. 업무 오늘 배정받은 파일에는 오류가 한 건도 없었다.

2021년 12월 06일_업무일지

개방데이터 품질 진단 및 개선(파일) ○○표지판(R○L_T○○N_PS).csv 청소년수련관홈페이지 교육문화강좌 정보.csv ○○○도_○○시_온누리○○가맹점정보_20○○1○○5.csv 강도 및 절도 수법 관련_20○○1 ○○1.csv 1. 업무 오늘부터 SQL진단 업무에서 파일진단과 오픈API진단으로 업무가 랜덤배정된다. [○○표지판(R○L_T○○N_PS).csv] 테이블명: N2○○○○2○○8 데이터 건수 : 20,588 칼럼 수 : 20 로딩일자 칼럼은 날짜값으로 YYYY-MM-DD 형태를 따른다. 그러나 0000-00-00, 1900-00-00 등으로 입력된 오류값이 12개 있었다. ○○번호, ○○○○번호 칼럼은 각 12206 건, 6536건의 오류가 있었다. 오류값들에는 숫자 중간에 엑셀에서 숫자 ..

2021년 12월 03일_SQL 진단 업무일지

개방데이터 품질 진단 및 개선(SQL) ○○광역시립○○도서관_인기도서목록(201○년1분기) ○○광역시립○○도서관_인기도서목록(201○년2분기) ○○광역시립○○도서관_인기도서목록(201○년3분기) ○○광역시립○○도서관최신인기도서목록(201○년 2분기) ○○광역시립○○도서관최신인기도서목록(201○년 2분기) ○○광역시교육청 ○○광역시립○○도서관_인기도서목록_201○0102 1. 업무 오늘 배정 받은 업무에는 오류가 한 건도 없었다.

2021년 12월 02일_SQL 진단 업무일지

개방데이터 품질 진단 및 개선(SQL) ○○○도_사회조사통계표(공통항목_안전부문)_201○○231 ○○○도 ○○시_버스정류장 정보_202○○029 ○○○도 ○○시_20○○년 세입정보_202○○029 ○○○도 ○○시_20○○년 지출현황_202○○029 ○○○도_○○○도 육성품종 등록 현황_202○○331 ○○○도_지방소비세 징수 현황_202○○630 1. 업무 [○○○도 ○○시_20○○년 세입정보_202○○029] 테이블명: F1000○○8○4 전일누계A 를 포함한 5개 칼럼에 천단위 구분 쉼표가 표시 되어있다. 개방데이터 품질 진단 및 개선 가이드에 따르면, 숫자 값에 천단위 구분 쉼표를 표기하면 안된다. [○○○도 ○○시_20○○년 지출현황_202○○029] 테이블명: F1000○○8○5 지출액 칼럼에..

728x90