Skip to content

Latest commit

 

History

History
123 lines (101 loc) · 7.4 KB

README.md

File metadata and controls

123 lines (101 loc) · 7.4 KB

서울 정보소통광장 행정정보 공개

서울시는 결재문서, 정책연구보고서 등 시가 생산한 약 500만 건 이상의 주요 행정정보 목록을 깃허브에 공개합니다. 이를 통하여 서울시 공공데이터에 대한 접근성과 활용성을 높일 수 있을 것으로 기대합니다. 서울시 행정정보 데이터는 누구나 자유롭게 이용하실 수 있습니다.

원본 데이터 : 서울정보소통광장(opengov.seoul.go.kr)

서비스 소개 : 정보소통광장 안내 바로가기

문의 : jasong@seoul.go.kr , reinless@seoul.go.kr

  • 데이터 크롤링시 유의사항

  • 데이터 공개 후 일부 사용자가 웹 사이트 수집 프로그램을 과도하게 사용하여 문서를 수집하는 관계로, 서비스에 지장을 주는 경우가 확인되고 있습니다.

  • 다수 시민에게 안정적 서비스를 제공하기 위하여 서버에 과도한 부하를 유발하는 사용자는 부득이하게 네트워크단에서 차단이 될 수 있으므로 아래 권고사항을 지켜주시기 바랍니다.

  • 권고 사항 : 웹 사이트 수집 프로그램을 사용하여 정보소통광장 문서를 조회하는 경우, 한 페이지 수집 후 다음 페이지를 요청하기까지 10초 이상의 간격을 두시기 바랍니다. (Crawl-delay:20)

  • 벌크데이터 요청

  • 대량 벌크데이터가 필요하실 경우, 서울시 정보소통광장 담당자에게 연락주시기 바랍니다. (별도 전달)

  • 문의(서울시 정보소통광장 담당) : jasong@seoul.go.kr , reinless@seoul.go.kr

정보공개 대상

  • 결재문서

  • 서울시가 생산한 모든 결재문서와 원문 공개 대상을 함께 제공 * 원본 데이터 - 결재문서 원문 : 과장급 이상 결재문서는 원문 공개를 제공 * 원본 데이터 - 정보목록 : 서울시에서 생산한 모든 문서(팀장 결재, 1인 결재 등)의 목록 제공

  • 대상 기관 : 서울시 본청(사업소 포함)

  • 공개 범위 : 2015년 1월 ~ 2016년 5월 현재(약 500만 건)

  • 생성 주기 : 매주 업데이트 , 매주 월요일 등록(전주,월~일까지)

  • 초기 데이터 * 2015.1월~2016년 4월, 월별 데이터생성 : 20150301_20150331_info_list.csv * 깃허브의 파일크기 제약으로 인해 데이터파일이 분할되어 작성될 수도 있음 * 2016.5월 이후, 주별 데이터 생성 : 20160509_20150515_info_list.csv

  • 정책연구보고서

  • 12개 기관(서울시 및 산하 투자출연기관 등)의 정책보고서와 연구보고서 공개 * 원본 데이터 - 정책연구자료

  • 대상 기관 : 서울시(학술용역, 기술용역), SH도시연구원, 보건환경연구원, 서울디자인 재단, 서울물연구원, 서울시복지재단, 서울시립대 서울학연구소, 서울시여성가족재단, 서울연구원, 서울특별시의회, 한성백제박물관

  • 공개 범위 : 정보소통광장 서비스 대상 전체

  • 생성 주기 : 매월 업데이트 , 매월 첫 업무일 등록 (전월, 휴일이 지난 첫 업무일)

  • 초기 데이터 * ~2016년 4월 , 일괄 데이터생성( 약17.268건) : 20150101_20160430_research_list(util 2016.04).csv (해당 데이터들의 최초 생산일 확인 필요) * 2016년 5월 이후 월별 생성(최초 신규 생성 일자:2016년6월 1일 생성)

  • 사전정보공표

  • 시민이 정보공개를 청구하기 전에 미리 공개하는 행정정보 서비스로, 약 327종 513개 업무에 대한 정보를 공개하고 있음 * 원본 데이터 - 사전정보공표 * 공표 항목 : 공표항목 전체 모음

  • 제공 범위 : 복지, 건강 등 12개 분야, 513개 공표업무

  • 공개 범위 : 정보소통광장 서비스 대상 전체

  • 생성 주기 : 매월 업데이트 , 매월 첫 업무일 등록 (전월, 휴일이 지난 첫 업무일)

  • 초기 데이터 * ~2016년 4월, 일괄 데이터생성( 약6,355건) : 20150101_20160430_public_list.csv * 2016년 5월 이후 월별 생성(최초 신규 생성 일자:2016년 6월 1일 생성)

데이터 이용 안내

디렉토리명

  • 구성 : /분야명+'_'+종류
  • 예시
    • 결재문서 : info_list
    • 사전정보공표목록 : public_list
    • 정책연구자료목록 : research_list

파일명 및 유형

  • 구성 : 기준연월일(from)+'_'+기준연월일(to)+'_'+분야명+종류+'_'+(필요시설명)+'.'+확장자
  • 예시
    • 결재문서 : 20150301_20150331_info_list.csv
    • 사전정보공표목록 : 20150301_20150331_public_list.xml
    • 정책연구자료목록 : 20150301_20150331_research_list.xlsx
  • 파일 유형별 특이사항
    • *.csv : UTF-8로 인코딩 되어 있어, 엑셀 활용시 데이터 > 외부 데이터 가져오기 > 텍스트로 불러와야 한글이 정상적으로 표출됨. (엑셀의 한계)
    • *.json : 문자는 인코딩 되어 있어, 변환(decode)하여 사용해야 함.

분야별 항목설명 (별도 표시 없는 경우 NOT NULL항목)

  • 결재문서

    • package_id : 문서관리번호(PK)
    • doc_prdctn_dt : 자료생산일자
    • trck_card_nm : 단위과제카드명
    • title : 제목
    • src_dept_doc_id : 문서번호 (예: 정보공개정책과-1234)
    • writer : 담당자
    • othnd_pd : 문서보존기간(1년, 3년, 5년, 10년, 30년, 준영구, 영구)
    • dept_nm : 부서명
    • othbs_se : 공개구분코드(공개,부분공개,비공개)
    • cpyrht : 라이선스(CCL 적용, CC BY, CC BY-ND, CC BY-SA, CC BY-NC, CC BY-NC-SA, CC BY-NC-ND ), nullable
    • url : 원문공개URL, nullable
    • 주의사항 :cpyrht,url은 원문공개중인 경우만 해당 정보가 존재함.
  • 사전정보공표목록

    • nid : 관리번호(PK)
    • category : 분야
    • title : 제목
    • writer : 담당자
    • dept_nm : 부서명
    • regist_dt : 등록일시(정보소통광장 등록일시)
    • taxonomy : 업무상세분류(1단계~4단계)
    • telno : 전화번호, nullable
    • cpyrht : 라이선스(CCL 적용, CC BY, CC BY-ND, CC BY-SA, CC BY-NC, CC BY-NC-SA, CC BY-NC-ND )
    • url : url
  • 정책연구자료목록

    • nid : 관리번호(PK)
    • title : 제목
    • regist_dt : 등록일시
    • relm_cl : 자료유형(정책연구자료,논문,간행물,세미나)
    • creat_yr : 생산년도
    • category : 분야(복지, 여성가족, 경제, 안전, 주택도시계획, 환경, 문화관광, 건강, 교통, 건설, 세금재정, 행정)
    • region : 관련지역(서울시 전체, 서울 25개 자치구, 수도권, 전국, 해외)
    • isbn : ISBN, nullable
    • relte_area : 원본시스템명
    • writer : 담당자
    • doc_prdctn_dt : 자료생산일자
    • cpyrht : 라이선스(CCL 적용, CC BY, CC BY-ND, CC BY-SA, CC BY-NC, CC BY-NC-SA, CC BY-NC-ND )
    • othbs_se : 공개구분
    • job_se : 작업구분(I,U,D)
    • url : url