ABOUT ME

-

Today
-
Yesterday
-
Total
-
  • [데이터정보처리입문]3강 요약
    NOTE 2020. 6. 3. 23:45

    통계정보와 지리정보 시스템(GIS)가 결합해 유용한 통계정보 제공

    통계정보, 데이터 분석 등에 유용한 웹사이트

    1) 국가통계 정보

    통계청(kostat.go.kr)이 총괄 관리

    KOSIS, 통계지리정보, e-나라지표, 마이크로 데이터 서비스 등이 연결돼 있음

    (1) KOSIS 국가통계포털

    주요 국내외 통계를 월/분기/연도별로 분류 20개 분야 이상의 자료

    주료 기능

    • 통계자료의 목록, 작성기관, 수록기관, 소재정보 파악
    • 원하는 항목 통계자료 검색
    • 여러 항목 간 통계자료 비교 검색
    • 원하는 항목 자기 시계열자료 검색
    • 항목의 통계자료를 크기 순으로 배열
    • 통계자료를 시각적 그래프로 표현
    • 자료받기

    (2) e-나라 지표: 국가 주요 지표

    국정 전문 분야에 대한 각종 국정 통계

    예) 소비자 물가 지수

    (3) 마이크로 데이터 서비스

    사용자가 직접 자료를 가공해 처리할 수 있게 조사 자료를 제공하는 서비스

    교육용 데이터도 제공

    (4) 통계지리정보 서비스

    국가통계자료를 지도 위에서 쉽게 이용

    통계 내비게이터, 지도로 보는 행정구역통계, 통계지도 시계열 서비스

    예) 행정구역별 주민등록 세대수

    (5) 한국은행 경제통계시스템

    국민 소득 등의 경제 통계를 시계열로 제공

    2)데이터 제공 사이트

    (1) StRD

    NIST에서 제공, 분산분석, 회귀, 기술통계 관련 자료

    *선형회귀: 두 연속 변수 X, Y가 있을 때 반응변수 Y와 설명변수 X의 모형관계를 밝히는 방법

    (2) DASL

    카네기 멜론 통계학과

    (3) 한국사회과학데이터센터

    정부, 공공기관, 연구소, 민간 단체 등의 기관에서 제공하는 방대한 분량의 통계 및 여론 조사자료

    미국 최대 사회과학 데이터 보관소인 ICPSR 등 외국 조사기관 자료 사이트와 연계

    (4) FEDSTATS

    미국 정부부처에서 생산하는 각종 통계자료 (지역별, 주제별)

    연속형 자료의 정리

    기술통계량 (자료의 중심위치, 산포도 등의 측도를 이용)

    (1) 중심위치의 측도 (평균, 중앙값, 최빈값)

    표본평균(mean)

    '엑스 바' = 자료값의 합/자료 수

    특이값의 영향을 많이 받음

    중앙값(median)

    홀수: (n+1)/2 번째 값

    짝수: n/2번째와 (n/2+1)번째 값의 평균

    특이값이 있는 경우 평균보다 중심위치 측도로 더 자주 쓰임

    최빈값(mode)

    이산형 자료일 경우 도수분포표만 살피면 쉽게 구할 수 있지만 연속형 자료일 경우 최빈값으로 정하는 것은 불합리 → 계급 구간으로 나누어 가장 도수가 높은 계급의 중간값을 최빈값으로 정하기도 함.

    그래프(히스토그램, 상자그림, 줄기-잎그림, 점도표)

    'NOTE' 카테고리의 다른 글

    김버그 개발자의 조언  (0) 2020.07.02
    [데이터정보처리입문]2강 요약  (0) 2020.06.02
    [데이터정보처리입문]1강 요약  (0) 2020.06.01
    절대 경로와 상대 경로  (0) 2020.06.01
Designed by Tistory.