R

서울시 자치구의 CCTV 현황

R
서울시 25개 자치구의 CCTV 현황에 대해 탐색하고자 합니다. 분석에 사용한 데이터는 다음과 같습니다. 서울시 CCTV 현황 데이터(2017년 기준) CCTV 데이터 출처 : 서울열린데이터광장의 서울시 자치구 년도별 CCTV 설치 현황 - 2019.06.26 데이터 참조 정리된 데이터 다운로드 : seoul_cctv_b2011_2018.csv 서울시 인구 데이터(2017년 기준) 인구 데이터 출처 : 서울열린데이터광장의 서울시 주민등록인구 (구별) 통계 정리된 데이터 다운로드 : seoul_pop_1992_2018.csv 패키지 준비 library(tidyverse) ## Warning: 패키지 'readr'는 R 버전 4.

purrr를 이용하여 Excel 시트들을 읽고 쓰기

R
준비 작업에 필요한 중요 packages는 purrr, readxl, writexl 이다. tidyvere에는 purrr를 포함하여 dplyr 등과 같이 많이 사용되는 패키지들이 포함되어 있기 때문에 tidyvers를 불러온다. library(tidyverse) library(readxl) library(writexl) Excel 파일에 다중 시트 동시에 쓰기 예제로 Rdp 기본으로 포함되어 있는 iris 데이터를 이용하고자 한다. iris %>% head() ## Sepal.Length Sepal.Width Petal.Length Petal.Width Species ## 1 5.1 3.5 1.4 0.2 setosa ## 2 4.9 3.0 1.4 0.2 setosa ## 3 4.7 3.

의사결정나무(Decision Tree) 개요

R
1.1 의사결정나무 개념 의사결정나무는 나무 형태로 의사결정 규칙을 표현하는 방식으로 데이터를 분류(classification)하거나 예측(prediction)하는 분석기법이다. 나무(tree) 구조로 모형이 표현되기 때문에 해석이 용이하고 나무 구조로부터 어떤 입력변수가 목표변수를 설명하기 위하여 더 중요한지를 쉽게 파악할 수 있다. (최종후, 서두성 (1999), 데이터마이닝 의사결정나무의 응용, 통계분석연구 제4권 제1호, p.62; 최종후 외 (2000), Answer Tree를 이용한 데이터마이닝 의사결정나무분석, SPSS 아카데미; 오올임, 김구 (2002), 불확실성 상황에서의 의사결정 양상에 관한 실증적 연구, 한국행정학보, 36-3, p.82에서 재인용)