EDA

서울시 범죄 현황

R
서울시는 25개의 자치구로 구성되어 있다. 서울시 5대 주요 범죄 발생 및 검거 데이터를 이용하여 각 자치구의 범죄현황에 대해 탐색하고자 한다. 분석에 사용한 데이터는 다음과 같다. 서울시 관서별 5대 범죄 발생 검거 현황 데이터(2017년 기준) 출처 : 공공데이터포털의 서울특별시 관서별 5대범죄 발생 검거현황(2000~2017) 정리된 데이터 다운로드 : seoul_crime_2000_2017.csv 경찰관서 주소 데이터 출처 : 경찰청의 전국경찰관서안내 정리된 데이터 다운로드 : police_address.csv 서울시 CCTV 현황 데이터(2017년 기준) CCTV 데이터 출처 : 서울열린데이터광장의 서울시 자치구 년도별 CCTV 설치 현황 - 2019.

다차원 데이터의 시각화

R
이 글은 Dipanjan (DJ) Sarkar(2018)의 “Effective Visualization of Multi-Dimensional Data”를 참고하여 작성하였으며, python 코드로 되어 있는 것을 R 코드로 변환하였다. 분석에 사용하고자 하는 데이터는 UCI Machine Learning Repository에서 제공하는 Wine Quality Data Set이다. 와인 품질 데이터는 2개의 파일 즉 레드 와인과 화이트 와인 데이터로 구성있다. 레드와인 파일에는 1,599개의 관측값이, 화이트와인 파일에는 4,898개의 관측값이 들어있다. 두 개 파일 모두 11개의 화학성분 변수와 1개의 품질 변수로 구성되어 있다.

서울시 자치구의 CCTV 현황

R
서울시 25개 자치구의 CCTV 현황에 대해 탐색하고자 합니다. 분석에 사용한 데이터는 다음과 같습니다. 서울시 CCTV 현황 데이터(2017년 기준) CCTV 데이터 출처 : 서울열린데이터광장의 서울시 자치구 년도별 CCTV 설치 현황 - 2019.06.26 데이터 참조 정리된 데이터 다운로드 : seoul_cctv_b2011_2018.csv 서울시 인구 데이터(2017년 기준) 인구 데이터 출처 : 서울열린데이터광장의 서울시 주민등록인구 (구별) 통계 정리된 데이터 다운로드 : seoul_pop_1992_2018.csv 패키지 준비 library(tidyverse) ## Warning: 패키지 'readr'는 R 버전 4.