시각화

다차원 데이터의 시각화

R
이 글은 Dipanjan (DJ) Sarkar(2018)의 “Effective Visualization of Multi-Dimensional Data”를 참고하여 작성하였으며, python 코드로 되어 있는 것을 R 코드로 변환하였다. 분석에 사용하고자 하는 데이터는 UCI Machine Learning Repository에서 제공하는 Wine Quality Data Set이다. 와인 품질 데이터는 2개의 파일 즉 레드 와인과 화이트 와인 데이터로 구성있다. 레드와인 파일에는 1,599개의 관측값이, 화이트와인 파일에는 4,898개의 관측값이 들어있다. 두 개 파일 모두 11개의 화학성분 변수와 1개의 품질 변수로 구성되어 있다.