다차원 데이터의 시각화
이 글은 Dipanjan (DJ) Sarkar(2018)의 “Effective Visualization of Multi-Dimensional Data”를 참고하여 작성하였으며, python 코드로 되어 있는 것을 R 코드로 변환하였다.
분석에 사용하고자 하는 데이터는 UCI Machine Learning Repository에서 제공하는 Wine Quality Data Set이다.
와인 품질 데이터는 2개의 파일 즉 레드 와인과 화이트 와인 데이터로 구성있다.
레드와인 파일에는 1,599개의 관측값이,
화이트와인 파일에는 4,898개의 관측값이 들어있다.
두 개 파일 모두 11개의 화학성분 변수와 1개의 품질 변수로 구성되어 있다.