https://www.kaggle.com/dgawlik/house-prices-eda/notebook

 

House Prices EDA

Explore and run machine learning code with Kaggle Notebooks | Using data from House Prices - Advanced Regression Techniques

www.kaggle.com

 

  • Ally (건물 접근 유형)
    • 평균이 FV 가 젤 높다. / 젤 작은 값과 젤 큰 값의 차이가 큼
    • 그렇지만 RL의 가격 분포가 넓다.
  • lotShape 
    • 건물 모양이 작을 수록 가격이 낮음
    • Pave - 분포가 넓고, 가격 차이가 많이 남
  • LandContour (건물의 평탄함 정도)
    • pave가 평균이 젤 높다. 
    • 그렇지만 missing이 더 많고 가격 분포도 넓다.
  • utilities (유틸리티 유형)
    • IR2가 평균이 젤 높음
  • LotConfig (로트 구성)
    • HLS가 평균이 제일 높다
    • HLS가 젤 큰 값과 작은 값의 차이가 많이 난다 -> 평균에 영향있음
    • LV1의 이상치가 많다. 
  • LandSlope (건물의 경사)
    • NoSeWa : 가격이 한개인가봐
    • AlllPub : 이상치 많음, 평균이 낮음
  • Exterior1st
    • Shed 가 평균이 젤 높고, 넓게 안 퍼짐
  • Exterior2st  (집 외부 덮는것)
    • WdShngl 이 평균이 제일 높다.
    • 낮은 가격에서도 가격 변동이 크다. 
  • MasVnrType  (돌쌓기 공사 veneer유형)
    • CemntBd :  높은 가격중에서도 가격 변동이 큼
    • Stone , ImStucc: 평균이 젤 높음
  • ExterQual (외부 재료 품질)
    • CmentBd 가 젤 평균 가격이 높음 
      • 그렇지만, 높은 가격 중에서도 가격 폭이 넓음
    • AsbShng이 젤 평균 가격 낮음
  • BsmtFinType이 Gd가 높음
  • GarageFinish, MiscFeature 는 Ex가 높음

 

 

'study > Kaggle' 카테고리의 다른 글

[House Prices] 정규화된 선형 회귀 모델  (0) 2021.12.28
[House Prices] 데이터 필드 분석  (0) 2021.12.27

+ Recent posts