머신러닝/인프런

feature selection

stop0729 2021. 3. 28. 22:19

feature 값 분포, Null 제거, feature간 높은 상관도, 결정값과의 독립성(따로 논다)

 

모델의 피처 중요도(feature_importance) (지니계수,회귀계수) 기반

 

 

#RFE

feature_importance 가 낮은 피쳐들을 짤라내면서 성능을 평가

데이터가 많으면 시간이 오래 걸릴뿐더러, 정확한 feature selection을 찾는 목표에 부합하지 않을 수 있음

 

#selectFromModel

feature_importance 를 중앙값보다 아래거나 중앙값 * 0.9 보다 아래인것을 삭제

 

 

'머신러닝 > 인프런' 카테고리의 다른 글

라쏘 회귀  (0) 2021.05.15
회귀  (0) 2021.03.28
부스팅  (0) 2021.03.11
분류  (0) 2021.03.01
전처리  (0) 2021.02.28