Home Decision trees
Post
Cancel

Decision trees

Decision tree

  • 노드, 브랜치, 리프(잎)으로 구성
  • 가장 중요한 변수(특징)가 무엇인지 파악 가능
  • 쉽게 가시화 가능하다는 점이 장점이지만, 과적합에 취약하다는 단점을 가진다.

Random forest

  • Decision tree를 여러 개 묶은 것
  • output은 이러한 tree들의 평균으로, 분류를 할 때 투표 결과 많은 표를 받은 곳으로 분류된다.
  • 과적합에 덜 영향을 받고 고차원의 많은 데이터 셋을 다룰 있다는 장점이 있지만, 의사결정 과정을 명확하게 파악하기가 어렵다는 단점이 있다.