Random Forest

簡介

Random Forest是一個可以用在classification和regression上的方法。它改進了Decision tree常會對training set overfit的缺點。

數學理論

Decision Tree

Decision tree依照feature的重要性將資料做分類,然後assign每個leaf node一個class。因此此方法可以不受資料scaling、translating的影響。然而,Decision tree是一個容易overfit的方法。當tree的深度過深的時候,雖然能在training set上得到不錯的結果,但是在testing set上有可能有很大的誤差。

Tree Bagging

參考資料

results matching ""

    No results matching ""