Random Forest
簡介
Random Forest是一個可以用在classification和regression上的方法。它改進了Decision tree常會對training set overfit的缺點。
數學理論
Decision Tree
Decision tree依照feature的重要性將資料做分類,然後assign每個leaf node一個class。因此此方法可以不受資料scaling、translating的影響。然而,Decision tree是一個容易overfit的方法。當tree的深度過深的時候,雖然能在training set上得到不錯的結果,但是在testing set上有可能有很大的誤差。
