xgboost Posted on 2017-12-11 | In Toolkit 在文章GBDT中介绍了 Gradient、Booster、Gradient Booster 等一些基本理论推导,和一种Tree boosting算法-GBDT算法。 sklearn 也提供了 GBDT 的实现,我们可以方便的使用。 但是在生产环境中我们通常使用的是 Xgboost 的Tree boo ...
GBDT Posted on 2017-11-10 | In Model GBDT(Gradient Boosting Decision Tree) 又叫 MART(Multiple Additive Regression Tree),是一种迭代的决策树算法,该算法由多棵决策树组成,所有树的结论累加起来做最终答案。它在被提出之初就和SVM一起被认为是泛化能力(genera ...
从二项式分布到多项式分布 Posted on 2017-05-13 | In Mathematics 对于参数估计,存在两个学派的不同解决方案。一是频率学派解决方案:通过某些优化准则(比如似然函数)来选择特定参数值;二是贝叶斯学派解决方案:假定参数服从一个先验分布,通过观测到的数据,使用贝叶斯理论计算对应的后验分布。 本文从以参数估计为目标出发,从二项式分布讲述到多项式分布,为使用贝叶斯推断进行参数 ...
【转】泊松分布和指数分布 Posted on 2017-05-13 | In Mathematics 泊松分布和指数分布 的实际物理意义经常忘掉, 正好看到 阮一峰 的篇好文, 转载备查. 泊松分布和指数分布就是描述某一时间在一定的时间内时间发生的概率。 泊松分布的参数为 时间t、频率$\lambda$、次数n:描述单位时间平均发生$\lambda$次的现象在时间t内发生n次的概率。 指数分布的参 ...