0%

动态规划是一种算法设计技术,是一种使多阶段决策过程最优的通用方法。

阅读全文 »

先放上一道题:

有 A 和 B 两路公交车,平均发车间隔分别为 5 分钟和 10 分钟。某乘客在站点 S 可以 任意选择两者之一乘坐,假定 A 和 B 到达 S 的时刻无法确定,那么该乘客的平均等待时间约为____。
A、1 分钟 20 秒 B、3 分钟 20 秒 C、2 分钟 30 秒 D、1 分钟 40 秒

阅读全文 »

经过2个多月的零零散散的刷题,终于搞定了剑指Offer中的67道面试题,这期间又经历了一场GE的数据分析岗简单面试,立刻体会到剑指offer的强大,除了里面的经典面试题之外,书中包含的软条件,面试套路,分析、回答问题的技巧也确确实实得好用。在刷完题之际,做一个简单的总结。这是我剑指offer的Java代码,供大家参考。

阅读全文 »

在接触数学建模以前,我一直认为“凡问题皆有其解”,并且必然存在一种最佳的解法,它是我们要寻找的,是我们认识这个问题的最好的选择。建模课上的思考以及亲身参与建模训练和竞赛的经历,改变了我的看法。原来一个问题可以有许多不同的解决办法。现实世界里许多问题往往不存在全局最优解,但可以有许多局部最优解,所谓“条条道路通罗马”;而且现实世界里全局最优解可能也没有多大意义,局部最优解给我们提供了极大的选择空间,并且易于实现。在数学的世界里,既有其精益求精的追求精神,也有它“知足常乐”的哲学原理。而从不同的角度审视问题,往往会带给我们意想不到的惊喜和发现,就好像万花筒,转动它,又一幅绚丽的画面诞生了。

阅读全文 »

构建并结合多个学习器来完成学习任务,我们把它称为模型融合或者集成学习。
不同的模型有各自的长处,具有差异性,而模型融合可以使得发挥出各个模型的优势,让这些相对较弱的模型(学习器)通过某种策略结合起来,达到比较强的模型(学习器)。

阅读全文 »

当我们拿到一批数据的时候,往往都是“不干净”的,而缺失值是最常见也是最容易发现的。不同的缺失值处理方式对接下来的特征提取,建模等都有巨大影响。那么缺失值的处理是有一套流程的,我在这里总结总结:

阅读全文 »

前言

做过数据竞赛的同学对XGBoost肯定不会陌生,它在各类竞赛中大放异彩。它比GBDT有着更快的运行速度以及更高的准确率。在许多Kaggle以及天池竞赛中,第一名的队伍都使用了XGBoost。它无论在分类还是回归问题上都有卓越的表现。
我们可能只会用XGBoost,但是对其内部实现确不清楚,为了能够更深入地了解算法细节,本人阅读了作者的论文XGBoost: A Scalable Tree Boosting System ,并参考其他资料,完成本文。

阅读全文 »

站在17年年底,回头看看这一年,猛地感觉就是时间过得太快太快。想做很多事,但好像又是什么都没做。在17年的尾巴上拼命追赶,希望能补回些什么。

阅读全文 »