南山小马

动态规划

发表于 2018-03-28 更新于 2022-11-07 分类于算法 Disqus：

动态规划是一种算法设计技术，是一种使多阶段决策过程最优的通用方法。

从等公交概率问题引发的思考

发表于 2018-03-25 更新于 2022-11-07 分类于算法 Disqus：

先放上一道题：

有 A 和 B 两路公交车，平均发车间隔分别为 5 分钟和 10 分钟。某乘客在站点 S 可以任意选择两者之一乘坐，假定 A 和 B 到达 S 的时刻无法确定，那么该乘客的平均等待时间约为____。
A、1 分钟 20 秒 B、3 分钟 20 秒 C、2 分钟 30 秒 D、1 分钟 40 秒

阅读全文 »

排序算法总结

发表于 2018-03-08 更新于 2022-11-07 分类于算法 Disqus：

刷完了剑指Offer，回过头再看看数据结构与算法。

阅读全文 »

剑指Offer总结

发表于 2018-03-05 更新于 2020-01-02 分类于算法 Disqus：

经过2个多月的零零散散的刷题，终于搞定了剑指Offer中的67道面试题，这期间又经历了一场GE的数据分析岗简单面试，立刻体会到剑指offer的强大，除了里面的经典面试题之外，书中包含的软条件，面试套路，分析、回答问题的技巧也确确实实得好用。在刷完题之际，做一个简单的总结。这是我剑指offer的Java代码，供大家参考。

阅读全文 »

数学建模比赛心得

发表于 2018-02-14 更新于 2020-01-02 分类于生活记录 Disqus：

在接触数学建模以前，我一直认为“凡问题皆有其解”，并且必然存在一种最佳的解法，它是我们要寻找的，是我们认识这个问题的最好的选择。建模课上的思考以及亲身参与建模训练和竞赛的经历，改变了我的看法。原来一个问题可以有许多不同的解决办法。现实世界里许多问题往往不存在全局最优解，但可以有许多局部最优解，所谓“条条道路通罗马”；而且现实世界里全局最优解可能也没有多大意义，局部最优解给我们提供了极大的选择空间，并且易于实现。在数学的世界里，既有其精益求精的追求精神，也有它“知足常乐”的哲学原理。而从不同的角度审视问题，往往会带给我们意想不到的惊喜和发现，就好像万花筒，转动它，又一幅绚丽的画面诞生了。

阅读全文 »

模型融合 Blending 和 Stacking

发表于 2018-02-11 更新于 2022-11-07 分类于算法 Disqus：

构建并结合多个学习器来完成学习任务，我们把它称为模型融合或者集成学习。
不同的模型有各自的长处，具有差异性，而模型融合可以使得发挥出各个模型的优势，让这些相对较弱的模型（学习器）通过某种策略结合起来，达到比较强的模型（学习器）。

阅读全文 »

缺失值处理

发表于 2018-01-22 更新于 2022-11-07 分类于算法 Disqus：

当我们拿到一批数据的时候，往往都是“不干净”的，而缺失值是最常见也是最容易发现的。不同的缺失值处理方式对接下来的特征提取，建模等都有巨大影响。那么缺失值的处理是有一套流程的，我在这里总结总结：

阅读全文 »

XGBoost笔记

发表于 2018-01-09 更新于 2022-11-07 分类于算法 Disqus：

前言

做过数据竞赛的同学对XGBoost肯定不会陌生，它在各类竞赛中大放异彩。它比GBDT有着更快的运行速度以及更高的准确率。在许多Kaggle以及天池竞赛中，第一名的队伍都使用了XGBoost。它无论在分类还是回归问题上都有卓越的表现。
我们可能只会用XGBoost，但是对其内部实现确不清楚，为了能够更深入地了解算法细节，本人阅读了作者的论文XGBoost: A Scalable Tree Boosting System ，并参考其他资料，完成本文。

阅读全文 »

我的2017

发表于 2017-12-29 更新于 2022-11-07 分类于生活记录 Disqus：

站在17年年底，回头看看这一年，猛地感觉就是时间过得太快太快。想做很多事，但好像又是什么都没做。在17年的尾巴上拼命追赶，希望能补回些什么。

阅读全文 »

决策树笔记

发表于 2017-12-28 更新于 2020-01-02 分类于算法 Disqus：

特征选择

准则

信息增益或信息增益比

阅读全文 »