Math – 编码无悔 / Intent & Focused

[原创] 推荐一款编写数学公式的国产神器：AxMath，可与LATEX双向转换

2020 年 10 月 25 日作者 learnhard

latex

我一直都很佩服那些可以直接用LATEX语法打出各种复杂数学公式的人，反正我是记不住，而且也真的不想去记LATEX语法。
比如这个公式：
cauchy's inequality

有的人能直接用LATEX手写出来：
\left( \sum_{i=1}^n{a_ib_i} \right) ^2\leqslant \left( \sum_{i=1}^n{a_{i}^{2}} \right) \left( \sum_{i=1}^n{b_{i}^{2}} \right) , a_i,b_i\in \mathbb{R}
这还算简单的了，更复杂的公式大神们都可以直接手写LATEX。
就问你服不服。
在下自愧脑容量不足。
所以当我要输入数学公式的时候，MathType这个功能强大的可视化数学公式编辑器就是我认为最方便易用的软件。

[原创] 重要性采样／Importance Sampling

2020 年 04 月 28 日2019 年 07 月 11 日作者 learnhard

查看本系列文章合集，请点击这里。

在前面的文章中，我们看到，随机采样是一个蒙特卡罗方法中很关键的步骤。而采样是需要技巧的，单纯地增加采样次数太没有效率了，比如说，如果随机采样一亿次，你可以把结果计算得特别精确，但是采样一亿次需要的时间非常长，长得远远超过了我们能接受的范围，这又有什么意义呢？
人们发现，有一些方法可以让随机采的样本“特别好”。那么什么算“特别好”呢？比如说，本来使用没有任何原则的采样方法，需要采样1万个点，才能让计算出来的结果很接近真实值；现在使用一个“特别好”的采样方法，可以让我们只需要采样100个点，就可以让计算出来的结果很接近真实值了，这样就极大地减少了计算量。

[原创] 蒙特卡罗算法对比拉斯维加斯算法

2020 年 04 月 28 日2019 年 07 月 11 日作者 learnhard

查看本系列文章合集，请点击这里。

区别

讲到这里，稍微提一下，随机算法可以分为两类：蒙特卡洛算法 & 拉斯维加斯算法。
对蒙特卡洛算法来说，采样越多，越近似最优解。
对拉斯维加斯算法来说，它永远给出正确解的随机化算法，总是给出正确结果，或是返回失败。

[原创] 蒙特卡罗方法的实例2：计算定积分

2020 年 04 月 28 日2019 年 07 月 11 日作者 learnhard

查看本系列文章合集，请点击这里。

为了对蒙特卡罗方法有一个直观的印象，本文再举一个实例（计算定积分），以说明蒙特卡罗方法的用途。

什么是定积分

对于一个给定的正实值函数 $f(x)$ ，它在一个实数区间 [a,b]上的定积分 $\int_a^b {f(x)dx}$ 可以理解为在 OXY 坐标平面上，由曲线 (x,f(x))、直线 x=a,x=b以及x轴围成的曲边梯形的面积值。

[原创] 蒙特卡罗方法的定义、历史以及存在意义

2020 年 04 月 28 日2019 年 07 月 11 日作者 learnhard

查看本系列文章合集，请点击这里。

定义

来自维基百科：

蒙特卡罗（洛）方法（Monte Carlo method），也称统计模拟方法，是1940年代中期由于科学技术的发展和电子计算机的发明，而提出的一种以概率统计理论为指导的数值计算方法。是指使用随机数来解决很多计算问题的方法。

也就是说，蒙特卡罗方法并不是指一种特定的算法，而是一类算法的总称，这种算法主要利用了“随机”来实现。

[原创] 用人话解释蒙特卡罗方法/Monte Carlo method(文章合集)

2020 年 04 月 28 日2019 年 07 月 11 日作者 learnhard

蒙特卡罗(洛)方法（Monte Carlo method），也称统计模拟方法，是1940年代中期由于科学技术的发展和电子计算机的发明，而提出的一种以概率统计理论为指导的数值计算方法。是指使用随机数来解决很多计算问题的方法。

[原创] 蒙特卡罗方法的实例1：计算圆周率

2020 年 04 月 28 日2017 年 11 月 23 日作者 learnhard

查看本系列文章合集，请点击这里。

为了对蒙特卡罗方法有一个直观的印象，我们先举一个实例（计算圆周率 $\pi$ ），让从来没有接触过蒙特卡罗方法的人产生“原来这就是Monte Carlo”的感觉，以减少刚开始学习的困惑。

非蒙特卡罗方法

圆周率 $\pi$ 可以怎么计算？其中一个“常规”的方法就是利用 $\pi$ 的莱布尼茨公式：
$\frac{\pi }{4} = \sum\limits_{n = 0}^\infty {\frac{{{{\left( { - 1} \right)}^n}}}{{2n + 1}}} = 1 - \frac{1}{3} + \frac{1}{5} - \frac{1}{7} + \frac{1}{9} - \cdots$
不断增大 $n$ 的值，就能越来越逼近 $\frac{\pi }{4}$

[原创] 如何防止softmax函数上溢出(overflow)和下溢出(underflow)

2020 年 04 月 28 日2017 年 03 月 12 日作者 learnhard

《Deep Learning》（Ian Goodfellow & Yoshua Bengio & Aaron Courville）第四章「数值计算」中，谈到了上溢出（overflow）和下溢出（underflow）对数值计算的影响，并以softmax函数和log softmax函数为例进行了讲解。这里我再详细地把它总结一下。

[原创]Machine Learning/机器学习文章合集

2023 年 05 月 24 日2017 年 01 月 21 日作者 learnhard

注：带有 ♬♬♬♬♬ 标志的是文章合集。

✍强化学习(Reinforcement Learning)文章合集 ♬♬♬♬♬

✍用人话解释机器学习中的Logistic Regression（逻辑回归）

✍如何防止softmax函数上溢出(overflow)和下溢出(underflow)

✍ELL（Embedded Learning Library，微软嵌入式学习库）文章合集 ♬♬♬♬♬

[原创] 用人话解释机器学习中的Logistic Regression（逻辑回归）

2020 年 04 月 28 日2016 年 02 月 19 日作者 learnhard

友情提示：如果觉得页面中的公式显示太小，可以放大页面查看（不会失真）。

Logistic Regression（或Logit Regression），即逻辑回归，简记为LR，是机器学习领域的一种极为常用的算法／方法／模型。
你能从网上搜到十万篇讲述Logistic Regression的文章，也不多我这一篇，但是，就像我写过的最优化系列文章一样，我仍然试图用“人话”来再解释一遍——可能不专业，但是容易看得懂。那些一上来就是几页数学公式什么的最讨厌了，不是吗？
所以这篇文章是写给完全没听说过Logistic Regression的人看的，我相信看完这篇文章，你差不多可以从无到有，把逻辑回归应用到实践中去。

[原创] 再谈共轭方向法/Conjugate Direction Method In Optimization

2020 年 04 月 28 日2014 年 04 月 27 日作者 learnhard

共轭方向法是介于最速下降法和牛顿法之间的一种存在——它的收敛速度（二阶收敛）比最速下降法（线性收敛）快，同时它的计算量又比牛顿法要小，因此它的存在是有意义的。

[原创] 再谈牛顿法/Newton's Method In Optimization

2020 年 04 月 28 日2014 年 04 月 06 日作者 learnhard

牛顿法是最优化领域的经典算法，它在寻优的过程中，使用了目标函数的二阶导数信息，具体说来就是：用迭代点的梯度和二阶导数对目标函数进行二次逼近，把二次函数的极小点作为新的迭代点，不断重复此过程，直到找到最优点。

[原创] 再谈梯度下降法/最速下降法/Gradient descent/Steepest Descent

2020 年 04 月 28 日2014 年 04 月 03 日作者 learnhard

当今世界，深度学习应用已经渗透到了我们生活的方方面面，深度学习技术背后的核心问题是最优化(Optimization)。最优化是应用数学的一个分支，它是研究在给定约束之下如何寻求某些因素(的量)，以使某一(或某些)指标达到最优的一些学科的总称。
梯度下降法（Gradient descent，又称最速下降法/Steepest descent），是无约束最优化领域中历史最悠久、最简单的算法，单独就这种算法来看，属于早就“过时”了的一种算法。但是，它的理念是其他某些算法的组成部分，或者说在其他某些算法中，也有梯度下降法的“影子”。例如，各种深度学习库都会使用SGD（Stochastic Gradient Descent，随机梯度下降）或变种作为其优化算法。
今天我们就再来回顾一下梯度下降法的基础知识。

[原创] line search中的重要定理 - 梯度与方向的点积为零

2020 年 04 月 28 日2014 年 03 月 02 日作者 learnhard

对精确的line search（线搜索），有一个重要的定理：

这个定理表明，当前点在 ${d_k}$ 方向上移动到的那一点（ ${x_k} + {\alpha _k}{d_k}$ ）处的梯度，与当前点的搜索方向 ${d_k}$ 的点积为零。

[原创]高等数学笔记(24)

2020 年 05 月 03 日2013 年 12 月 22 日作者 learnhard

【前言】
请看此文。
要查看高等数学笔记合集，请看这里。

例2. 证明函数 $y = \sqrt[3]{x},y = \sqrt {{x^2}} = \left| x \right|$ 在 $x = 0$ 点连续，但是在 $x = 0$ 点不可导。