View on GitHub

我的博客

杂七杂八啥都有

2019.9.1

新生开学了

  • 吃饭要抓紧了
  • 晚上没法去操场跑步了

我们知晓整体的存在,但整体(Population)不可知,我们只能拿到样本(Sample)

人工智能的测试集样本集的效果不同

The Mean

对于100个样本数据,修正25%可以:

样本方差 Sample Variance

定义 $s^2 = \frac{\sum (x_i - \overline{x})}{n - 1} = \frac{S_{xx}}{n - 1}$

标准差 Sample Standard Deviation

定义 $s = \sqrt{s^2}$

Q1:为什么选择平方而不是绝对值
Q2:为什么选择 n - 1 而不是 n?

A2:因为有时候选择 n - 1 能够更加符合总体方差

总体方差 Population Variance

$\sigma ^{2} = \sum_{i = 1}^N (x_{i} - \mu)^{2} / N$

另一种表示方法:$s^2 = \frac{\sum (x_i - \overline{x})}{n-1} = \frac{S_{xx}}{n-1}$

可以通过这个公式推导出一种更方便计算的公式:$S_{xx} = \sum(x_i - \overline{x})^2 = \sum x{_i}{^2} - \frac{(\sum x_i)^2}{n}$

Boxplots 相图(近些年发明)

特点:可以描述

Fourth
\(f_x = upper fourth - lower fourth \text{, 上 1/4 的数据 - 下 1/4 的数据}\)

TOP