超神级学霸(一桶布丁)-第318章宾主尽欢

表示为超螺旋代数中的超复数形式$x_i = a_i + b_i \epsilon$，这里的$\epsilon$是超越单位。

现在假设我们通过pca获得了一组特征向量${\mathbf{v}_1，\mathbf{v}_2，\ldots，\mathbf{v}_k}$，这是数据的主要变化方向。

接下来就能将数据投影到 pca提取的主要特征向量上，并保留前$k$个主要成分，以减少数据的维度。

压缩后的数据可以表示为$\mathbf{y}=(\mathbf{y}_1，\mathbf{y}_2，\ldots，\mathbf{y}_k)$，其中$\mathbf{y}_i =\mathbf{x}\cdot \mathbf{v}_i$表示数据在第$i$个主成分上的投影。

同理，当需要解压缩的时候，利用压缩后的数据$\mathbf{y}$和 pca提取的主要特征向量${\mathbf{v}_1，\mathbf{v}_2，\ldots，\mathbf{v}_k}$来重构原始数据。

重构的数据结构就是$\hat{\mathbf{x}}=\sum_{i=1}^{k}\mathbf{y}_i \mathbf{v}_i^t$。”

乔泽手书的速度很快，刚刚讲解完，也完成了包含着数据表示、分析和重构三个步骤的重要公式，然后将手中的稿纸递给了对面的马明旭。

既然懂压缩，又了解过超螺旋代数，那应该就能看懂这个简单的例子。

当然这就是个最简单的理论过程，豆豆在使用的时候，还需要考虑数据预处理、参数选择等问题，以确保算法的有效性和性能。不过这些都是细枝末节的东西，在乔泽看来，只要弄懂了理论，剩下的都是小事情，无非就是要花费些时

努努书坊