脑科学研究中常用的数据归一化方法（附Matlab程序）

《本文同步发布于“脑之说”微信公众号，欢迎搜索关注~~》在脑科学领域的研究中，我们往往需要对计算得到的结果数据（如fMRI中计算得到功能连接等指标）进行归一化（Normalization）处理。其实不止在脑科学领域，在其他领域也常常需要对结果数据进行归一化。对数据归一化的目的，要么是把数据线性变换到一个很小的区间内（如[0,1]）,便于数据结果之间的比较，要么是使得数据符合正态分布，便于进行统计分

悦影科技

2039人浏览 · 2020-11-30 13:44:24

悦影科技 · 2020-11-30 13:44:24 发布

《本文同步发布于“脑之说”微信公众号，欢迎搜索关注~~》

在脑科学领域的研究中，我们往往需要对计算得到的结果数据（如fMRI中计算得到功能连接等指标）进行归一化（Normalization）处理。其实不止在脑科学领域，在其他领域也常常需要对结果数据进行归一化。对数据归一化的目的，要么是把数据线性变换到一个很小的区间内（如[0,1]）,便于数据结果之间的比较，要么是使得数据符合正态分布，便于进行统计分析。本文，笔者简单介绍3种在脑科学领域常用的数据归一化方法，即离差标准化、z-score标准化和Fisher r-z变换，并给出简单的Matlab程序。

离差标准化

离差标准化又称为min-max标准化，其计算方法非常简单，即数据集中每个元素值减去数据集中最小值，然后除以数据集中最大值和最小值之差，如下面的公式所示。按此方法，对数据进行线性变换，使其落在[0,1]区间范围内。
在这里插入图片描述
其中，xi表示待转换数据集x中的元素值，min(x)表示数据集x中的最小值，max(x)表示数据集x中的最大值。

例1及Matlab程序：对x=[0.8147,0.9058,0.1270,0.9134,0.6324]进行离差标准化。

利用下面的Matlab命令即可求解：

y=(x-min(x))/(max(x)-min(x))

得到y=[0.8746,0.9904,0,1.0000,0.6426]

z-score标准化

z-score标准化的目的是使得数据符合正态分布，便于进行统计分析。其计算方法也非常简单，即数据集中的每个元素减去数据集的平均值，然后处以数据集的标准差。具体计算公式如下所示：
在这里插入图片描述
例2及Matlab程序：对x=[0.8147,0.9058,0.1270,0.9134,0.6324]进行z-score标准化。