《本文同步发布于“脑之说”微信公众号,欢迎搜索关注~~》

在脑科学领域的研究中,我们往往需要对计算得到的结果数据(如fMRI中计算得到功能连接等指标)进行归一化(Normalization)处理。其实不止在脑科学领域,在其他领域也常常需要对结果数据进行归一化。对数据归一化的目的,要么是把数据线性变换到一个很小的区间内(如[0,1]),便于数据结果之间的比较,要么是使得数据符合正态分布,便于进行统计分析。本文,笔者简单介绍3种在脑科学领域常用的数据归一化方法,即离差标准化、z-score标准化和Fisher r-z变换,并给出简单的Matlab程序。

离差标准化

离差标准化又称为min-max标准化,其计算方法非常简单,即数据集中每个元素值减去数据集中最小值,然后除以数据集中最大值和最小值之差,如下面的公式所示。按此方法,对数据进行线性变换,使其落在[0,1]区间范围内。
在这里插入图片描述
其中,xi表示待转换数据集x中的元素值,min(x)表示数据集x中的最小值,max(x)表示数据集x中的最大值。

例1及Matlab程序:对x=[0.8147,0.9058,0.1270,0.9134,0.6324]进行离差标准化。

利用下面的Matlab命令即可求解:

y=(x-min(x))/(max(x)-min(x))

得到y=[0.8746,0.9904,0,1.0000,0.6426]

z-score标准化

z-score标准化的目的是使得数据符合正态分布,便于进行统计分析。其计算方法也非常简单,即数据集中的每个元素减去数据集的平均值,然后处以数据集的标准差。具体计算公式如下所示:
在这里插入图片描述
例2及Matlab程序:对x=[0.8147,0.9058,0.1270,0.9134,0.6324]进行z-score标准化。

利用下面的Matlab命令即可求解:

y=(x-mean(x))/std(x)

得到y=[ 0.4142,0.6914,-1.6793,0.7145,-0.1409]

Fisher r-z变换

Fisher r-z变换应用最多的地方就是皮尔森相关系数r的变换,如我们在计算fMRI的相关时,一般会用皮尔森相关系数r,这时候往往需要把r转换成z。同样,Fisher r-z变换的目的也是使得数据符合正态分布,便于进行统计分析。计算方法如下:
在这里插入图片描述

例3及Matlab程序:对x=[0.8147,0.9058,0.1270,0.9134,0.6324]进行Fisher r-z变换。

利用下面的Matlab命令即可求解:

z=0.5*log((1+x)./(1-x))

得到z=[ 1.1409,1.5036,0.1277,1.5475,0.7453]

总结

本文,笔者对我们在脑科学研究中常用的3种数据归一化方法进行了介绍,并给出相应的Matlab语句,便于各位朋友进行计算,如有错误请各位老师不吝批评指正。

注:原创不易,请多多转发支持,如有问题请加笔者微信交流(悦影科技赵宗亚,微信:15560177218)

Logo

脑启社区是一个专注类脑智能领域的开发者社区。欢迎加入社区,共建类脑智能生态。社区为开发者提供了丰富的开源类脑工具软件、类脑算法模型及数据集、类脑知识库、类脑技术培训课程以及类脑应用案例等资源。

更多推荐