脑科学研究中常用的数据归一化方法(附Matlab程序)
《本文同步发布于“脑之说”微信公众号,欢迎搜索关注~~》在脑科学领域的研究中,我们往往需要对计算得到的结果数据(如fMRI中计算得到功能连接等指标)进行归一化(Normalization)处理。其实不止在脑科学领域,在其他领域也常常需要对结果数据进行归一化。对数据归一化的目的,要么是把数据线性变换到一个很小的区间内(如[0,1]),便于数据结果之间的比较,要么是使得数据符合正态分布,便于进行统计分
《本文同步发布于“脑之说”微信公众号,欢迎搜索关注~~》
在脑科学领域的研究中,我们往往需要对计算得到的结果数据(如fMRI中计算得到功能连接等指标)进行归一化(Normalization)处理。其实不止在脑科学领域,在其他领域也常常需要对结果数据进行归一化。对数据归一化的目的,要么是把数据线性变换到一个很小的区间内(如[0,1]),便于数据结果之间的比较,要么是使得数据符合正态分布,便于进行统计分析。本文,笔者简单介绍3种在脑科学领域常用的数据归一化方法,即离差标准化、z-score标准化和Fisher r-z变换,并给出简单的Matlab程序。
离差标准化
离差标准化又称为min-max标准化,其计算方法非常简单,即数据集中每个元素值减去数据集中最小值,然后除以数据集中最大值和最小值之差,如下面的公式所示。按此方法,对数据进行线性变换,使其落在[0,1]区间范围内。
其中,xi表示待转换数据集x中的元素值,min(x)表示数据集x中的最小值,max(x)表示数据集x中的最大值。
例1及Matlab程序:对x=[0.8147,0.9058,0.1270,0.9134,0.6324]进行离差标准化。
利用下面的Matlab命令即可求解:
y=(x-min(x))/(max(x)-min(x))
得到y=[0.8746,0.9904,0,1.0000,0.6426]
z-score标准化
z-score标准化的目的是使得数据符合正态分布,便于进行统计分析。其计算方法也非常简单,即数据集中的每个元素减去数据集的平均值,然后处以数据集的标准差。具体计算公式如下所示:
例2及Matlab程序:对x=[0.8147,0.9058,0.1270,0.9134,0.6324]进行z-score标准化。
利用下面的Matlab命令即可求解:
y=(x-mean(x))/std(x)
得到y=[ 0.4142,0.6914,-1.6793,0.7145,-0.1409]
Fisher r-z变换
Fisher r-z变换应用最多的地方就是皮尔森相关系数r的变换,如我们在计算fMRI的相关时,一般会用皮尔森相关系数r,这时候往往需要把r转换成z。同样,Fisher r-z变换的目的也是使得数据符合正态分布,便于进行统计分析。计算方法如下:
例3及Matlab程序:对x=[0.8147,0.9058,0.1270,0.9134,0.6324]进行Fisher r-z变换。
利用下面的Matlab命令即可求解:
z=0.5*log((1+x)./(1-x))
得到z=[ 1.1409,1.5036,0.1277,1.5475,0.7453]
总结
本文,笔者对我们在脑科学研究中常用的3种数据归一化方法进行了介绍,并给出相应的Matlab语句,便于各位朋友进行计算,如有错误请各位老师不吝批评指正。
注:原创不易,请多多转发支持,如有问题请加笔者微信交流(悦影科技赵宗亚,微信:15560177218)
更多推荐
所有评论(0)