简单易学的机器学习算法——极限学习机(ELM)

一、极限学习机的概念　　极限学习机(Extreme Learning Machine) ELM，是由黄广斌提出来的求解单隐层神经网络的算法。　　ELM最大的特点是对于传统的神经网络，尤其是单隐层前馈神经网络(SLFNs)，在保证学习精度的前提下比传统的学习算法速度更快。二、极限学习机的原理　　ELM是一种新型的快速学习算法，对于单隐层神经网络，ELM可以随机初始化输入权重和偏置

贺二公子

25722人浏览 · 2018-01-24 14:55:47

贺二公子 · 2018-01-24 14:55:47 发布

一、极限学习机的概念

　　极限学习机(Extreme Learning Machine) ELM，是由黄广斌提出来的求解单隐层神经网络的算法。
　　ELM最大的特点是对于传统的神经网络，尤其是单隐层前馈神经网络(SLFNs)，在保证学习精度的前提下比传统的学习算法速度更快。

二、极限学习机的原理

　　ELM是一种新型的快速学习算法，对于单隐层神经网络，ELM可以随机初始化输入权重和偏置并得到相应的输出权重。
这里写图片描述
　　　　　　　　　　(选自黄广斌老师的PPT)
　　对于一个单隐层神经网络(见Figure 1)，假设有Ｎ <script type="math/tex" id="MathJax-Element-40">Ｎ</script>个任意的样本(Xi,ti<script type="math/tex" id="MathJax-Element-41">X_i,t_i</script>)，其中 Xi=[xi1,xi2,...,xin]T∈Rn <script type="math/tex" id="MathJax-Element-42">X_i = [x_{i1}, x_{i2}, ..., x_{in}]^T \in R^n</script>， ti=[ti1,ti2,...,tim]T∈Rm <script type="math/tex" id="MathJax-Element-43">t_i = [t_{i1}, t_{i2}, ..., t_{im}]^T \in R^m</script>。对于一个有 L <script type="math/tex" id="MathJax-Element-44">L</script>个隐层节点的单隐层神经网络可以表示为

\sum i = 1 L β i g (W i \cdot X j + b i) = o j, j = 1, . . ., N

g(x) <script type="math/tex" id="MathJax-Element-46">g(x)</script>为激活函数，

Wi=[wi1,wi2,...,win]T <script type="math/tex" id="MathJax-Element-47">W_i = [w_{i1}, w_{i2}, ..., w_{in}]^T</script>为输入权重，

βi <script type="math/tex" id="MathJax-Element-48">\beta_i</script>输出权重，

bi <script type="math/tex" id="MathJax-Element-49">b_i</script>是第

i <script type="math/tex" id="MathJax-Element-50">i</script>个隐层单元的偏置。

Wi⋅Xj<script type="math/tex" id="MathJax-Element-51">W_i · X_j</script>表示

Wj <script type="math/tex" id="MathJax-Element-52">W_j</script>和

Xj <script type="math/tex" id="MathJax-Element-53">X_j</script>的内积。
　　单隐层神经网络学习的目标是使得输出的误差最小，可以表示为

\sum j = 1 N | | o j - t j | | = 0

βi <script type="math/tex" id="MathJax-Element-55">\beta_i</script>，

Wi <script type="math/tex" id="MathJax-Element-56">W_i</script>和

bi <script type="math/tex" id="MathJax-Element-57">b_i</script>，使得

\sum i = 1 L β i g (W i \cdot X j + b i) = t j, j = 1, . . ., N

H β = T

H <script type="math/tex" id="MathJax-Element-60">H</script>是隐层节点的输出，

β<script type="math/tex" id="MathJax-Element-61">\beta</script>为输出权重，

T <script type="math/tex" id="MathJax-Element-62">T</script>为期望输出。

H (W 1, . . ., W L, b 1, . . ., b L, X 1, . . ., X L) = ⎡ ⎣ ⎢ ⎢ g (W 1 \cdot X 1 + b 1) \dots g (W L \cdot X 1 + b L) ⋮ \dots ⋮ g (W 1 \cdot X N + b 1) \dots g (W L \cdot X N + b L) ⎤ ⎦ ⎥ ⎥ N \times L

β = ⎡ ⎣ ⎢ ⎢ β T 1 ⋮ β T L ⎤ ⎦ ⎥ ⎥ L \times m, T = ⎡ ⎣ ⎢ ⎢ T T 1 ⋮ T T L ⎤ ⎦ ⎥ ⎥ L \times m

W^i <script type="math/tex" id="MathJax-Element-65">\hat{W}_i</script>，

b^i <script type="math/tex" id="MathJax-Element-66">\hat{b}_i</script>和

β^i <script type="math/tex" id="MathJax-Element-67">\hat{\beta}_i</script>，使得

| | H (W^i, b^i) β^i - T | | = min W, b, β | | H (W i, b i) β i - T | |

i=1,...,L <script type="math/tex" id="MathJax-Element-69">i = 1, ..., L</script>，这等价于最小化损失函数

E = \sum j = 1 N (\sum i = 1 L β i g (W i \cdot X j + b i) - t j) 2

Wi <script type="math/tex" id="MathJax-Element-71">W_i</script>和隐层的偏置

bi <script type="math/tex" id="MathJax-Element-72">b_i</script>被随机确定，隐层的输出矩阵

H <script type="math/tex" id="MathJax-Element-73">H</script>就被唯一确定。训练单隐层神经网络可以转化为求解一个线性系统

Hβ=T<script type="math/tex" id="MathJax-Element-74">H\beta = T</script>。并且输出权重

β <script type="math/tex" id="MathJax-Element-75">\beta</script>可以被确定

β^= H + T

三实验

　　我们使用《简单易学的机器学习算法——Logistic回归》中的实验数据。
这里写图片描述
　　　　　　　　　　　　原始数据集
　　我们采用统计错误率的方式来评价实验的效果，其中错误率公式为：

e r r o r R a t e = N u m E r r o r N u m A l l

　　对于这样一个简单的问题， errorRate=0 <script type="math/tex" id="MathJax-Element-78">errorRate = 0</script>。
　　MATLAB代码
　　主程序

%% 主函数，二分类问题  

%导入数据集  
A = load('testSet.txt');  

data = A(:,1:2);%特征  
label = A(:,3);%标签  

[N,n] = size(data);  

L = 100;%隐层节点个数  
m = 2;%要分的类别数  

%--初始化权重和偏置矩阵  
W = rand(n,L)*2-1;  
b_1 = rand(1,L);  
ind = ones(N,1);  
b = b_1(ind,:);%扩充成N*L的矩阵  

tempH = data*W+b;  
H = g(tempH);%得到H  

%对输出做处理  
temp_T=zeros(N,m);  
for i = 1:N  
    if label(i,:) == 0  
        temp_T(i,1) = 1;  
    else   
        temp_T(i,2) = 1;  
    end      
end  
T = temp_T*2-1;  

outputWeight = pinv(H)*T;  

%--画出图形  
x_1 = data(:,1);    
x_2 = data(:,2);    
hold on    
for i = 1 : N    
    if label(i,:) == 0    
        plot(x_1(i,:),x_2(i,:),'.g');    
    else    
        plot(x_1(i,:),x_2(i,:),'.r');    
    end    
end  

output = H * outputWeight;  
%---计算错误率  
tempCorrect=0;  
for i = 1:N  
    [maxNum,index] = max(output(i,:));  
    index = index-1;  
    if index == label(i,:);  
        tempCorrect = tempCorrect+1;  
    end  
end  

errorRate = 1-tempCorrect./N;

　　激活函数

function [ H ] = g( X )  
    H = 1 ./ (1 + exp(-X));  
end

黄老师提供的极限学习机的代码：http://www.ntu.edu.sg/home/egbhuang/elm_codes.html

脑启社区

脑启社区是一个专注类脑智能领域的开发者社区。欢迎加入社区，共建类脑智能生态。社区为开发者提供了丰富的开源类脑工具软件、类脑算法模型及数据集、类脑知识库、类脑技术培训课程以及类脑应用案例等资源。

更多推荐

小米玄戒O1跑分出炉；深蓝CEO回应员工买车可离职两个月；OpenAI上线AI编程智能体Codex | 极客头条

脑启社区

人工智能时代，还需要学编程吗？

脑启社区

类脑SLAM的综述——自用仅供参考

脑启社区

所有评论(0)

查看更多评论

贺二公子

@heli200482128

已为社区贡献2条内容

简单易学的机器学习算法——极限学习机(ELM)

贺二公子

一、极限学习机的概念

二、极限学习机的原理

三 实验

所有评论(0)

贺二公子

三实验