数学建模——熵权+TOPSIS+肘部法则+系统聚类

🕗 发布于 2024-09-21 08:58 数学建模聚类算法

文章目录

一、起因
二、代码展示

一、起因

我本科的数学建模队长找上我，让我帮她写下matlab代码，当然用的模型还是曾经打比赛的模型，所以虽然代码量多，但是写的很快，也是正逢中秋，有点时间。
当然我也没想到，研一刚开学这论文就这么水灵灵的要发出来了，队长的实力还是遥遥领先啊，在这里，祝她们的论文一次见刊！

二、代码展示

差不多有460行代码这样

%% 获取数据
[num,txt,raw] = xlsread('C:\Users\19468\Desktop\zhibiao1.xlsx',1);

%% 标准化

MIN = min(num); %各指标的最大值
MAX = max(num); %各指标的最小值
NUM_B = [];     %保存标准化后的数据
for i = 1:size(num,1)    % 运行31个省份
    for j = 1:size(num,2) % 1个省份的23个数据
        NUM_B(i,j) = (num(i,j)-MIN(j))/(MAX(j) - MIN(j));
    end
end

%% 对个别指标正向化
% 对指标在第5，10，11，13，14、22列进行正向化
Z = [5,10,11,13,14,22]; % 保存正向化列数
NUM_B_Z = NUM_B;     % 存放标准化正向化后的数据
for i = 1:size(num,1)    % 运行31个省份
    for j=1:size(Z,2)    % 5列数据
        NUM_B_Z(i,Z(j)) = 1 - NUM_B(i,Z(j));
    end
end

%% 对二级指标进行熵权+TOPSIS，保留各省份各一级指标的数据
TOP_one   = [1,2,3,4,5];       % 第一个一级指标
TOP_two   = [6,7,8];           % 第二个一级指标
TOP_three = [9,10,11,12,13];   % 第三个一级指标
TOP_four  = [14,15];           % 第四个一级指标
TOP_five  = [16,17,18,19];     % 第五个一级指标
TOP_six   = [20,21,22,23];     % 第六个一级指标

TOP_one_data   = NUM_B_Z(:,1:5);    % 第一个一级指标的数据
TOP_two_data   = NUM_B_Z(:,6:8);    % 第二个一级指标的数据
TOP_three_data = NUM_B_Z(:,9:13);   % 第三个一级指标的数据
TOP_four_data  = NUM_B_Z(:,14:15);  % 第四个一级指标的数据
TOP_five_data  = NUM_B_Z(:,16:19);  % 第五个一级指标的数据
TOP_six_data   = NUM_B_Z(:,20:23);  % 第六个一级指标的数据

% NUM_B_Z_W(:,:,1) = TOP_one_data;
% NUM_B_Z_W(:,:,2) = TOP_two_data;
% NUM_B_Z_W(:,:,3) = TOP_three_data;
% NUM_B_Z_W(:,:,4) = TOP_four_data;
% NUM_B_Z_W(:,:,5) = TOP_five_data;

% 熵权法+TOPSIS
% 指标一
Z = TOP_one_data;
[n,m] = size(Z);
D = zeros(1,m);  % 初始化保存信息效用值的行向量
for i = 1:m
    x = Z(:,i);  % 取出第i列的指标
    p = x / sum(x);
    % 注意，p有可能为0，此时计算ln(p)*p时，Matlab会返回NaN，所以要判断
    n = length(p);   % 向量的长度
    lnp = zeros(n,1);   % 初始化最后的结果
    for j = 1:n   % 开始循环
        if p(j) == 0   % 如果第i个元素为0
            lnp(j) = 0;  % 那么返回的第i个结果也为0
        else
            lnp(j) = log(p(j));
        end
    end
    %到这里结束
    e = -sum(p .* lnp) / log(n); % 计算信息熵
    D(i) = 1- e; % 计算信息效用值
end
W = D ./ sum(D);  % 将信息效用值归一化，得到权重
W


D_min = min(TOP_one_data);
D_max = max(TOP_one_data);

zonghedefen_one = 1:31;  %生成记录点
for i = 1:31
    %利用（C = D-/((D-)+(D+))）topsis模型与熵权进行结合
    D_jia  = sqrt(W(1)*(TOP_one_data(i,1)-D_max(1))^2 + W(2)*(TOP_one_data(i,2)-D_max(2))^2 + ...
                  W(3)*(TOP_one_data(i,3)-D_max(3))^2 + W(4)*(TOP_one_data(i,4)-D_max(4))^2 + ...
                  W(5)*(TOP_one_data(i,5)-D_max(5))^2);

    D_jian = sqrt(W(1)*(TOP_one_data(i,1)-D_min(1))^2 + W(2)*(TOP_one_data(i,2)-D_min(2))^2 + ...
                  W(3)*(TOP_one_data(i,3)-D_min(1))^2 + W(4)*(TOP_one_data(i,4)-D_min(2))^2 + ...
                  W(5)*(TOP_one_data(i,5)-D_min(1))^2);


    zonghedefen_one(i) = D_jian/(D_jia+D_jian);  % 一次就是产生31个数据
end

zonghedefen_one = zonghedefen_one';  



% 指标二
Z = TOP_two_data;
[n,m] = size(Z);
D = zeros(1,m);  % 初始化保存信息效用值的行向量
for i = 1:m
    x = Z(:,i);  % 取出第i列的指标
    p = x / sum(x);
    % 注意，p有可能为0，此时计算ln(p)*p时，Matlab会返回NaN，所以要判断
    n = length(p);   % 向量的长度
    lnp = zeros(n,1);   % 初始化最后的结果
    for j = 1:n   % 开始循环
        if p(j) == 0   % 如果第i个元素为0
            lnp(j) = 0;  % 那么返回的第i个结果也为0
        else
            lnp(j) = log(p(j));
        end
    end
    %到这里结束
    e = -sum(p .* lnp) / log(n); % 计算信息熵
    D(i) = 1- e; % 计算信息效用值
end
W = D ./ sum(D);  % 将信息效用值归一化，得到权重
W


D_min = min(TOP_two_data);
D_max = max(TOP_two_data);

zonghedefen_two = 1:31;  %生成记录点
for i = 1:31
    %利用（C = D-/((D-)+(D+))）topsis模型与熵权进行结合
    D_jia  = sqrt(W(1)*(TOP_two_data(i,1)-D_max(1))^2 + W(2)*(TOP_two_data(i,2)-D_max(2))^2 + ...
                  W(3)*(TOP_two_data(i,3)-D_max(3))^2);

    D_jian = sqrt(W(1)*(TOP_two_data(i,1)-D_min(1))^2 + W(2)*(TOP_two_data(i,2)-D_min(2))^2 + ...
                  W(3)*(TOP_two_data(i,3)-D_min(1))^2);


    zonghedefen_two(i) = D_jian/(D_jia+D_jian);  % 一次就是产生31个数据
end

zonghedefen_two = zonghedefen_two'; 


% 指标三
Z = TOP_three_data;
[n,m] = size(Z);
D = zeros(1,m);  % 初始化保存信息效用值的行向量
for i = 1:m
    x = Z(:,i);  % 取出第i列的指标
    p = x / sum(x);
    % 注意，p有可能为0，此时计算ln(p)*p时，Matlab会返回NaN，所以要判断
    n = length(p);   % 向量的长度
    lnp = zeros(n,1);   % 初始化最后的结果
    for j = 1:n   % 开始循环
        if p(j) == 0   % 如果第i个元素为0
            lnp(j) = 0;  % 那么返回的第i个结果也为0
        else
            lnp(j) = log(p(j));
        end
    end
    %到这里结束
    e = -sum(p .* lnp) / log(n); % 计算信息熵
    D(i) = 1- e; % 计算信息效用值
end
W = D ./ sum(D);  % 将信息效用值归一化，得到权重
W


D_min = min(TOP_three_data);
D_max = max(TOP_three_data);

zonghedefen_three = 1:31;  %生成记录点
for i = 1:31
    %利用（C = D-/((D-)+(D+))）topsis模型与熵权进行结合
    D_jia  = sqrt(W(1)*(TOP_three_data(i,1)-D_max(1))^2 + W(2)*(TOP_three_data(i,2)-D_max(2))^2 + ...
                  W(3)*(TOP_three_data(i,3)-D_max(3))^2 + W(4)*(TOP_three_data(i,4)-D_max(4))^2 + ...
                  W(5)*(TOP_three_data(i,5)-D_max(5))^2);

    D_jian = sqrt(W(1)*(TOP_three_data(i,1)-D_min(1))^2 + W(2)*(TOP_three_data(i,2)-D_min(2))^2 + ...
                  W(3)*(TOP_three_data(i,3)-D_min(3))^2 + W(4)*(TOP_three_data(i,4)-D_min(4))^2 + ...
                  W(5)*(TOP_three_data(i,5)-D_min(5))^2);


    zonghedefen_three(i) = D_jian/(D_jia+D_jian);  % 一次就是产生31个数据
end

zonghedefen_three = zonghedefen_three';

% 指标四
Z = TOP_four_data;
[n,m] = size(Z);
D = zeros(1,m);  % 初始化保存信息效用值的行向量
for i = 1:m
    x = Z(:,i);  % 取出第i列的指标
    p = x / sum(x);
    % 注意，p有可能为0，此时计算ln(p)*p时，Matlab会返回NaN，所以要判断
    n = length(p);   % 向量的长度
    lnp = zeros(n,1);   % 初始化最后的结果
    for j = 1:n   % 开始循环
        if p(j) == 0   % 如果第i个元素为0
            lnp(j) = 0;  % 那么返回的第i个结果也为0
        else
            lnp(j) = log(p(j));
        end
    end
    %到这里结束
    e = -sum(p .* lnp) / log(n); % 计算信息熵
    D(i) = 1- e; % 计算信息效用值
end
W = D ./ sum(D);  % 将信息效用值归一化，得到权重
W


D_min = min(TOP_four_data);
D_max = max(TOP_four_data);

zonghedefen_four = 1:31;  %生成记录点
for i = 1:31
    %利用（C = D-/((D-)+(D+))）topsis模型与熵权进行结合
    D_jia  = sqrt(W(1)*(TOP_four_data(i,1)-D_max(1))^2 + W(2)*(TOP_four_data(i,2)-D_max(2))^2);

    D_jian = sqrt(W(1)*(TOP_four_data(i,1)-D_min(1))^2 + W(2)*(TOP_four_data(i,2)-D_min(2))^2);


    zonghedefen_four(i) = D_jian/(D_jia+D_jian);  % 一次就是产生31个数据
end

zonghedefen_four = zonghedefen_four'; 

% 指标五
Z = TOP_five_data;
[n,m] = size(Z);
D = zeros(1,m);  % 初始化保存信息效用值的行向量
for i = 1:m
    x = Z(:,i);  % 取出第i列的指标
    p = x / sum(x);
    % 注意，p有可能为0，此时计算ln(p)*p时，Matlab会返回NaN，所以要判断
    n = length(p);   % 向量的长度
    lnp = zeros(n,1);   % 初始化最后的结果
    for j = 1:n   % 开始循环
        if p(j) == 0   % 如果第i个元素为0
            lnp(j) = 0;  % 那么返回的第i个结果也为0
        else
            lnp(j) = log(p(j));
        end
    end
    %到这里结束
    e = -sum(p .* lnp) / log(n); % 计算信息熵
    D(i) = 1- e; % 计算信息效用值
end
W = D ./ sum(D);  % 将信息效用值归一化，得到权重
W


D_min = min(TOP_five_data);
D_max = max(TOP_five_data);

zonghedefen_five = 1:31;  %生成记录点
for i = 1:31
    %利用（C = D-/((D-)+(D+))）topsis模型与熵权进行结合
    D_jia  = sqrt(W(1)*(TOP_five_data(i,1)-D_max(1))^2 + W(2)*(TOP_five_data(i,2)-D_max(2))^2 + ...
                  W(3)*(TOP_five_data(i,3)-D_max(3))^2 + W(4)*(TOP_five_data(i,4)-D_max(4))^2);

    D_jian = sqrt(W(1)*(TOP_five_data(i,1)-D_min(1))^2 + W(2)*(TOP_five_data(i,2)-D_min(2))^2 + ...
                  W(3)*(TOP_five_data(i,3)-D_min(3))^2 + W(4)*(TOP_five_data(i,4)-D_min(4))^2);


    zonghedefen_five(i) = D_jian/(D_jia+D_jian);  % 一次就是产生31个数据
end

zonghedefen_five = zonghedefen_five'; 

% 指标六
Z = TOP_six_data;
[n,m] = size(Z);
D = zeros(1,m);  % 初始化保存信息效用值的行向量
for i = 1:m
    x = Z(:,i);  % 取出第i列的指标
    p = x / sum(x);
    % 注意，p有可能为0，此时计算ln(p)*p时，Matlab会返回NaN，所以要判断
    n = length(p);   % 向量的长度
    lnp = zeros(n,1);   % 初始化最后的结果
    for j = 1:n   % 开始循环
        if p(j) == 0   % 如果第i个元素为0
            lnp(j) = 0;  % 那么返回的第i个结果也为0
        else
            lnp(j) = log(p(j));
        end
    end
    %到这里结束
    e = -sum(p .* lnp) / log(n); % 计算信息熵
    D(i) = 1- e; % 计算信息效用值
end
W = D ./ sum(D);  % 将信息效用值归一化，得到权重
W


D_min = min(TOP_six_data);
D_max = max(TOP_six_data);

zonghedefen_six = 1:31;  %生成记录点
for i = 1:31
    %利用（C = D-/((D-)+(D+))）topsis模型与熵权进行结合
    D_jia  = sqrt(W(1)*(TOP_six_data(i,1)-D_max(1))^2 + W(2)*(TOP_six_data(i,2)-D_max(2))^2 + ...
                  W(3)*(TOP_six_data(i,3)-D_max(3))^2 + W(4)*(TOP_six_data(i,4)-D_max(4))^2);

    D_jian = sqrt(W(1)*(TOP_six_data(i,1)-D_min(1))^2 + W(2)*(TOP_six_data(i,2)-D_min(2))^2 + ...
                  W(3)*(TOP_six_data(i,3)-D_min(3))^2 + W(4)*(TOP_six_data(i,4)-D_min(4))^2);


    zonghedefen_six(i) = D_jian/(D_jia+D_jian);  % 一次就是产生31个数据
end

zonghedefen_six = zonghedefen_six';


%% 数据整合
zonghedefen = [zonghedefen_one,zonghedefen_two,zonghedefen_three,zonghedefen_four,zonghedefen_five,zonghedefen_six];
% xlswrite('C:\Users\19468\Desktop\writing_two.xlsx',zonghedefen);

%% 对一级指标熵权+TOPSIS，保留各一级指标的熵值，信息效用值以及权重，以及最终得分
Z = zonghedefen;
[n,m] = size(Z);
D = zeros(1,m);  % 初始化保存信息效用值的行向量
for i = 1:m
    x = Z(:,i);  % 取出第i列的指标
    p = x / sum(x);
    % 注意，p有可能为0，此时计算ln(p)*p时，Matlab会返回NaN，所以要判断
    n = length(p);   % 向量的长度
    lnp = zeros(n,1);   % 初始化最后的结果
    for j = 1:n   % 开始循环
        if p(j) == 0   % 如果第i个元素为0
            lnp(j) = 0;  % 那么返回的第i个结果也为0
        else
            lnp(j) = log(p(j));
        end
    end
    %到这里结束
    e(i) = -sum(p .* lnp) / log(n); % 计算信息熵
    D(i) = 1- e(i); % 计算信息效用值
end
W = D ./ sum(D);  % 将信息效用值归一化，得到权重
W


D_min = min(zonghedefen);
D_max = max(zonghedefen);

zonghedefen_last = 1:31;  %生成记录点
for i = 1:31
    %利用（C = D-/((D-)+(D+))）topsis模型与熵权进行结合
    D_jia  = sqrt(W(1)*(zonghedefen(i,1)-D_max(1))^2 + W(2)*(zonghedefen(i,2)-D_max(2))^2 + ...
                  W(3)*(zonghedefen(i,3)-D_max(3))^2 + W(4)*(zonghedefen(i,4)-D_max(4))^2 + ...
                  W(5)*(zonghedefen(i,5)-D_max(5))^2 + W(6)*(zonghedefen(i,6)-D_max(6))^2);

    D_jian = sqrt(W(1)*(zonghedefen(i,1)-D_min(1))^2 + W(2)*(zonghedefen(i,2)-D_min(2))^2 + ...
                  W(3)*(zonghedefen(i,3)-D_min(3))^2 + W(4)*(zonghedefen(i,4)-D_min(4))^2 + ...
                  W(5)*(zonghedefen(i,5)-D_min(5))^2 + W(6)*(zonghedefen(i,6)-D_min(6))^2);


    zonghedefen_last(i) = D_jian/(D_jia+D_jian);  % 一次就是产生31个数据
end

zonghedefen_last = zonghedefen_last'; 
e = e';
D = D';
W = W';

%% 肘部法制聚类（一级）
[n, p] = size(zonghedefen_last);
K = 8;
D = zeros(K, 2);
for k = 2:K
    [label, c, sumd, d] = kmeans(zonghedefen_last, k, 'dist', 'sqeuclidean');
    % data，n×p原始数据向量
    % label，n×1向量，聚类结果标签；
    % c，k×p向量，k个聚类质心的位置
    % sumd，k×1向量，类间所有点与该类质心点距离之和
    % d，n×k向量，每个点与聚类质心的距离
    sse1 = sum(sumd.^2);
    D(k, 1) = k;
    D(k, 2) = sse1;
end
% 绘制聚类偏差图
plot(D(2:end, 1), D(2:end, 2), 'o-');
title('不同K值聚类偏差图')
xlabel('分类数(K值)')
ylabel('簇内误差平方和')

%% 肘部法制聚类（二级）
[n, p] = size(zonghedefen);
K = 8;
D = zeros(K, 2);
for k = 2:K
    [label, c, sumd, d] = kmeans(zonghedefen, k, 'dist', 'sqeuclidean');
    % data，n×p原始数据向量
    % label，n×1向量，聚类结果标签；
    % c，k×p向量，k个聚类质心的位置
    % sumd，k×1向量，类间所有点与该类质心点距离之和
    % d，n×k向量，每个点与聚类质心的距离
    sse1 = sum(sumd.^2);
    D(k, 1) = k;
    D(k, 2) = sse1;
end
% 绘制聚类偏差图
plot(D(2:end, 1), D(2:end, 2), 'o-');
title('不同K值聚类偏差图')
xlabel('分类数(K值)')
ylabel('簇内误差平方和')


%% 系统聚类（一级）
% 执行系统聚类
Z = linkage(zonghedefen_last, 'ward');

% 绘制树状图
figure;
dendrogram(Z);
title('Hierarchical Clustering Dendrogram');

% 如果你想要裁剪树状图以显示特定数量的聚类，可以使用以下代码
% 例如，我们想要将数据聚类为4个类别
k = 4;
figure;
dendrogram(Z, k);
title(['Hierarchical Clustering Dendrogram with ', num2str(k), ' clusters']);

% 裁剪树状图并获取聚类索引
idx = cluster(Z, 'maxclust', k);

% 绘制裁剪后的聚类结果
figure;
gscatter(zonghedefen_last(:,1), idx);
title(['Hierarchical Clustering with ', num2str(k), ' clusters']);
xlabel('Feature 1');
ylabel('Feature 2');
legend('Location', 'best');

%% 系统聚类（二级）

% % 执行系统聚类
% Z = linkage(zonghedefen, 'ward');
% 
% % 绘制树状图
% figure;
% dendrogram(Z);
% title('Hierarchical Clustering Dendrogram');
% 
% % 如果你想要裁剪树状图以显示特定数量的聚类，可以使用以下代码
% % 例如，我们想要将数据聚类为4个类别
% k = 4;
% figure;
% dendrogram(Z, k);
% title(['Hierarchical Clustering Dendrogram with ', num2str(k), ' clusters']);
% 
% % 裁剪树状图并获取聚类索引
% idx = cluster(Z, 'maxclust', k);
% 
% % 绘制裁剪后的聚类结果
% figure;
% gscatter(zonghedefen(:,1),zonghedefen(:,2),zonghedefen(:,3),zonghedefen(:,4),zonghedefen(:,5),zonghedefen(:,6), idx);
% title(['Hierarchical Clustering with ', num2str(k), ' clusters']);
% xlabel('Feature 1');
% ylabel('Feature 2');
% legend('Location', 'best');

原文地址：https://blog.csdn.net/m0_52592798/article/details/142313656

免责声明：本站文章内容转载自网络资源，如本站内容侵犯了原著者的合法权益，可联系本站删除。更多内容请关注自学内容网（zxcms.com）！

上一篇：小程序与APP的区别
下一篇：Matlab自学笔记三十六：日期时间型的概念及其简单应用

算数基本定理@质因数分解原理
把自然数写成素数的乘积，结论就是著名的算术基本定理。此定理建立了自然数与素数之间的一个重要的关系式。算数基本定理是整除理论性质和结论的精华,是整个初等数论的基础证明一些方程是否有整数解能够从公式的角度
阅读更多2024-11-15
用 Python 从零开始创建神经网络（六）：优化（Optimization）介绍
在随机初始化的模型中，或者即使是采用更复杂方法初始化的模型中，我们的目标是随着时间的推移培训或教育一个模型。为了训练一个模型，我们调整权重和偏差以提高模型的准确性和置信度。为此，我们需要计算模型的错误
阅读更多2024-11-15
海思3403对RTSP进行目标检测
用ss928 实现rtsp流的目标检测
阅读更多2024-11-15
亮数据——助力全球数据抓取的高效代理平台
特别是在需要跨境数据采集的场景中，亮数据的全球代理池能够让用户根据目标网站的地域需求，选择不同地区的IP地址，以此提升数据抓取的稳定性和成功率。亮数据不仅提供了丰富的IP资源，还内置了智能管理系统，可
阅读更多2024-11-15
【卡尔曼滤波】递归算法Recursive的应用 C语言、Python实现（Kalman Filter）
【卡尔曼滤波】递归算法Recursive的应用 C语言、Python实现（Kalman Filter）
阅读更多2024-11-15
记一次工作中订单幂等处理方案
当然可以考虑在数据库新增一张表，这张表上有第三方订单号的字段，并为此字段建立唯一索引，每次下单前预先往这张表插入数据，如果此第三方订单号已存在，那么插入数据必然报错。第一次是通过分布式锁检测，这是在
阅读更多2024-11-15
大数据湖项目建设方案（100页WORD）
随着信息技术的飞速发展，数据量呈现出爆炸性增长的趋势。企业、政府机构及科研单位在运营过程中积累了大量的数据资源，这些数据中蕴含着巨大的价值，但如何高效地存储、处理和分析这些数据，成为了一个亟待解决的问
阅读更多2024-11-15
深度学习笔记14-卷积神经网络2
卷积神经网络，是包含卷积运算且具有深度结构的前馈神经网络。在卷积神经网络中，包含卷积层、池化层和全连接层三种重要的结构。相比前馈神经网络，卷积层和池化层是新增的网络结构，在提取特征时，卷积神经网络使用
阅读更多2024-11-15
[Mysql基础] 表的操作
1.1 语法说明：field表示列名datatype表示列的类型字符集，如果没有指定字符集，则以所在数据库的字符集为准collate校验规则，如果没有指定校验规则，则以所在数据库的校验规则为准。
阅读更多2024-11-15
Mysql-DDL语句
Mysql DDL语句的使用方法和配置命令，可以更加快速熟悉的掌握Mysql基本操作命令
阅读更多2024-11-15

数学建模——熵权+TOPSIS+肘部法则+系统聚类

文章目录

一、起因

二、代码展示

相关文章