基础数据结构——数组（动态数组，二维数组，缓存与局部性原理）

🕗 发布于 2024-10-19 06:02 数据结构 缓存 java

1.概述

在计算机科学中，数组是由一组元素（值或变量）组成的数据结构，每个元素有至少一个索引或键来标识

因为数组内的元素是连续存储的，所以数组中元素的地址，可以通过其索引计算出来，例如：

int[] array = {1,2,3,4,5}

知道了数组的数据起始地址 $B a se A dd ress$ ，就可以由公式 $B a se A dd ress + i * s i ze$ 计算出索引 $i$ 元素的地址

$i$ 即索引，在 Java、C 等语言都是从 0 开始
$s i ze$ 是每个元素占用字节，例如 $in t$ 占 $4$ ， $d o u b l e$ 占 $8$

空间占用

Java 中数组结构为

8 字节 markword（记录了这个对象的 HashCode，分代年龄，锁信息等等）
4 字节 class 指针（压缩 class 指针的情况）
4 字节数组大小（决定了数组最大容量是 $2^{32}$ ）
数组元素 + 对齐字节（java 中所有对象大小都是 8 字节的整数倍[^12]，不足的要用对齐字节补足）

随机访问性能

即根据索引查找元素，时间复杂度是 $O (1)$

2.动态数组

package com.lemon.demo.array;

import java.util.Arrays;
import java.util.Iterator;
import java.util.function.Consumer;
import java.util.stream.IntStream;

/**
 * @author 李猛
 * @datetime 2024/10/17 17:41
 * @description 动态数组
 */
public class DynamicArray implements Iterable<Integer> {
    private int capacity = 8;//容量，初始容量8
    private int size = 0;//有效的元素个数，初始个数0
    private int[] array = new int[capacity];//数组信息

    /**
     * 向数组末尾添加元素
     *
     * @param element
     */
    public void addLast(int element) {
        add(size, element);
    }

    /**
     * 根据索引位置添加元素
     *
     * @param index
     * @param element
     */
    public void add(int index, int element) {
        if (index < 0 || index > size) {
            throw new IndexOutOfBoundsException("index:" + index + " error");
        }
        //扩容
        checkAddExpand();
        System.arraycopy(array, index, array, index + 1, size - index);
        array[index] = element;
        size++;
    }

    /**
     * 根据索引获取元素
     *
     * @param index
     * @return
     */
    public int get(int index) {
        if (index < 0 || index >= size) {
            throw new IndexOutOfBoundsException("index:" + index + " error");
        }
        return array[index];
    }

    public int remove(int index) {
        if (index < 0 || index >= size) {
            throw new IndexOutOfBoundsException("index:" + index + " error");
        }
        int element = array[index];
        if (index == size - 1) {//如果是删除最后一个元素
            /**
             * 数组copy
             * 1.原数组
             * 2.原数组起始位置
             * 3.目标数组
             * 4.目标数组起始位置
             * 5.要复制的数组元素的数量
             */
            System.arraycopy(array, index + 1, array, index, size - index - 1);
        }
        size--;
        return element;
    }

    /**
     * 扩容
     */
    private void checkAddExpand() {
        if (capacity == size) {
            /**
             * 扩容1.5倍
             */
            //capacity = capacity + capacity >> 1;
            capacity += capacity >> 1;
            int[] newArray = new int[capacity];
            System.arraycopy(array, 0, newArray, 0, size);
            array = newArray;
        }
    }

    /**
     * 循环遍历
     *
     * @param consumer
     */
    public void foreach(Consumer<Integer> consumer) {
        for (int i = 0; i < size; i++) {
            consumer.accept(array[i]);
        }
    }

    /**
     * 流遍历
     *
     * @return
     */
    public IntStream stream() {
        int[] range = Arrays.copyOfRange(array, 0, size - 1);
        return IntStream.of(range);
    }

    /**
     * 迭代器
     *
     * @return
     */
    @Override
    public Iterator<Integer> iterator() {
        return new Iterator<>() {
            int pointer = 0;

            @Override
            public boolean hasNext() {
                return pointer < size;
            }

            @Override
            public Integer next() {
                return array[pointer++];
            }
        };
    }
}

3.二维数组

int[][] arr = {
        {11, 12, 13, 14, 15},
        {21, 22, 23, 24, 25},
        {31, 32, 33, 34, 35},
};

在这里插入图片描述

二维数组占 32 个字节，其中 array[0]，array[1]，array[2] 三个元素分别保存了指向三个一维数组的引用
三个一维数组各占 40 个字节
它们在内层布局上是连续的

更一般的，对一个二维数组 $A rr a y [m] [n]$

$m$ 是外层数组的长度，可以看作 row 行
$n$ 是内层数组的长度，可以看作 column 列
当访问 $A rr a y [i] [j]$ ， $0\leq i \lt m, 0\leq j \lt n$ 时，就相当于
- 先找到第 $i$ 个内层数组（行）
- 再找到此内层数组中第 $j$ 个元素（列）

4.缓存与局部性原理

这里只讨论空间局部性

cpu 读取内存（速度慢）数据后，会将其放入高速缓存（速度快）当中，如果后来的计算再用到此数据，在缓存中能读到的话，就不必读内存了
缓存的最小存储单位是缓存行（cache line），一般是 64 bytes，一次读的数据少了不划算啊，因此最少读 64 bytes 填满一个缓存行，因此读入某个数据时也会读取其临近的数据，这就是所谓空间局部性

定义两个求和方法

public static void sum1(int[][] arr, int rows, int columns) {
    long sum = 0;
    for (int i = 0; i < rows; i++) {
        for (int j = 0; j < columns; j++) {
            sum += arr[i][j];
        }
    }
    System.out.println("sum1:" + sum);
}

public static void sum2(int[][] arr, int rows, int columns) {
    long sum = 0;
    for (int j = 0; j < columns; j++) {
        for (int i = 0; i < rows; i++) {
            sum += arr[i][j];
        }
    }
    System.out.println("sum2:" + sum);
}

比较下面 $s u m 1$ 和 $s u m 2$ 两个方法的执行效率

int rows = 1000000;
int columns = 14;
int[][] a = new int[rows][columns];

StopWatch sw = new StopWatch();

sw.start("sum1");
sum1(a, rows, columns);
sw.stop();

sw.start("sum2");
sum2(a, rows, columns);
sw.stop();

System.out.println(sw.prettyPrint());

执行结果
在这里插入图片描述
可以看到 $s u m 1$ 的效率比 $s u m 2$ 快很多，为什么呢？

缓存是有限的，当新数据来了后，一些旧的缓存行数据就会被覆盖
如果不能充分利用缓存的数据，就会造成效率低下

原文地址：https://blog.csdn.net/weixin_43860260/article/details/143024110

免责声明：本站文章内容转载自网络资源，如本站内容侵犯了原著者的合法权益，可联系本站删除。更多内容请关注自学内容网（zxcms.com）！

交通银行核心系统分布式实践
交通银行贷记卡是当年由法国服务商ATOS 源讯建设，使用IBM Z/OS 大型机 + CICS+ DB2+COBOL 为基础，该系统已上线运行十余年，在册卡量超过7000万，日均授权交易量1200万，
阅读更多2024-10-19
git 与 github 同步
出现类似提示验证成功Hi bingmengzi!$ ssh-keygen -t rsa -C "邮箱" //你自己注册GitHub的邮箱。git config --global
阅读更多2024-10-19
【基础篇】AOF日志：宕机了，Redis如何避免数据丢失？
如果有人问你：“你会把 Redis 用在什么业务场景下？”我想你大概率会说：“我会把它当作缓存使用，因为它把后端数据库中的数据存储在内存中，然后直接从内存中读取数据，响应速度会非常快。我们很容易想到的
阅读更多2024-10-19
Excel：vba实现批量修改文件名
【代码】Excel：vba实现批量修改文件名。
阅读更多2024-10-19
录微课专用提词器，不会被录进视频中的提词器，还能显示PPT中备注的内容
不坑提词器，全称：不坑隐形提词器。是一款能够在截图、录屏、直播过程中隐藏界面的提词器软件。系统要求：Win10 1024 以上（特别提醒：Win7状态下不可隐身）
阅读更多2024-10-19
用python-pptx轻松统一调整演示文档配色方案
哈喽，大家好，我是木头左！
阅读更多2024-10-19
DirectX 11 和 Direct3D 11 的关系
DirectX 11是微软的一项技术，为高性能游戏和复杂图形程序制定了标准。它是DirectX系列的一个版本，引入了多项创新功能，如硬件加速的Tessellation（细分曲面技术）、多线程渲染等，这
阅读更多2024-10-19
nginx平滑升级
nginx -V 最后的版本如果也是下载的高版本说明平滑升级完成。
阅读更多2024-10-19
Java生死簿管理小系统（简单实现）
这是一个简单的生死簿管理小系统，实现了基本的增删改查功能往期文章第一章：日常_JAVA_面试题集（含答案）第二章：日常_JAVA_面试题集（含答案）平安壹钱包JAVA面试官：请你说一下Mybatis的
阅读更多2024-10-19
基于vue框架的的大学校园社团管理系统q00q2（程序+源码+数据库+调试部署+开发环境）系统界面在最后面。
开题报告内容。
阅读更多2024-10-19