关于我、重生到500年前凭借C语言改变世界科技vlog.16——万字详解指针概念及技巧

🕗 发布于 2024-11-08 20:33 c语言 科技 开发语言

本篇为指针系列的最后一篇，我们将在该篇 vlog 对指针的常见表达形式的概念及技巧进行深入的解析，通过该篇 vlog 可以让你以后在遇到指针时基本都能将代码转化为自己的语言去理解，建议先思考后再看解析，更有助于加深理解，希望能够为广大读者们在初学指针时排忧解惑 😃

1. sizeof 和 strlen

1.1 sizeof

在初学C语言时就提到过 sizeof 的概念，这也是个常用的关键字，想必已经大家已经烂熟于心
回顾提示：sizeof（类型）、sizeof 表达式

sizeof 是操作符
sizeof 计算操作数所占内存的大小，单位是字节
不关注内存中存放什么数据

这里不做过多赘述，忘记的可以去看我往期的文章回顾:

传送门：关于我、重生到500年前凭借C语言改变世界科技vlog.2——C语言数据类型和变量

1.2 strlen

前面在举指针的例子的时候，提到过 strlen ，是用来计算字符串长度的
在这里插入图片描述

传送门：strlen-C++参考

头文件为 #include <string.h> , strlen 是专门用于计算字符串长度的，strlen 从 str 这个参数的地址开始向后，统计 \0 之前的字符串个数，只要没遇到 \0 就不会停止，直到找到为止，所以可能存在越界查找的情况

通过一个例子就能明白：

#include <stdio.h>
int main()
{
 char arr1[3] = {'a', 'b', 'c'};
 char arr2[] = "abc";
 printf("%d\n", strlen(arr1));
 printf("%d\n", strlen(arr2));
 
 printf("%d\n", sizeof(arr1));
 printf("%d\n", sizeof(arr2));
 return 0;
}

运行代码后可以发现结果为 35，3，3，4
字符没有 \0 ，所以 strlen 找不到停止的标志，就会产生一个随机值

可以总结出以下几点：

strlen是库函数，使用需要包含头文件 string.h
srtlen是求字符串长度的，统计的是 \0 之前字符的个数
关注内存中是否有 \0 ，如果没有 \0 ，就会持续往后找，可能会越界

2. 数组和指针结合的试题深入解析

以下代码均在 x64 环境下运行，地址大小为 8 ，地址保持不变

2.1 一维数组

int a[] = {1,2,3,4};
1.printf("%zd\n",sizeof(a));
2.printf("%zd\n",sizeof(a+0));
3.printf("%zd\n",sizeof(*a));
4.printf("%zd\n",sizeof(a+1));
5.printf("%zd\n",sizeof(a[1]));
6.printf("%zd\n",sizeof(&a));
7.printf("%zd\n",sizeof(*&a));
8.printf("%zd\n",sizeof(&a+1));
9.printf("%zd\n",sizeof(&a[0]));
10.printf("%zd\n",sizeof(&a[0]+1));

解析：

16 数组名放在sizeof内部表示整个数组，单位是字节
8 这里 a 是数组名，表示首元素地址，加 0 后不变
4 这里 a 是数组名，表示首元素地址，解引用后就是首元素，即 a[0]
所以*a – *(a + 0) – a[0]
8 这里 a + 1 是第二个元素的地址
4 第二个元素类型为 int
8 这里取整个数组的地址
16 这里的 * 和 & 抵消了，也就是 sizeof(a) ,访问整个数组
8 这里 &a + 1 跳过整个数组取地址
8 取第一个元素的地址
8 取第二个元素的地址

2.2 字符数组

代码1

char arr[] = {'a','b','c','d','e','f'};
1.printf("%zd\n", sizeof(arr));
2.printf("%zd\n", sizeof(arr+0));
3.printf("%zd\n", sizeof(*arr));
4.printf("%zd\n", sizeof(arr[1]));
5.printf("%zd\n", sizeof(&arr));
6.printf("%zd\n", sizeof(&arr+1));
7.printf("%zd\n", sizeof(&arr[0]+1));

解析：

6 数组名放在sizeof内部表示整个数组
8 这里 arr 是数组名，表示首元素地址，加 0 后不变
1 这里 arr 是数组名，表示首元素地址，解引用后就是首元素
1 表示第二个元素
8 这里取整个数组的地址
8 这里 &a + 1 跳过整个数组取地址
8 取第二个元素的地址

代码2

char arr[] = {'a','b','c','d','e','f'};
1.printf("%d\n", strlen(arr));
2.printf("%d\n", strlen(arr+0));
3.printf("%d\n", strlen(*arr));
4.printf("%d\n", strlen(arr[1]));
5.printf("%d\n", strlen(&arr));
6.printf("%d\n", strlen(&arr+1));
7.printf("%d\n", strlen(&arr[0]+1));

解析：

随机值没有 \0
随机值没有 \0
程序崩溃访问首元素，即 ‘a’ = 97 ，会把 97 当成地址去访问
程序崩溃访问第二个元素，即 ‘b’ = 98 ，会把 98 当成地址去访问
随机值 arr数组的地址，没有 \0
随机值跳过整个数组取地址，没有 \0
随机值取第二个元素的地址，没有 \0

代码3

char arr[] = "abcdef";
1.printf("%zd\n", sizeof(arr));
2.printf("%zd\n", sizeof(arr+0));
3.printf("%zd\n", sizeof(*arr));
4.printf("%zd\n", sizeof(arr[1]));
5.printf("%zd\n", sizeof(&arr));
6.printf("%zd\n", sizeof(&arr+1));
7.printf("%zd\n", sizeof(&arr[0]+1));

解析：

7 数组名放在sizeof内部表示整个数组
8 arr是首元素地址，加 0 后不变
1 访问首元素，即 a
1 访问第二个元素，即 b
8 这里是数组的地址，和首元素地址一样
8 跳过整个数组取地址
8 取第二个元素的地址

代码4

char arr[] = "abcdef";
1.printf("%d\n", strlen(arr));
2.printf("%d\n", strlen(arr+0));
3.printf("%d\n", strlen(*arr));
4.printf("%d\n", strlen(arr[1]));
5.printf("%d\n", strlen(&arr));
6.printf("%d\n", strlen(&arr+1));
7.printf("%d\n", strlen(&arr[0]+1));

解析：

6 arr是首元素地址，统计 \0 之前的字符长度
6 arr是首元素地址，统计 \0 之前的字符长度，加 0 后不变
程序崩溃访问首元素，即 ‘a’ = 97 ，会把 97 当成地址去访问
程序崩溃访问第二个元素，即 ‘b’ = 98 ，会把 98 当成地址去访问
6 &arr是数组的地址，即首元素地址，统计 \0 之前的字符长度
随机值跳过整个数组取地址，没有 \0
5 取第二个元素的地址，统计 \0 之前的字符长度

代码5

char *p = "abcdef";
1.printf("%zd\n", sizeof(p));
2.printf("%zd\n", sizeof(p+1));
3.printf("%zd\n", sizeof(*p));
4.printf("%zd\n", sizeof(p[0]));
5.printf("%zd\n", sizeof(&p));
6.printf("%zd\n", sizeof(&p+1));
7.printf("%zd\n", sizeof(&p[0]+1));

解析：

8 p 是指针变量，计算的是指针变量的大小
8 p+1是第二个元素地址
1 p 的大小是 char* ，所以 *p 只能访问一个字节
1 p[0] – *(p + 0) – *p ,访问一个字节
8 指针变量 p 的地址
8 跳过 p 变量取后面的地址
8 取第二个元素的地址

代码6

char *p = "abcdef";
1.printf("%d\n", strlen(p));
2.printf("%d\n", strlen(p+1));
3.printf("%d\n", strlen(*p));
4.printf("%d\n", strlen(p[0]));
5.printf("%d\n", strlen(&p));
6.printf("%d\n", strlen(&p+1));
7.printf("%d\n", strlen(&p[0]+1));

解析：

6 p 是指针变量，存放字符串的地址，统计 \0 之前的字符长度
5 指向第二个元素的地址
程序崩溃访问首元素，即 ‘a’ = 97 ，会把 97 当成地址去访问
程序崩溃 p[0] – *(p + 0) – *p，访问首元素，即 ‘a’ = 97 ，会把 97 当成地址去访问
随机值取指针变量 p 的地址，没有 \0
随机值跳过 p 变量取后面的地址，没有 \0
5 取第二个元素的地址，统计 \0 之前的字符长度

2.3 二维数组

int a[3][4] = {0};
1.printf("%zd\n",sizeof(a));
2.printf("%zd\n",sizeof(a[0][0]));
3.printf("%zd\n",sizeof(a[0]));
4.printf("%zd\n",sizeof(a[0]+1));
5.printf("%zd\n",sizeof(*(a[0]+1)));
6.printf("%zd\n",sizeof(a+1));
7.printf("%zd\n",sizeof(*(a+1)));
8.printf("%zd\n",sizeof(&a[0]+1));
9.printf("%zd\n",sizeof(*(&a[0]+1)));
10.printf("%zd\n",sizeof(*a));
11.printf("%zd\n",sizeof(a[3]));

解析：

48 数组名放在sizeof内部表示整个数组
4 第一行第一个元素
16 第一行数组名，计算第一行大小
8 a[0]+1则是将这个指针向后移动一个元素的位置
所以 a[0] + 1 – &a[0][0] + 1 – &a[0][1]
4 第一行第二个元素
8 第二行的地址
16 解引用第二行
8 第二行的地址
16 第二行解引用
16 第一行解引用
16 第四行

3.指针运算的试题深入解析

题1

#include <stdio.h>
int main()
{
 int a[5] = { 1, 2, 3, 4, 5 };
 int *ptr = (int *)(&a + 1);
 printf( "%d,%d", *(a + 1), *(ptr - 1));
 return 0;
}
//程序的结果是什么？

解析：

输出 2，5
1.首先，&a 取的是整个数组a的地址，数组的地址和数组首元素的地址在数值上是相同的，但类型不同，数组首元素的地址类型是 int ，而数组的地址类型是 int ()[5]（因为a是一个包含 5 个元素的数组）
2.然后，&a + 1 表示将指针向后移动一个数组的大小，由于数组 a 包含 5 个 int 类型的元素，每个int类型元素占 4 个字节，那么整个数组a在内存中所占字节数为 5×4 = 20字节，所以 &a + 1 实际上是指向了数组 a 所占内存空间之后的下一个位置
3.最后，(int *)(&a + 1) 将这个指向数组a之后位置的指针强制转换为 int * 类型的指针，也就是将其看作是指向一个int类型元素的指针，赋值给了ptr

*对于 (a + 1)：
数组名a在大多数情况下会被隐式转换为指向数组首元素的指针，所以 a + 1 就是将指向首元素的指针向后移动一个元素的位置，*(a + 1) 则是获取这个移动后指针所指向的元素，也就是数组a的第二个元素，其值为 2

*对于 (ptr - 1)：
ptr 是指向数组a所占内存空间之后的下一个位置，那么 ptr - 1 就是将这个指针向前移动一个元素的位置，*(ptr - 1) 就是获取这个移动后指针所指向的元素，也就是数组a的最后一个元素，其值为 5

题2

//在X86环境下
//假设结构体的⼤⼩是20个字节
//程序输出的结果是啥？
struct Test
{
 int Num;
 char *pcName;
 short sDate;
 char cha[2];
 short sBa[4];
}*p = (struct Test*)0x100000;
//定义了一个指向 Test 结构体的指针 p，并将其初始化为内存地址 0x100000
int main()
{
 printf("%p\n", p + 0x1);
 printf("%p\n", (unsigned long)p + 0x1);
 printf("%p\n", (unsigned int*)p + 0x1);
 return 0;
}

输出：0x100014，0x100001，0x100004

第一次输出：
将各成员所占字节数相加：4 + 4 + 2 + 2 + 8 = 20 字节
所以当 p + 0x1 时，指针会按照结构体大小移动，即从初始地址 0x100000 移动到 0x100000 + 20×1 = 0x100014，这里输出的结果应该是 0x100014

第二次输出：
这里将结构体指针 p 强制转换为 unsigned long 类型，然后进行加法运算，当把指针转换无符号长整型后，就不再按照结构体的大小进行指针移动的运算了，而是单纯的数值加法，因为 p 被初始化为 0x100000，将其视为无符号长整型并加上 0x1，得到的结果就0x100001，这里输出的结果应该是 0x100001

第三次输出：
这里将结构体指针 p 强制转换为 unsigned int* 类型的指针，然后进行加法运算，当 unsigned int* 类型的指针进行算术运算时，指针移动的步长是根据 unsigned int 类型的大小来确定的，在一般情况下，unsigned int 类型占 4 个字节，所以当 (unsigned int*)p + 0x1 时，指针会从初始地址 0x100000 移动到 0x100000 + 4×1 = 0x100004，这里输出的结果应该是 0x100004

题3

#include <stdio.h>
int main()
{
 int a[3][2] = { (0, 1), (2, 3), (4, 5) };
 int *p;
 p = a[0];
 printf( "%d", p[0]);
 return 0;
}

解析：

输出：1
a[0] 可以看作是指向二维数组 a 第一行，这里将 a[0] 赋值给指针 p，此时 p 就指向了数组 a 的第一行的第一个元素，也就是值为 1 的那个元素

题4

//假设环境是x86环境，程序输出的结果是啥？
#include <stdio.h>
int main()
{
 int a[5][5];
 int(*p)[4];
 p = a;
 printf( "%p,%d\n", &p[4][2] - &a[4][2], &p[4][2] - &a[4][2]);
 return 0;
}

解析：

输出：0xFFFFFFFC,-4

int(*p)[4], p = a 的图示
请添加图片描述

p[4][2] = ((p+4)+2)
所以地址减地址得到的是元素个数，又因为这里打印地址，所以以补码的形式打印

题5

#include <stdio.h>
int main()
{
 int aa[2][5] = { 1, 2, 3, 4, 5, 6, 7, 8, 9, 10 };
 int *ptr1 = (int *)(&aa + 1);
 int *ptr2 = (int *)(*(aa + 1));
 printf( "%d,%d", *(ptr1 - 1), *(ptr2 - 1));
 return 0;
}

解析：

输出：10，5

int *ptr1 = (int *)(&aa + 1)， int *ptr2 = (int )((aa + 1)) 如图所示

请添加图片描述

首先，&aa 取整个二维数组 aa 的地址加一
然后，aa + 1 指向了二维数组 aa 的第二行，*(aa + 1) 就是获取这个指针所指向的内容，也就是二维数组 aa 的第二行

*对于 (ptr1 - 1)：
ptr1 是指向数组 aa 所占内存空间之后的下一个位置，那么 ptr1 - 1 就是将这个指针向左移动一个元素的位置，*(ptr1 - 1) 就是获取这个移动后指针所指向的元素，也就是数组 aa 的最后一个元素，其值为 10

*对于 (ptr2 - 1)：
ptr2 是指向二维数组 aa 的第二行，那么 ptr2 - 1 就是将这个指针向左移动一个元素的位置，*(ptr2 - 1) 就是获取这个移动后指针所指向的元素，也就是二维数组 aa 的第一行的第五个元素，其值为 5

题6

#include <stdio.h>
int main()
{
 char *a[] = {"work","at","alibaba"};
 char**pa = a;
 pa++;
 printf("%s\n", *pa);
 return 0;
}

解析：

输出：at

char *a[ ] = {“work”,“at”,“alibaba”}， char**pa = a 如图所示
请添加图片描述

a 数组里分别存放三个字符串的地址，然后将该数组的地址存放到二级指针里，即第一个字符串的地址，pa++ 指向第二个字符串，然后解引用得到 at 的地址，但是这里使用 %s 占位符，所以当把 *pa 作为 %s 的参数传递给 printf 函数时，printf 函数会按照字符串的格式来处理它，即从这个指针所指向的位置开始，依次输出字符，直到遇到空字符（\0）为止，这样就输出了完整的字符串 “at”，而不是它的地址

题7

#include <stdio.h>
int main()
{
 char *c[] = {"ENTER","NEW","POINT","FIRST"};
 char**cp[] = {c+3,c+2,c+1,c};
 char***cpp = cp;
 printf("%s\n", **++cpp);
 printf("%s\n", *--*++cpp+3);
 printf("%s\n", *cpp[-2]+3);
 printf("%s\n", cpp[-1][-1]+1);
 return 0;
}

解析：

输出：POINT，EW，ST，NT

如图所示
请添加图片描述

第一次输出：

首先，++cpp 会使 cpp 指针自增，它现在指向 cp 数组中的第二个元素（也就是原来 cp[1] 的地址）。
然后，*cpp 会取出 cpp 所指向的元素，即 cp[1]，它是指向 c + 2 的指针（也就是指向字符串 “POINT” 的指针）。
最后，**cpp 再次间接访问，得到的就是字符串 “POINT”，所以这个 printf 语句会输出 “POINT”

第二次输出：

先看 ++cpp，这会使 cpp 再次自增，现在它指向 cp 数组中的第三个元素（原来 cp[2] 的地址）
然后 *++cpp 取出 cpp 所指向的元素，即 cp[2]，它是指向 c + 1 的指针（指向字符串 “NEW” 的指针）
接着 --*++cpp 会对 cp[2] 所指向的指针（也就是指向字符串 “NEW” 的指针）进行自减操作，此时它指向了字符串 “NEW” 中的倒数第二个字符（假设字符串以 \0 结尾，那么就是指向 ‘W’ 的指针）
最后 –++cpp + 3 会先取出这个新指向的字符（‘W’），然后再往后偏移 3 个字符，此时就指向了字符串 “NEW” 中的倒数第一个字符（‘W’ 往后 3 个字符，也就是 ‘W’ 本身，因为字符串 “NEW” 较短），所以这个 printf 语句会输出 “EW”

第三次输出：

cpp[-2] 相当于 *(cpp - 2)，因为前面 cpp 经过两次自增，现在要往回找两个位置，所以 cpp[-2] 指向的是原来 cp[0] 的地址
*cpp[-2] 取出 cpp[-2] 所指向的元素，即 cp[0]，它是指向 c + 3 的指针（指向字符串 “FIRST” 的指针）
*cpp[-2] + 3 会在指向字符串 “FIRST” 的指针基础上往后偏移 3 个字符，所以会指向字符串 “FIRST” 中的第 4 个字符，因此这个 printf 语句会输出 “ST”

第四次输出：

cpp[-1] 相当于 *(cpp - 1)，因为前面 cpp 经过两次自增，现在往回找一个位置，所以 cpp[-1] 指向的是原来 cp[1] 的地址
cpp[-1][-1] 相当于 ((cpp - 1) - 1)，也就是先找到 cp[1]（指向 c + 2 的指针，指向字符串 “POINT” 的指针），然后再对这个指针进行自减操作，此时它指向了字符串 “POINT” 中的倒数第二个字符
cpp[-1][-1] + 1 会在指向 ‘N’ 的指针基础上往后偏移 1 个字符，所以会指向字符串 “POINT” 中的倒数第一个字符（‘N’ 往后 1 个字符，也就是 ‘T’ 的指针），因此这个 printf 语句会输出 “NT”

今天的博客属实不易，有些题博主也想了很久才理解，也尽量用最简易易懂的方式给大家讲解每一道题，希望看完这篇 vlog ，以后不再害怕指针类型的题目，冬天到了，祝大家立冬快乐！

希望读者们多多三连支持

小编会继续更新

你们的鼓励就是我前进的动力！