图的广度优先搜索 | 433. 最小基因变化 + 127. 单词接龙

🕗 发布于 2024-07-25 01:27 算法图的广度优先搜索

1 433. 最小基因变化

解题思路：

把一个基因序列视作图中的一个结点；
若两个基因序列之间能够互相转换，则它们之间有边；

从而将问题转换为：寻找 $\mathrm{startGene}$ 结点到 $\mathrm{endGene}$ 结点的最短路径长度。

思路说明图：

在这里插入图片描述

根据题意可得，能够相互转换的两个基因序列之间只能有一个字符不同。由于基因序列 $\mathrm{AACCGGTT}$ 和基因序列 $\mathrm{AACCGGTA}$ 只相差一个字符，即可以相互转换，因此两者之间有边。其他结点同理。

说明：假设基因 $\mathrm{A}$ 可以向基因 $\mathrm{B}$ 转换，那么必然有基因 $\mathrm{B}$ 可以向基因 $\mathrm{A}$ 转换，因此图中的边应该是双向边，只是这里省略成了无向边。除此之外，相同颜色的箭头表示同属于一轮的遍历， $\mathrm{1}$ 表示两个基因序列之间只相差一个字符。

1.1 代码细节

Step1：基础的判断

if (startGene == endGene)
  return 0;

unordered_set<string> genes;
for (auto & gene : bank)
  genes.insert(gene);

if (!genes.count(endGene))
  return -1;

如果 $\mathrm{startGene=endGene}$ ，那么不需要转换；
如果 $\mathrm{bank}$ 中没有 $\mathrm{endGene}$ ，那么 $\mathrm{startGene}$ 无法转换为 $\mathrm{endGene}$ 。

Step2：构造图

由于题目没有给出 $\mathrm{bank}$ 中各个基因序列之间的转换关系，因此需要我们自己去构建。代码如下：

int m = startGene.size();
int n = bank.size();
vector<vector<int>> adj(n);
for (int i = 0; i < n; ++i) {
  for (int j = 0; j < n; ++j) {
    int differ = 0;
    for (int k = 0; k < m; ++k) {
      if (bank[i][k] != bank[j][k])
        ++differ;
    }
    if (differ == 1) {
      adj[i].push_back(j);
      adj[j].push_back(i);
    }
  }
}

其中 $\mathrm{adj}$ 数组用于存储基因序列之间的转换关系， $\mathrm{adj[i]}$ 表示基因序列 $\mathrm{i}$ 能够转换得到的所有基因序列。

说明：把 $\mathrm{bank}$ 中的基因序列视作一个个的结点，该步骤实际上就是为它们寻找自己的相邻结点。

Step3：初始化图的遍历

在二叉树的广度优先搜索中，我们每次都会把当前结点的子结点压入队列中，以便在下一轮遍历中弹出并访问，这对于图的广度优先搜索也不例外。在本题中，由于不知道 $\mathrm{startGene}$ 的子结点都有哪些，因此在进行图的广度优先搜索之前，我们需要先找出 $\mathrm{startGene}$ 的子结点。代码如下：

queue<int> q;
vector<int> visited(n);
for (int i = 0; i < n; ++i) {
  int differ = 0;
  for (int k = 0; k < m; ++k) {
    if (startGene[k] != bank[i][k])
      ++differ;
  }
  if (differ == 1) {
    q.emplace(i);
    visited[i] = 1;
  }
}

由于 $\mathrm{bank}$ 包含了所有有效的转换结果，因此我们在 $\mathrm{bank}$ 中查找 $\mathrm{startGene}$ 可能的子结点即可。

说明：由于图的广度优先搜索与二叉树的广度优先搜索不同，它可能遍历到先前已经被遍历过的结点，因此设置 $\mathrm{visited}$ 数组来记录已经被遍历过的结点。

Step4：图的遍历

图的广度优先搜索如下：

int step = 1;
while (!q.empty()) {
  int size = q.size();
  for (int i = 0; i < size; ++i) {
    int p = q.front();
    q.pop();
    if (bank[p] == endGene)
      return step;
    // 遍历当前基因的所有邻接基因
    for (auto & next : adj[p]) {
      if (visited[next])
        continue;
      // 若未被访问过，则插入到队列中
      q.emplace(next);
      visited[next] = 1;
    }
  }
  ++step;
}

1.2 完整代码

int minMutation(string startGene, string endGene, vector<string>& bank) {
  // 基础的判断
  if (startGene == endGene)
    return 0;

  unordered_set<string> genes;
  for (auto & gene : bank)
    genes.insert(gene);

  if (!genes.count(endGene))
    return -1;

  // 计算每个基因的邻接基因
  int m = startGene.size();
  int n = bank.size();
  vector<vector<int>> adj(n);
  for (int i = 0; i < n; ++i) {
    for (int j = 0; j < n; ++j) {
      int differ = 0;
      for (int k = 0; k < m; ++k) {
        if (bank[i][k] != bank[j][k])
          ++differ;
      }
      if (differ == 1) {
        adj[i].push_back(j);
        adj[j].push_back(i);
      }
    }
  }

  // 计算startGene的邻接基因
  queue<int> q;
  vector<int> visited(n);
  for (int i = 0; i < n; ++i) {
    int differ = 0;
    for (int k = 0; k < m; ++k) {
      if (startGene[k] != bank[i][k])
        ++differ;
    }
    if (differ == 1) {
      q.emplace(i);
      visited[i] = 1;
    }
  }

  int step = 1;
  while (!q.empty()) {
    int size = q.size();
    for (int i = 0; i < size; ++i) {
      int p = q.front();
      q.pop();
      if (bank[p] == endGene)
        return step;
      // 遍历当前基因的所有邻接基因
      for (auto & next : adj[p]) {
        if (visited[next])
          continue;
        // 若未被访问过，则插入到队列中
        q.emplace(next);
        visited[next] = 1;
      }
    }
    ++step;
  }
  return -1;
}

2 127. 单词接龙

与「433. 最小基因变化」类似，本题认为能够相互转换的单词只能相差一个字母，因此照搬「433. 最小基因变化」的解法即可。思路说明图如下：

在这里插入图片描述

说明：由于在图的广度优先搜索中设置了 $\mathrm{visited}$ 数组来记录已经被遍历过的结点，因此可以看到上图中没有任何结点被遍历过两次，即同时被两个箭头所指向。

int ladderLength(string beginWord, string endWord, vector<string>& wordList) {
  // 基础的判断
  if (beginWord == endWord)
    return 0;

  unordered_set<string> words;
  for (auto & word : wordList)
    words.insert(word);
  
  if (!words.count(endWord))
    return 0;
  
  // 计算每个单词的邻接单词
  int m = beginWord.size();
  int n = wordList.size();
  vector<vector<int>> adj(n);
  for (int i = 0; i < n; ++i) {
    for (int j = i + 1; j < n; ++j) {
      int differ = 0;
      for (int k = 0; k < m; ++k) {
        if (wordList[i][k] != wordList[j][k])
          ++differ;
      }
      if (differ == 1) {
        adj[i].push_back(j);
        adj[j].push_back(i);
      }
    }
  }

  // 计算beginWord的邻接单词
  queue<int> q;
  vector<int> visited(n);
  for (int i = 0; i < n; ++i) {
    int differ = 0;
    for (int k = 0; k < m; ++k) {
      if (beginWord[k] != wordList[i][k])
        ++differ;
    }
    if (differ == 1) {
      q.emplace(i);
      visited[i] = 1;
    }
  }

  int step = 2;
  while (!q.empty()) {
    int size = q.size();
    for (int i = 0; i < size; ++i) {
      int p = q.front();
      q.pop();
      if (wordList[p] == endWord)
        return step;
      for (auto & next : adj[p]) {
        if (visited[next])
          continue;
        q.emplace(next);
        visited[next] = 1;
      }
    }
    ++step;
  }
  return 0;
}

原文地址：https://blog.csdn.net/m0_64140451/article/details/140672609

免责声明：本站文章内容转载自网络资源，如本站内容侵犯了原著者的合法权益，可联系本站删除。更多内容请关注自学内容网（zxcms.com）！

上一篇：7月投稿警惕！6本On Hold期刊被数据库剔除！
下一篇：《昇思 25 天学习打卡营第 21 天 | LSTM+CRF序列标注模型实现》

Cellebrite UFED 4PC 7.70 下载 - Android 和 iOS 移动设备取证软件
Cellebrite UFED 4PC 7.70 下载 - Android 和 iOS 移动设备取证软件
阅读更多2024-09-20
快速掌握Postman接口测试
在前后端分离开发时，后端工作人员完成系统接口开发后，需要与前端人员对接，测试调试接口，验证接口的正确性可用性。而这要求前端开发进度和后端进度保持基本一致，任何一方的进度跟不上，都无法及时完成功能模块的
阅读更多2024-09-20
洛谷 P4683 [IOI2008] Type Printer
当时想法：当时看了题目标签，就有思路了（见代码注释），但一直RE+WA最后只剩下RE。众所周知，字典树很好地利用了字符串的公共前缀，这也就是上一行出现的原因。如果我们想要操作数尽可能少，那我们的删除数
阅读更多2024-09-20
前端——表格、列表标签
前端、web开发、表格标签、列表标签、无序列表、有序列表、table、ul li、oi li、dl dt dd
阅读更多2024-09-20
Docker UI强大之处？
DockerUI是一款由国内开发者打造的优秀Docker可视化管理工具。它拥有简洁直观的用户界面，使得Docker主机管理、集群管理和任务编排变得轻松简单。DockerUI不仅能展示资源利用率、系统信
阅读更多2024-09-20
分布式缓存服务Redis版解析与配置方式
Redis是一款高性能的键值对（Key-Value）存储系统，通常用作分布式缓存服务。它基于内存运行，支持丰富的数据类型，并具备高并发、低延迟的特点，非常适合用于缓存需要频繁访问的数据，以加快用户访问
阅读更多2024-09-20
力扣 167.两数之和||—输入为有序数组
利用相向双指针，初始时l在最用左边，r在最右边1.numbers[l] + numbers[r] < target 则 l++2.numbers[l] + numbers[r] < ta
阅读更多2024-09-20
docker中图形化界面的转发
docker中图形界面转发
阅读更多2024-09-20
数据库基础知识---------------------------（3）
MYSQL的事务索引优化视图以及常见的窗口函数
阅读更多2024-09-20
自闭症儿童寄宿学校：打造良好的学习和生活环境
星贝育园康复中心在打造良好的学习和生活环境方面，显然投入了大量的心血和努力，以确保自闭症儿童能够在最佳状态下接受康复训练。
阅读更多2024-09-20

图的广度优先搜索 | 433. 最小基因变化 + 127. 单词接龙

目录

1 433. 最小基因变化

1.1 代码细节

1.2 完整代码

2 127. 单词接龙

相关文章