排序题目:根据字符出现频率排序
题目
标题和出处
标题:根据字符出现频率排序
难度
3 级
题目描述
要求
给定一个字符串 s \texttt{s} s,根据字符出现的频率对其进行降序排序。一个字符出现的频率是它出现在字符串中的次数。
返回排序后的字符串。如果有多个答案,返回其中任何一个。
示例
示例 1:
输入:
s
=
"tree"
\texttt{s = "tree"}
s = "tree"
输出:
"eert"
\texttt{"eert"}
"eert"
解释:
‘e’
\texttt{`e'}
‘e’ 出现两次,
‘r’
\texttt{`r'}
‘r’ 和
‘t’
\texttt{`t'}
‘t’ 都出现一次。因此
‘e’
\texttt{`e'}
‘e’ 必须出现在
‘r’
\texttt{`r'}
‘r’ 和
‘t’
\texttt{`t'}
‘t’ 之前。
"eetr"
\texttt{"eetr"}
"eetr" 也是一个有效的答案。
示例 2:
输入:
s
=
"cccaaa"
\texttt{s = "cccaaa"}
s = "cccaaa"
输出:
"cccaaa"
\texttt{"cccaaa"}
"cccaaa"
解释:
‘c’
\texttt{`c'}
‘c’ 和
‘a’
\texttt{`a'}
‘a’ 都出现三次,因此
"cccaaa"
\texttt{"cccaaa"}
"cccaaa" 和
"aaaccc"
\texttt{"aaaccc"}
"aaaccc" 也是有效的答案。注意
"cacaca"
\texttt{"cacaca"}
"cacaca" 是不正确的,因为相同的字母必须放在一起。
示例 3:
输入:
s
=
"Aabb"
\texttt{s = "Aabb"}
s = "Aabb"
输出:
"bbAa"
\texttt{"bbAa"}
"bbAa"
解释:
"bbaA"
\texttt{"bbaA"}
"bbaA" 也是一个有效的答案,但
"Aabb"
\texttt{"Aabb"}
"Aabb" 是不正确的。注意
‘A’
\texttt{`A'}
‘A’ 和
‘a’
\texttt{`a'}
‘a’ 被认为是两个不同的字符。
数据范围
- 1 ≤ s.length ≤ 5 × 10 5 \texttt{1} \le \texttt{s.length} \le \texttt{5} \times \texttt{10}^\texttt{5} 1≤s.length≤5×105
- s \texttt{s} s 由大小写英语字母和数字组成
解法
思路和算法
这道题要求将给定的字符串按照字符频率降序排序,因此需要获得每个字符的频率,然后排序。
首先遍历字符串获得每个字符的频率,然后定义二元组类型存储每个字符和频率,使用列表存储全部二元组,并对列表排序。列表排序的方法是根据频率降序排序。
遍历排序后的列表,对于列表中的每个二元组,将字符根据频率填入结果字符串中。遍历结束之后即可得到完整的排序后的字符串。
由于将字符填入结果字符串时,只有当一个字符根据频率全部填入结果字符串之后才会填入另一个字符,因此相同字符在结果字符串中的下标一定是连续的。
代码
class Solution {
class Pair {
char ch;
int freq;
public Pair(char ch, int freq) {
this.ch = ch;
this.freq = freq;
}
}
public String frequencySort(String s) {
Map<Character, Integer> counts = new HashMap<Character, Integer>();
int length = s.length();
for (int i = 0; i < length; i++) {
char ch = s.charAt(i);
counts.put(ch, counts.getOrDefault(ch, 0) + 1);
}
List<Pair> pairs = new ArrayList<Pair>();
Set<Map.Entry<Character, Integer>> entries = counts.entrySet();
for (Map.Entry<Character, Integer> entry : entries) {
char ch = entry.getKey();
int freq = entry.getValue();
pairs.add(new Pair(ch, freq));
}
Collections.sort(pairs, (a, b) -> b.freq - a.freq);
StringBuffer sorted = new StringBuffer();
for (Pair pair : pairs) {
char ch = pair.ch;
int freq = pair.freq;
for (int i = 0; i < freq; i++) {
sorted.append(ch);
}
}
return sorted.toString();
}
}
复杂度分析
-
时间复杂度: O ( n + k log k ) O(n + k \log k) O(n+klogk),其中 n n n 是字符串 s s s 的长度, k k k 是不同字符的类型,这道题中的字符类型包括大小写英语字母和数字, k = 26 + 26 + 10 = 62 k = 26 + 26 + 10 = 62 k=26+26+10=62。遍历字符串需要 O ( n ) O(n) O(n) 的时间,排序需要 O ( k log k ) O(k \log k) O(klogk) 的时间,因此时间复杂度是 O ( n + k log k ) O(n + k \log k) O(n+klogk)。
-
空间复杂度: O ( n + k ) O(n + k) O(n+k),其中 n n n 是字符串 s s s 的长度, k k k 是不同字符的类型,这道题中的字符类型包括大小写英语字母和数字, k = 26 + 26 + 10 = 62 k = 26 + 26 + 10 = 62 k=26+26+10=62。空间复杂度主要取决于哈希表、列表和生成的排序后的字符串。
原文地址:https://blog.csdn.net/stormsunshine/article/details/125495137
免责声明:本站文章内容转载自网络资源,如本站内容侵犯了原著者的合法权益,可联系本站删除。更多内容请关注自学内容网(zxcms.com)!