【Java】性能优化——使用Map实现多列表数据合并

🕗 发布于 2025-01-15 08:05 java 后端

前言

在实际开发中，经常会有需求是在多张表中查找具有相同字段的数据，然后将这多张表中的数据按照需求进行合并，许多开发者会使用for 循环嵌套。这种写法效率较低且不够优雅，本文提供一种使用Map合并数据的优化方法。

1.示例

假设我们有三个返回类：

@Data
public class LaborCostDetailRes {
    /**
     * 年月
     */
    private String date;
    /**
     * 人工成本
     */
    private BigDecimal laborCost;
}

@Data
public class OtherCostDetailRes {
    /**
     * 年月
     */
    private String date;
    /**
     * 其他成本
     */
    private BigDecimal otherCost;

}

@Data
public class CashFlowRes {
    /**
     * 年月
     */
    private String date;
    /**
     * 销售收入
     */
    private BigDecimal saleAmount;
    /**
     * 人工成本
     */
    private BigDecimal laborCost;
    /**
     * 其他成本
     */
    private BigDecimal otherCost;

}

而我们需要将LaborCostDetailRes的laborCost和OtherCostDetailRes的otherCost设置到CashFlowRes的对应字段中，通常我们可能这样写：

// 查询出所有的CashFlowRes集合
List<CashFlowRes> cashFlowRes = cashFlowMapper.list();
// 查询出所有LaborCostDetailRes集合
List<LaborCostDetailRes> laborCostDetailRes = staffSalaryMapper.listLaborCost();
// 查询出所有otherCostDetailRes集合
List<OtherCostDetailRes> otherCostDetailRes = costManagementMapper.listOtherCost();

for (CashFlowRes cashFlow : cashFlowRes) {
String cashFlowDate = cashFlow.getDate();

// 遍历laborCostDetailRes
for (LaborCostDetailRes laborCost : laborCostDetailRes) {
String laborCostDate = laborCost.getDate();
if (cashFlowDate.equals(laborCostDate)) {
cashFlow.setLaborCost(laborCost.getLaborCost());
break; 
}
}

// 遍历otherCostDetailRes
for (OtherCostDetailRes otherCost : otherCostDetailRes) {
String otherCostDate = otherCost.getDate();
if (cashFlowDate.equals(otherCostDate)) {
cashFlow.setOtherCost(otherCost.getOtherCost());
break; 
}
}
}

时间复杂度分析

1.外层循环：

外层循环遍历 cashFlowRes 列表，假设 cashFlowRes 的长度为 n。

2.内层循环遍历 laborCostDetailRes：

对于 cashFlowRes 中的每个元素，内层循环遍历 laborCostDetailRes 列表，假设 laborCostDetailRes 的长度为 m。
在最坏情况下，内层循环需要遍历整个 laborCostDetailRes 列表才能找到匹配的日期。
因此，内层循环的时间复杂度为 O(m)。

3.内层循环遍历 otherCostDetailRes：

同样地，对于 cashFlowRes 中的每个元素，内层循环遍历 otherCostDetailRes 列表，假设 otherCostDetailRes 的长度为 p。
在最坏情况下，内层循环需要遍历整个 otherCostDetailRes 列表才能找到匹配的日期。
因此，内层循环的时间复杂度为 O( p)。

总时间复杂度

将上述时间复杂度结合起来，整个方法的时间复杂度为：

外层循环的时间复杂度为 O(n)。
每次外层循环中，有两个内层循环，分别的时间复杂度为 O(m) 和 O( p)。

因此，总的时间复杂度为：O(n * (m + p))

这种方法在数据量较大时可能会导致性能问题，因为时间复杂度较高。如果数据量较大，建议使用 Map 来优化性能。

// 查询出所有的CashFlowRes集合
List<CashFlowRes> cashFlowRes = cashFlowMapper.list();
// 查询出所有LaborCostDetailRes集合
List<LaborCostDetailRes> laborCostDetailRes = staffSalaryMapper.listLaborCost();
// 查询出所有otherCostDetailRes集合
List<OtherCostDetailRes> otherCostDetailRes = costManagementMapper.listOtherCost();

mergeCashFlow(laborCostDetailRes,otherCostDetailRes,cashFlowPOList);

public void mergeCashFlow(List<LaborCostDetailRes> laborCostDetailRes,
  List<OtherCostDetailRes> otherCostDetailRes,
  List<CashFlowPO> cashFlowPOList) {

Map<String, BigDecimal> laborMap = createMap(laborCostDetailRes, LaborCostDetailRes::getDate, LaborCostDetailRes::getLaborCost);
Map<String, BigDecimal> otherMap = createMap(otherCostDetailRes, OtherCostDetailRes::getDate, OtherCostDetailRes::getOtherCost);

if (cashFlowResList != null) {
for (CashFlowRes cashFlowRes : cashFlowResList) {
if (cashFlowRes!= null && cashFlowRes.getDate() != null) {
String yearMonth = cashFlowRes.getDate();
cashFlowRes.setLaborCost(laborMap.getOrDefault(yearMonth, BigDecimal.ZERO));
cashFlowRes.setOtherCost(otherMap.getOrDefault(yearMonth, BigDecimal.ZERO));
}
}
}
}

/**
* 转换为一个日期到金额的 Map映射
* @param list
* @param dateExtractor
* @param amountExtractor
* @return
* @param <T>
*/
private <T> Map<String, BigDecimal> createMap(List<T> list, Function<T, String> dateExtractor, Function<T, BigDecimal> amountExtractor) {
Map<String, BigDecimal> map = new HashMap<>();
if (list != null) {
for (T item : list) {
if (item != null) {
String date = dateExtractor.apply(item);
BigDecimal amount = amountExtractor.apply(item);
if (date != null) {
map.put(date, amount);
}
}
}
}
return map;
}

时间复杂度分析

1.createMap 方法：

createMap 方法的时间复杂度为 O(k)，其中 k 是列表的长度。
对于 laborCostDetailRes，时间复杂度为 O(m)，其中 m 是 laborCostDetailRes 的长度。
对于 otherCostDetailRes，时间复杂度为 O( p)，其中 p 是 otherCostDetailRes 的长度。

2.mergeCashFlow 方法：

遍历 cashFlowResList 的时间复杂度为 O(n)，其中 n 是 cashFlowResList 的长度。
对于每个 CashFlowRes 对象，从 laborMap 和 otherMap 中获取值的时间复杂度为 O(1)，因为 HashMap 的查找操作平均时间复杂度为 O(1)。

总时间复杂度

将上述时间复杂度结合起来，整个方法的时间复杂度为：

查询数据的时间复杂度可以忽略，假设数据已经加载到内存中。
createMap 方法的时间复杂度为 O(m + p)。
mergeCashFlow 方法的时间复杂度为 O(n)。

因此，总的时间复杂度为：O(m + p + n)

显然，使用 Map 进行数据合并可以显著提高性能，特别是在处理大量数据时，因为查找操作的时间复杂度为 O(1)。

2.总结

特性	嵌套 for 循环	使用 Map
时间复杂度	O(n * (m + p))	O(m + p + n)
性能	较差，数据量大时性能下降显著	较好，数据量大时性能优势明显
代码简洁性	简单直观，但代码冗长	代码简洁，易于维护和扩展
内存开销	低	高，需要额外的 Map 结构
扩展性	难以扩展，添加数据源时代码冗长	容易扩展，只需添加更多的 Map

对于大多数实际应用场景，特别是数据量较大的情况，推荐使用使用 Map 的方法。虽然它需要额外的内存开销，但显著提高了性能和代码的可维护性。

原文地址：https://blog.csdn.net/weixin_50591390/article/details/145133181

免责声明：本站文章内容转载自网络资源，如本站内容侵犯了原著者的合法权益，可联系本站删除。更多内容请关注自学内容网（zxcms.com）！

上一篇：在嵌入式系统中，flash和ram的区别和联系是什么？
下一篇：微信小程序实现拼图功能

Debian没有reboot命令记录
在安装服务并按照官方推荐的方式安装 Debian 系统时，发现无法使用 reboot 命令。经过一番排查，发现问题的根源在于系统环境变量中未包含常用命令所在的路径。具体来说，/sbin/ 和 /usr
阅读更多2025-01-16
BI 是如何数据分析的？
但商业智能BI在获取数据的接口不一样，是与业务系统软件自身无关的，是只需要访问和连接业务系统背后的数据库就可以的，直接从数据库取数，因此是不需要软件接口，或者没有软件接口访问这种概念的。这种独立的、单
阅读更多2025-01-16
jenkins 入门到精通
1.以root用户进入jenkins容器中。2.找配置文件 config.xml。3.编辑 config.xml 文件。
阅读更多2025-01-16
国外集中式存储产品升级替换的评估与实践
以 SMTX ZBS 同时实现架构升级与国产替代。
阅读更多2025-01-16
STM32H7通过CUBEMX初始化移植LWIP，DHCP建立RAW TCP服务器，不停发成功
本篇文章讲述stm32H7系列单片机。STM32CUBEMX初始化，实现LWIP移植，RAW TCP服务器端，DHCP获取地址，不停发数据测试。
阅读更多2025-01-16
【21天学习AI底层概念】day13 （kaggle新手入门教程）Exercise: Underfitting and Overfitting
网址：https://www.kaggle.com/code/meirou674/exercise-underfitting-and-overfitting/edit。
阅读更多2025-01-16
ESXI 安装教程(3) ---vCenter Server 安装
6. 证书,有效问题导致此提示,非专业网络管理人员,不知道如何处理,此处点是即可。2.打开文件路径双击运行文件installer.exe。----后续找百度吧, 硬件不支持了。证书有效开始时间是安装
阅读更多2025-01-16
操作系统笔记
记录不是很清楚的地方or重难点部分（加**），以及面试常见题，主要参考小林coding & 各大面经。小林coding链接：计算机网络updating …
阅读更多2025-01-16
【零基础入门unity游戏开发——unity3D篇】地形Terrain的使用介绍
地形Terrain的使用介绍
阅读更多2025-01-16
leetcode刷题记录（五十六）——53. 最大子数组和
给你一个整数数组nums，请你找出一个具有最大和的连续子数组（子数组最少包含一个元素），返回其最大和。是数组中的一个连续部分。6连续子数组 [4,-1,2,1] 的和最大，为 6。
阅读更多2025-01-16

【Java】性能优化——使用Map实现多列表数据合并

前言

1.示例

2.总结

相关文章