2024年第三届钉钉杯大学生大数据挑战赛初赛赛题浅析

🕗 发布于 2024-07-27 14:09 钉钉 大数据

一图流

题目	涉及模型	所需背景知识	综合难度	题量	题目复杂度
初赛A：烟草营销案例数据分析	ARIMA, SARIMA, Prophet, 线性回归, LSTM, 随机森林, XGBoost	时间序列分析, 机器学习, 数据预处理, 统计学	中等	3个主要问题	涉及时间序列预测和集成学习模型
初赛B：医疗门诊患者及用药数据案例分析	RNN, LSTM, 线性回归, SVM, 集成学习(如Stacking, Blending)	时间序列分析, 机器学习, 数据预处理, 医疗数据分析	中等偏上	3个主要问题	涉及时间序列预测和集成学习模型, 医疗数据复杂性较高

AB题综合难度不大，难度可以视作0.4个国赛，题量可以看作0.35个国赛题量。适合于国赛前队伍练手，队伍内磨合。竞赛获奖率50%，八月底出成绩，参赛人数3000队左右。

A：烟草营销案例数据分析

1. 问题背景

烟草是我国重要的国家税收和财政收入来源。国家对烟草实行专卖制度，对烟草及其制品的生产和流通进行严格管理。数据来自某地区近些年多种品牌的烟草销售情况，已做脱敏和数据变换处理。

2. 解决问题

预测分析

1. 销量预测：

- 使用历史销售数据构建两个不同类型的时间序列预测模型，分别对A1、A2品牌的未来销量进行预测。

- 模型选择可以包括ARIMA模型、SARIMA模型、Prophet模型等。

2. 销售金额预测：

- 使用历史销售数据构建两个不同类型的时间序列预测模型，分别对A3、A4品牌的销售金额进行预测。

- 模型选择可以包括线性回归模型、LSTM神经网络模型等。

3. 集成学习：

- 在上述分别对销量及销售金额预测模型的基础上，构建集成学习模型，实现对A5品牌的销量和销售金额的联合预测。

- 可以考虑集成不同的预测模型，如随机森林、XGBoost等，以提高预测精度。

数据处理与模型选择

- 数据预处理：处理缺失值、异常值，进行数据归一化。

- 特征选择：选择影响销量和销售金额的重要特征，进行特征工程。

- 模型评估：使用准确率（Accuracy）、F1-score、AUC面积等指标评估模型性能。

B：医疗门诊患者及用药数据案例分析

1. 问题背景

智慧医疗的出现解决了传统医疗管理系统的不完善等问题。数据来自某医院近些年门诊医疗数据，已做脱敏和数据变换处理。

2. 解决问题

预测分析

1. 康复医学科一病房门诊收入预测：

- 以日期、患者人数、药品总收入、当日病房收入为基础输入数据，构建两个不同类型的时间序列预测模型，分别预测门诊收入数据。

- 模型选择可以包括RNN、LSTM等神经网络模型。

2. 康复医学科二病房门诊收入预测：

- 以相同的输入数据，构建两个不同类型的时间序列预测模型，分别预测门诊收入数据。

- 模型选择可以包括线性回归、支持向量机（SVM）等。

3. 集成学习：

- 结合上述两个模型，构建集成学习模型，针对康复医学科三病房，预测门诊收入数据。

- 可以考虑使用集成学习方法，如Stacking、Blending等，以提高预测准确性。

数据处理与模型选择

- 数据预处理：处理缺失值、异常值，进行数据归一化。

- 特征选择：选择影响门诊收入的重要特征，进行特征工程。

- 模型评估：使用准确率（Accuracy）、F1-score、AUC面积等指标评估模型性能。

原文地址：https://blog.csdn.net/qq_33690821/article/details/140712960

免责声明：本站文章内容转载自网络资源，如本站内容侵犯了原著者的合法权益，可联系本站删除。更多内容请关注自学内容网（zxcms.com）！

上一篇：实现文档的自动化发布与跨平台阅读
下一篇：使用在UE5中使用AirSim插件Eigen库头文件引用报错，出现报错的解决方式

配置cobbler服务提供centos7安装源
由RedHat公司基于python语言开发，作用：快速批量部署Linux系统。
阅读更多2024-09-17
【MySQL学习】基础指令全解：构建你的数据库技能
本文详细介绍了SQL操作指令的各种基础和高级操作，帮助读者掌握SQL数据库技巧。
阅读更多2024-09-17
OpenGL笔记二十一之几何类设计
— 2024-09-16 下午。
阅读更多2024-09-17
UiBot教程：实现复杂流程图的高效方法
我们需要在两个流程块之间传递“字符串格式的系统时间”，所以最简单的方法就是在流程图中定义一个变量。举个例子，我们可以创建一个名为x的流程图变量，这样在流程图所包含的所有流程块中都可以直接使用这个变量。
阅读更多2024-09-17
12 数组——27. 移除元素 ★
给你一个数组nums和一个值val，你需要原地移除所有数值等于val的元素，并返回移除后数组的新长度。
阅读更多2024-09-17
工资重回“3000块”时代
3000元是一个心理价位，但实际上对于许多家庭来说，可能在县城生活，除了基本的生活开销，很难剩下更多的钱。也就是说，如果你的工作收入在这个“五千块定律”所设定的范围内，并且在三年内没有超过平均水平的涨
阅读更多2024-09-17
谷歌向安卓用户推出Gemini Live聊天机器人
即使你的手机处于锁定状态，屏幕处于关闭状态，你也可以开始与助手交谈，而且还可以通过谷歌(Google)的新款Pixel Buds Pro 2无线耳机进行访问，这样你就可以在手机放在包里的时候免提通话。
阅读更多2024-09-17
Linux进阶命令-sed&split
sed（Stream Editor）是一个流编辑器，用于在文本流中进行文本替换和转换操作。它通常用于命令行环境下，可以接受标准输入（stdin）、文件内容或管道输入，并对文本进行修改或处理。
阅读更多2024-09-17
RTMP直播播放器的几种选择
在选择RTMP直播播放器时，需要根据具体的应用场景、平台兼容性、功能需求以及用户体验等因素进行综合考虑。同时，也可以参考其他用户的评价和专业评测来选择最适合的播放器。
阅读更多2024-09-17
Linux套接字
套接字是实现网络通信的核心组件，它提供了灵活且强大的接口，使得开发者能够轻松地在网络环境中构建复杂的应用程序。无论是TCP还是UDP协议，都可以通过适当的套接字类型来满足不同的通信需求.
阅读更多2024-09-17

2024年第三届钉钉杯大学生大数据挑战赛初赛赛题浅析

一图流

A：烟草营销案例数据分析

1. 问题背景

2. 解决问题

预测分析

B：医疗门诊患者及用药数据案例分析

1. 问题背景

2. 解决问题

相关文章