传知代码-深度知识追踪(论文复现)

🕗 发布于 2024-07-12 19:54 深度学习 目标跟踪论文笔记 人工智能

代码以及视频讲解

本文所涉及所有资源均在传知代码平台可获取

1. 论文概述

知识追踪的任务是对学生的知识进行建模，以便准确预测学生在未来的学习互动中的表现。简言之，我们利用学生的历史答题序列数据，通过分析学生与题目的交互结果，来推断学生当前的知识水平以及题目的特征，从而预测学生在未来题目上的表现。过去的模型大多依赖于人工定义的交互函数，例如IRT模型，该模型定义了学生能力参数以及题目的难度、区分度和猜测性参数。虽然也有改进不依赖交互函数的模型，如刘淇提出的NeuralCD模型，但它们更适用于对学生历史答题数据的静态评估，无法实现动态追踪，存在冷启动问题。
深度知识追《Deep Knowledge Tracing》踪将时间上“深度”的灵活递归神经网络(RNN)应用到知识追踪任务中。这一系列模型使用大量的人工“神经元”来表示潜在的知识状态及其时间动态，并且允许从数据中学习学生知识的潜在变量表示，而不是直接硬编码。通过这种方法，深度知识追踪模型解决了冷启动问题，并且能够动态追踪学生的知识状态变化，使得模型更适用于真实的学习情境。
这里对EduKTM的DKT方法进行改进，修改了参数，提高了正确率。

2. 论文方法

传统的递归神经网络(RNNs)将输入序列映射为输出序列，这是通过计算一系列隐藏状态实现的，隐藏状态可以被看做来自过去观测的相关信息的编码，用于对未来的预测，如下图所示：
在这里插入图片描述

具体地说，DKT首先根据学生的历史做题情况将每个学生的交互转换为输入序列，以便RNN模型可以处理。对于唯一练习数量较少的数据集，使用one-hot编码表示学生的每次交互，其中包括练习题的编号以及学生是否正确回答。而对于具有大量唯一练习的数据集，则采用随机向量表示每个交互，以避免one-hot编码的维度爆炸问题。
接着，DKT使用RNN模型对转换后的学生交互序列进行训练。这些模型将学生的历史信息编码为一系列隐藏状态，从而捕捉学生知识状态的时间动态。最后，DKT输出一个与练习数量相等的向量，其中每个条目表示学生在相应练习上回答正确的预测概率。通过这种方式，DKT能够实现对学生知识状态的动态追踪，从而提高了对学生未来表现的预测准确性。同时，由于采用了RNN等深度学习模型，DKT还能够适应不同规模和复杂度的学生交互数据集，具有较好的泛化能力。

3. 实验部分

3.1 数据集

Assistment 数据集是一个用于教育领域的常用数据集，用于研究和评估教育技术和学习分析模型。该数据集由来自辅助学习（Assistments）在线学习平台的真实学生交互数据组成。这些数据包括学生对在线练习题的回答情况、每个练习的元数据（如题目内容、难度等）、学生的个人信息（如年级、性别等）以及其他与学习过程相关的信息。
在这里插入图片描述

3.2 实验步骤

step1:安装环境依赖

在这里插入图片描述

step2:下载数据集，将其变成one-hot编码

在这里插入图片描述

step3:进行训练

在这里插入图片描述

3.3 实验结果

在这里插入图片描述

4 关键代码

import numpy as np
import torch
import torch.utils.data as Data
from torch.utils.data.dataset import Dataset
import tqdm


NUM_QUESTIONS = 123
BATCH_SIZE = 64
HIDDEN_SIZE = 10
NUM_LAYERS = 1


def get_data_loader(data_path, batch_size, shuffle=False):
    data = torch.FloatTensor(np.load(data_path))
    data_loader = Data.DataLoader(data, batch_size=batch_size, shuffle=shuffle)
    return data_loader


train_loader = get_data_loader('./data/2009_skill_builder_data_corrected/train_data.npy', BATCH_SIZE, True)
test_loader = get_data_loader('./data/2009_skill_builder_data_corrected/test_data.npy', BATCH_SIZE, False)
#%% md
# Training and Persistence
#%%
import logging
logging.getLogger().setLevel(logging.INFO)
#%%
from EduKTM import DKT

dkt = DKT(NUM_QUESTIONS, HIDDEN_SIZE, NUM_LAYERS)
dkt.train(train_loader, epoch=30)
dkt.save("dkt.params")
#%% md
# Loading and Testing
#%%
dkt.load("dkt.params")
auc = dkt.eval(test_loader)
print("auc: %.6f" % auc)

源码下载

原文地址：https://blog.csdn.net/chuanzhi_tech/article/details/140386241

免责声明：本站文章内容转载自网络资源，如本站内容侵犯了原著者的合法权益，可联系本站删除。更多内容请关注自学内容网（zxcms.com）！

上一篇：从零开始学习嵌入式----C语言数组指针
下一篇：从零设计一个神经网络：实现手写数字识别

【工具类】JAVA开发从SFTP服务器下载文件
SFTP工具类，打成JAR文件后直接放到服务器上执行。
阅读更多2024-11-05
【linux】HTTPS 协议原理
HHTPS协议
阅读更多2024-11-05
鸿蒙HarmonyOS开发：给应用添加基础类型通知和进度条类型通知（API 12）
通知旨在让用户以合适的方式及时获得有用的新消息，帮助用户高效地处理任务。显示接收到的短消息、即时消息等。显示应用的推送消息，如广告、版本更新等。显示当前正在进行的事件，如下载等。
阅读更多2024-11-05
Centos 网络接口打vlan标签
本次使用给bond打vlan标签，其实其他普通接口也一样。查询802.1q 模块是否加载。2.1. 创建bond配置文件。本次实验使用bond1 模式。给bond0 接口打标签。重启网络查看vlan标
阅读更多2024-11-05
libaom 源码分析：帧内方向预测模式
libaom 源码分析：帧内方向预测模式
阅读更多2024-11-05
java版CRM客户关系管理系统源码-CRM客户关系管理系统的技术架构与功能实现
本CRM客户关系管理系统通过整合待办事项、线索、客户、联系人、商机、合同、回款等多个功能模块，为企业提供了一套全面、高效的客户关系管理解决方案。系统采用先进的技术架构和灵活的配置方式，能够满足企业
阅读更多2024-11-05
【数学二】线性代数-矩阵-初等变换、初等矩阵
【数学二】线性代数-矩阵-初等变换、初等矩阵
阅读更多2024-11-05
京准时钟：无人机卫星信号安全防护隔离装置
京准时钟：无人机卫星信号安全防护隔离装置
阅读更多2024-11-05
Blender进阶：着色器节点
着色点着色点UV坐标取得UV中的x值，此值介于【0,1】将X值转成一个颜色颜色作为基础色，完成着色。每一个着色点，都执行一遍这套流程。最终完成整个面的着色。在着色时，每个点的颜色根据UV坐标计算得到
阅读更多2024-11-05
WPF开发，将引用的dll在编译时指向单独的文件夹。
在这种情况下，它将获取"引用的程序集"解决方案文件夹所引用的新dll，并在提交它们之前自动添加源代码控制跟踪(即，如果像我一样从Visual Studio中的解决方案资源管理器中提
阅读更多2024-11-05

传知代码-深度知识追踪(论文复现)

代码以及视频讲解

1. 论文概述

2. 论文方法

3. 实验部分

3.1 数据集

3.2 实验步骤

step1:安装环境依赖

step2:下载数据集，将其变成one-hot编码

step3:进行训练

3.3 实验结果

4 关键代码

相关文章