基于Python的自然语言处理系列（25）：QANet

🕗 发布于 2024-10-06 09:18 自然语言处理问答系统 人工智能

QANet 是在2018年提出的一种新型机器阅读理解模型，其显著特点是不依赖传统的循环神经网络（RNN），而是完全基于卷积和自注意力机制。循环神经网络由于其顺序处理的特性在训练和推理时速度较慢，而QANet通过卷积捕获文本的局部结构，通过自注意力机制学习全局词对的交互，从而提高了效率。

本文将详细讲解QANet模型的构建过程，展示如何实现它的核心模块，包括深度可分离卷积、多头自注意力、上下文-查询注意力等，并在SQuAD数据集上进行训练。

1. 加载预处理数据

与之前的BiDAF模型类似，QANet也需要处理上下文和问题对的嵌入。我们可以直接加载之前保存的预处理过的数据，包括单词和字符的索引。

import pickle
import pandas as pd

with open('bidafw2id.pickle', 'rb') as handle:
    word2idx = pickle.load(handle)
with open('bidafc2id.pickle', 'rb') as handle:
    char2idx = pickle.load(handle)

train_df = pd.read_pickle('bidaftrain.pkl')
valid_df = pd.read_pickle('bidafvalid.pkl')

idx2word = {v: k for k, v in word2idx.items()}

2. 数据加载器

QANet的数据加载器与BiDAF类似，用于动态生成批次数据并进行适当的填充，以便模型能够处理变长的上下文和问题输入。

class SquadDataset:
    def __init__(self, data, batch_size):
        self.batch_size = batch_size
        data = [data[i:i+self.batch_size] for i in range(0, len(data), self.batch_size)]
        self.data = data
        
    def make_char_vector(self, max_sent_len, sentence, max_word_len=16):
        char_vec = torch.zeros(max_sent_len, max_word_len).type(torch.LongTensor)
        for i, word in enumerate(nlp(sentence, disable=['parser','ner'])):
            for j, ch in enumerate(word.text):
                if j == max_word_len:
                    break
                char_vec[i][j] = char2idx.get(ch, 0)
        return char_vec 

    def __iter__(self):
        for batch in self.data:
            max_context_len = max([len(ctx) for ctx in batch.context_ids])
            padded_context = to

原文地址：https://blog.csdn.net/ljd939952281/article/details/142648420

免责声明：本站文章内容转载自网络资源，如本站内容侵犯了原著者的合法权益，可联系本站删除。更多内容请关注自学内容网（zxcms.com）！

上一篇：Windows：win11旗舰版连接无线显示器，连接失败
下一篇：数据结构之树（4）

系统分析师16：系统测试与维护
本文介绍了软考高级系统分析师中系统测试与维护模块的相关内容，包括：软件测试概念、测试方法及阶段、软件开发环境与工具、可维护因素、维护类型等。供个人学习使用。
阅读更多2024-10-07
python 实现贪婪合并排序算法
贪婪合并排序算法” 并不是一个标准的排序算法术语。通常，当我们谈论合并排序（Merge Sort）时，我们指的是一种分而治之的算法，它将数组分成两半，递归地对它们进行排序，然后将结果合并在一起。这个过
阅读更多2024-10-07
前端框架对比和选择
请记住，选择一个前端框架取决于许多因素，例如项目的规模、团队的经验和开发的需求。最重要的是根据自己的需求进行评估，并选择一个最符合自己需求的框架。Vue是一款由华人开发者开发的前端框架，它结合了Ang
阅读更多2024-10-07
第二百六十九节 JPA教程 - JPA查询OrderBy两个属性示例
第二百六十九节 JPA教程 - JPA查询OrderBy两个属性示例
阅读更多2024-10-07
情系英烈献爱心锦旗感恩致敬意
自2021年3月19日起，尹志林自费近80万元，组织团队追寻探访全国各地的革命纪念馆、革命烈士陵园和战争遗址及英烈事迹，通过短视频等多种形式宣讲红色故事，行程30000多公里，寻走了16个省、4个直辖
阅读更多2024-10-07
Rethinking Graph Neural Networksfor Anomaly Detection
其在半监督（1%，40%）的情况下，使用多通滤波器，将不同滤波器得到的特征拼接起来，来做分类，结果肯定会好(拼接在理论上比mean，sum等获得更多的信息，在不少的其他论文也用了这个trick)（悄咪
阅读更多2024-10-07
【Taro】做项目过程中的一些问题记录
待更新~
阅读更多2024-10-07
JavaScript 根据时间先后排序数组
方法来根据时间先后对数组进行排序。假设你的数组中的每个元素都是一个对象，并且这些对象都有一个表示时间的属性（例如，一个 ISO 格式的字符串、时间戳或。对象在 JavaScript 中可以相减得到时间
阅读更多2024-10-07
Golang | Leetcode Golang题解之第459题重复的子字符串
Golang | Leetcode Golang题解之第459题重复的子字符串
阅读更多2024-10-07
MySQL总结
MySQL总结
阅读更多2024-10-07

基于Python的自然语言处理系列（25）：QANet

1. 加载预处理数据

2. 数据加载器

相关文章