科研学习|论文解读——基于旅游知识图谱的游客偏好挖掘和决策支持(IPM,2023)
原文题目
Mining tourist preferences and decision support via
tourism-oriented knowledge graph
摘要
目前,旅游管理研究的重点是通过对异构用户生成的内容进行广泛分析,来理解旅游偏好的波动,制定有针对性的发展策略。然而,鉴于在线景点评论涉及过多的混合和无形维度,广泛使用的无监督文本挖掘可能是不完整的或不准确的。此外,现有文献通常局限于几个旅游目的地和起源地的某些类型的景点,很难保证具有全面的洞察力。为了克服这些局限性,本研究提出了一种新的知识图谱驱动框架,该框架涉及旅游知识图谱(TKG)的系统构建和深入的研究与推理。遵循领域知识本体,从多源文本语料库中提取出11296716个多方面知识的结构化三联模型,提高了43.64%~50.65%的准确率,从中国340个旅游地中抽取了11174034名游客和20481个景点。利用TKG可以建立一个综合的决策支持系统,它分为符号查询和分布式推理两种不同的知识应用模式。在TKG上通过SPARQL查询实现多重时空分析,可以逐步发现旅游偏好、因果解释的分布规律及其对旅游地发展的影响。通过TKG注入丰富的上下文知识来细化对象的分布表示,可以显著增强下游推理任务,如旅游需求预测和旅游竞争情报。
一、引言
对旅游偏好的清晰把握一直是旅游研究者和实践者关注的焦点。洞察游客的行为偏好有助于旅游营销组织完善现有景点,规划新景点,并提出有效的营销策略。旅游从业者可以进一步识别游客选择行为的潜在决定因素,并及时预测对景点的需求,或细分旅游市场,定制与旅游者特征相符的个性化套餐。然而,全面了解游客对景点的偏好一直是一个挑战,因为景点属于体验产品,具有有形、认知和情感特征维度的复杂多变的耦合。
分析旅游偏好和制定有针对性的策略通常利用人工调查的离散选择实验,如问卷或访谈。该方法适用于测量特定旅游场景的反馈或预测一个新产品的支付意愿,并测试潜在因素的假设。然而,在进行调查时,无可避免地存在抽样偏差和时间限制的挑战,这可能会限制研究范围和结果的概化性。幸运的是,随着信息和通信技术的快速发展,尤其有影响力的社交媒体平台,海量用户生成的内容被记录、存储和积累,形成了一种重要的大数据类型。这些内容公开、易收集、低成本、自发、充满热情和洞察力。在众多类型的UGC中,在线评论可以提供关于游客行为偏好的大量信息。因此,它被称为一个很有前途的替代数据源,以克服人工调查的局限性。在线评论的相关分析已成功地应用于各种旅游问题,如服务性能改进,旅游地形象感知、旅行日记分析、差异化营销,以及旅游需求预测。
尽管在文献中对在线评论的文本挖掘做出了许多努力,但在深入了解复杂的旅游者偏好以支持旅游规划决策方面仍然存在3个重要的研究空白。
1. 在线评论分析主要应用于酒店、餐厅以及航空部门,其目的是确定旅游体验的感知维度和满意度。然而,景点作为旅游地的关键吸引力,直到最近才通过在线评论挖掘进行了少量研究。2. 在方法论方面,流行的无监督文本挖掘算法已广泛应用于当前的酒店和餐饮研究,但在从景点评论中提取知识方面可能存在问题,甚至无效。不像酒店和餐厅有几个明确的属性,景点评论内容的主题异质性要广泛得多,以不同的动机和活动为特征,并结合了众多无形的特征。可以说,这些数据的这种特性可能会导致提取的主题过多、可分性差、歧义增加,从而降低主题识别的准确性。3. 大多数研究在描述性统计分析中停滞不前,比如局限于特定旅游者群体在特定时段对特定旅游地内少数类型旅游产品的偏好模式。因此,基于在线评论,对景点特征的旅游偏好的一般时空规律的见解很少,更不用说潜在的因果解释和对旅游地发展的潜在影响了。这是由于缺乏对大地理范围内的多个旅游地及起源地进行广泛的比较分析。因此,仍然需要解决一些问题,例如在有关景点的在线评论中充分发挥文本挖掘技术的潜力,以实现系统和全面地理解决策支持的旅游偏好。
为了填补上述空白,本研究提出了一个新的决策支持框架,系统地研究游客的偏好,基于知识图(KG)以及相应的查询技术和推理模型。KG作为一个基于图形的数据模型,通过充分的事实知识三元组,其节点表示感兴趣的实体,其边表示这些实体之间潜在的不同关系。KG的核心能力3点特征为旅游业的UGC挖掘和相关决策支持带来了前景。
- 整合多源异构旅游数据:高度可扩展的知识表示结构三元组能够自然融合多模态、碎片化的旅游数据,实现不同类型信息的互补、粒度和来源。这种能力有两个明显的好处。首先,KG可以涵盖旅游场景中的各种实体,并对实体之间丰富的多种关系、行为互动和异质属性进行建模,这有利于对旅游现象从规律到因果解释再到潜在影响进行全面系统的探索。第二,多个信息源之间的重叠信息可以支持对发现的规律进行交叉验证,进一步增强结论的概括性。
- 准确的旅游知识提取和完整的旅游场景建模:随着深度的日益成熟自然语言处理技术,相应的KG方法可以充分填补传统文本挖掘的上述空白,大大提高旅游者行为偏好知识提取的准确性和完整性,从而形成一个结构完整的旅游领域知识体系。
- 面向决策支持的海量旅游知识的有效部署和推理:KG的应用可以分为两种方式,即符号查询和分布式推理。凭借高性能的图形DBMS,KG可以有效地查询,以可视化的交互方式提供多个时空分析,全面探索游客的行为模式和偏好分布。此外,前沿的分布式知识计算和推理模型(也称为KGL/KGE)可以被引入,以实现和增强各种下游任务丰富的语义知识,如旅游需求预测、竞争情报等。
与3个方面的利益相对应,KG的关键操作也可以分为3个过程:知识组织、获取和部署。知识组织是设计KG的本体,它形式化地表示领域专家的知识。知识获取是实例化根据本体从语料库中提取知识库中的信息。知识部署是利用KG实现多个下游决策支持任务的知识驱动解决方案。
原文地址:https://blog.csdn.net/admin_maxin/article/details/137612033
免责声明:本站文章内容转载自网络资源,如本站内容侵犯了原著者的合法权益,可联系本站删除。更多内容请关注自学内容网(zxcms.com)!