科研学习|论文解读——基于旅游知识图谱的游客偏好挖掘和决策支持（IPM，2023）

🕗 发布于 2024-04-14 09:16 学习旅游知识图谱 UGC PGC

原文题目

Mining tourist preferences and decision support via

tourism-oriented knowledge graph

摘要

目前，旅游管理研究的重点是通过对异构用户生成的内容进行广泛分析，来理解旅游偏好的波动，制定有针对性的发展策略。然而，鉴于在线景点评论涉及过多的混合和无形维度，广泛使用的无监督文本挖掘可能是不完整的或不准确的。此外，现有文献通常局限于几个旅游目的地和起源地的某些类型的景点，很难保证具有全面的洞察力。为了克服这些局限性，本研究提出了一种新的知识图谱驱动框架，该框架涉及旅游知识图谱(TKG)的系统构建和深入的研究与推理。遵循领域知识本体，从多源文本语料库中提取出11296716个多方面知识的结构化三联模型，提高了43.64%~50.65%的准确率，从中国340个旅游地中抽取了11174034名游客和20481个景点。利用TKG可以建立一个综合的决策支持系统，它分为符号查询和分布式推理两种不同的知识应用模式。在TKG上通过SPARQL查询实现多重时空分析，可以逐步发现旅游偏好、因果解释的分布规律及其对旅游地发展的影响。通过TKG注入丰富的上下文知识来细化对象的分布表示，可以显著增强下游推理任务，如旅游需求预测和旅游竞争情报。

一、引言

对旅游偏好的清晰把握一直是旅游研究者和实践者关注的焦点。洞察游客的行为偏好有助于旅游营销组织完善现有景点，规划新景点，并提出有效的营销策略。旅游从业者可以进一步识别游客选择行为的潜在决定因素，并及时预测对景点的需求，或细分旅游市场，定制与旅游者特征相符的个性化套餐。然而，全面了解游客对景点的偏好一直是一个挑战，因为景点属于体验产品，具有有形、认知和情感特征维度的复杂多变的耦合。

分析旅游偏好和制定有针对性的策略通常利用人工调查的离散选择实验，如问卷或访谈。该方法适用于测量特定旅游场景的反馈或预测一个新产品的支付意愿，并测试潜在因素的假设。然而，在进行调查时，无可避免地存在抽样偏差和时间限制的挑战，这可能会限制研究范围和结果的概化性。幸运的是，随着信息和通信技术的快速发展，尤其有影响力的社交媒体平台，海量用户生成的内容被记录、存储和积累，形成了一种重要的大数据类型。这些内容公开、易收集、低成本、自发、充满热情和洞察力。在众多类型的UGC中，在线评论可以提供关于游客行为偏好的大量信息。因此，它被称为一个很有前途的替代数据源，以克服人工调查的局限性。在线评论的相关分析已成功地应用于各种旅游问题，如服务性能改进，旅游地形象感知、旅行日记分析、差异化营销，以及旅游需求预测。

尽管在文献中对在线评论的文本挖掘做出了许多努力，但在深入了解复杂的旅游者偏好以支持旅游规划决策方面仍然存在3个重要的研究空白。

1. 在线评论分析主要应用于酒店、餐厅以及航空部门，其目的是确定旅游体验的感知维度和满意度。然而，景点作为旅游地的关键吸引力，直到最近才通过在线评论挖掘进行了少量研究。

2. 在方法论方面，流行的无监督文本挖掘算法已广泛应用于当前的酒店和餐饮研究，但在从景点评论中提取知识方面可能存在问题，甚至无效。不像酒店和餐厅有几个明确的属性，景点评论内容的主题异质性要广泛得多，以不同的动机和活动为特征，并结合了众多无形的特征。可以说，这些数据的这种特性可能会导致提取的主题过多、可分性差、歧义增加，从而降低主题识别的准确性。

3. 大多数研究在描述性统计分析中停滞不前，比如局限于特定旅游者群体在特定时段对特定旅游地内少数类型旅游产品的偏好模式。因此，基于在线评论，对景点特征的旅游偏好的一般时空规律的见解很少，更不用说潜在的因果解释和对旅游地发展的潜在影响了。这是由于缺乏对大地理范围内的多个旅游地及起源地进行广泛的比较分析。因此，仍然需要解决一些问题，例如在有关景点的在线评论中充分发挥文本挖掘技术的潜力，以实现系统和全面地理解决策支持的旅游偏好。

为了填补上述空白，本研究提出了一个新的决策支持框架，系统地研究游客的偏好，基于知识图（KG）以及相应的查询技术和推理模型。KG作为一个基于图形的数据模型，通过充分的事实知识三元组，其节点表示感兴趣的实体，其边表示这些实体之间潜在的不同关系。KG的核心能力3点特征为旅游业的UGC挖掘和相关决策支持带来了前景。

整合多源异构旅游数据：高度可扩展的知识表示结构三元组能够自然融合多模态、碎片化的旅游数据，实现不同类型信息的互补、粒度和来源。这种能力有两个明显的好处。首先，KG可以涵盖旅游场景中的各种实体，并对实体之间丰富的多种关系、行为互动和异质属性进行建模，这有利于对旅游现象从规律到因果解释再到潜在影响进行全面系统的探索。第二，多个信息源之间的重叠信息可以支持对发现的规律进行交叉验证，进一步增强结论的概括性。
准确的旅游知识提取和完整的旅游场景建模：随着深度的日益成熟自然语言处理技术，相应的KG方法可以充分填补传统文本挖掘的上述空白，大大提高旅游者行为偏好知识提取的准确性和完整性，从而形成一个结构完整的旅游领域知识体系。
面向决策支持的海量旅游知识的有效部署和推理：KG的应用可以分为两种方式，即符号查询和分布式推理。凭借高性能的图形DBMS，KG可以有效地查询，以可视化的交互方式提供多个时空分析，全面探索游客的行为模式和偏好分布。此外，前沿的分布式知识计算和推理模型（也称为KGL/KGE）可以被引入，以实现和增强各种下游任务丰富的语义知识，如旅游需求预测、竞争情报等。

与3个方面的利益相对应，KG的关键操作也可以分为3个过程：知识组织、获取和部署。知识组织是设计KG的本体，它形式化地表示领域专家的知识。知识获取是实例化根据本体从语料库中提取知识库中的信息。知识部署是利用KG实现多个下游决策支持任务的知识驱动解决方案。

原文地址：https://blog.csdn.net/admin_maxin/article/details/137612033

免责声明：本站文章内容转载自网络资源，如本站内容侵犯了原著者的合法权益，可联系本站删除。更多内容请关注自学内容网（zxcms.com）！

上一篇：“卓见杯”郑州轻工业大学第十五届程序设计大赛暨河南省高校邀请赛题解
下一篇：centos编译安装nginx1.24

web前端开发--盒子属性
学院介绍
阅读更多2024-11-18
深度学习基础—Seq2Seq模型
decoder网络和编号4的语言模型几乎一模一样，机器翻译模型其实和语言模型非常相似，不同在于语言模型总是以零向量开始，而encoder网络会计算出一系列向量来表示输入的句子。假设输入猫咪图片，经过预
阅读更多2024-11-18
【第三章】Kubernetes资源与对象
文章目录1. Kubernetes资源介绍1.1 Pod1.2 Deployment1.3 Service1.4 Namespace2. Kubernetes资源实践2.1 部署应用2.2 访问应用2
阅读更多2024-11-18
SRT拥塞控制分析
在慢启动阶段，发送端会逐渐增加发送速率，直到网络出现丢包，这时会触发拥塞控制机制，减少发送速率。在拥塞控制中，如果网络出现丢包，发送端可能会增加数据包发送间隔，以减少网络拥塞。：拥塞窗口的大小，用于控
阅读更多2024-11-18
小红书内容推荐算法开发：利用API打造个性化用户体验
小红书，作为国内领先的内容分享社区，其丰富的用户生成内容（UGC）和独特的社区氛围，为推荐算法的开发提供了肥沃的土壤。通过小红书API获取的数据，我们可以构建用户兴趣画像和内容特征，进而实现个性化推荐
阅读更多2024-11-18
详解八大排序（一）------（插入排序，选择排序，冒泡排序，希尔排序）
在日常生活中，我们常常要将各种各样的数据进行排序，例如我要将班上的学生按照数学成绩从大到小的排序，像这种一般情况，编译器自带的sort函数就能满足我们的要求。但是，假如我要将班上姓刘的学生按照数学成绩
阅读更多2024-11-18
量化交易系统开发-实时行情自动化交易-3.4.3.2.期货交易数据
交易数据（Trade Ticks）是进行高频交易策略和市场情绪分析的核心数据之一，通过获取逐笔交易的数据，交易者可以识别大资金动向、市场参与者的行为，以及短时间内的市场动态。以下是通过 Python
阅读更多2024-11-18
Rust：AtomicI8 还是 Mutex＜u8＞?
提供的原子操作（如加载、存储等）在硬件层面得到支持，这些操作是不可分割的，即一旦开始执行，就不会被其他线程的操作打断。如果需要在多个线程之间安全地传递复杂的数据结构或进行复杂的同步操作，那么可能需要考
阅读更多2024-11-18
小程序-基于java+SpringBoot+Vue的智能小程序商城设计与实现
智能小程序商城是一个基于Java和Spring Boot框架开发的电子商务平台，利用微信小程序技术提供便捷的购物体验。系统支持商品浏览、购物车管理、订单处理、用户信息管理等功能，旨在为用户打造一个简洁
阅读更多2024-11-18
华为Ensp模拟器配置OSPF路由协议
开放式最短路径优先 (OSPF) 协议深度解析简介开放式最短路径优先（Open Shortest Path First, OSPF）是一种内部网关协议（IGP），用于在自治系统（AS）内进行动态路由选
阅读更多2024-11-18

科研学习|论文解读——基于旅游知识图谱的游客偏好挖掘和决策支持（IPM，2023）

原文题目

摘要

一、引言

相关文章