广目多闻--基于多模态大模型的文旅游览助手 | OPENAIGC开发者大赛企业组优秀作品

🕗 发布于 2024-10-10 23:15 人工智能

在第二届拯救者杯OPENAIGC开发者大赛中，涌现出一批技术突出、创意卓越的作品。为了让这些优秀项目被更多人看到，我们特意开设了优秀作品报道专栏，旨在展示其独特之处和开发者的精彩故事

无论您是技术专家还是爱好者，希望能带给您不一样的知识和启发。让我们一起探索AIGC的无限可能，见证科技与创意的完美融合！

创未来AI应用赛-企业组优秀作品

作品名称：广目多闻--基于多模态大模型的文旅游览助手

参赛团队：上海墀圣信息技术有限公司天山长歌

作品简介

本项目是一款基于多模态大模型，为用户提供AI导游服务的应用方案。本方案可以根据用户提供的博物馆展品照片、基于预先标出的值得关注的部分，为用户提供导游和问答互动，让游客便捷地获取相关知识、典故、轶事，增加游览兴趣，尤其是可作为研学用户的高效助手，在上线后继续拓展海外市场。

项目设计

本项目提出了一款可根据用户拍摄的博物馆文物与展品照片，使用户可以和多模态模型互动，获取导览内容，达到导游的目的。功能主要有：

用户侧：

用户拍摄展品照片后，在交互界面上传，获得展品上的”重点区域“标识

导览内容包括：

博物馆在后台编辑的内容介绍

网络上关于该展品及区域的介绍

专业资料和书籍对该展品及区域的介绍

“重点区域”也可以通过用户的推荐而生成。用户点击生成遮罩，提交导览内容和简介，经审核和用户匿名投票后，达到标准的展示为新的”值得关注的区域“。通过交互满足社交性、趣味性、娱乐性，增加用户参与度和使用粘性。

管理侧：

博物馆管理方在后台可新增、编辑、删除所属的展品、”重点区域“信息，保证专业性和严肃性。

核心技术和创新点

主要使用如下多模态技术：

Segment Anything进行遮罩选取与分割

ImageBind+Lora进行图像编码和文本标题简介的拉齐

基于Qwen-14B的RAG系统，结合文本标题简介，提供经审核的、严肃的学术性介绍和用户互动功能

在RAG系统上的Agent，搜集更多其它信息用户互动

技术成果和突破

对齐了多模态编码、图像识别、大模型文本生成内容的功能；

将多模态不仅作为大模型的黑盒子使用，而且拆分出来满足用户的个性化需求；

使用openvino，加速文本生成，使用户体验更好。

未来发展

本项目后面会拓展到自然景观的应用，面向外部条件更复杂的户外景观，在光照、恶劣天气等情况下实现落地。

另一方面迭代多模态大模型的版本和量化方式，使生成的速度和性能不断提升

原文地址：https://blog.csdn.net/weixin_57291105/article/details/142829078

免责声明：本站文章内容转载自网络资源，如本站内容侵犯了原著者的合法权益，可联系本站删除。更多内容请关注自学内容网（zxcms.com）！

上一篇：理解PID（一）——增量式PID
下一篇：网络接入的镜像模式和串接模式

PyQt基本功能
pyqt5创建基本窗口以及工具栏和菜单栏
阅读更多2024-10-12
可看见车辆行人的高清实时视频第4辑
建中镇位于瓮安县西南部，距县城18公里，距省会贵阳仅56公里，有全国最大的黄金芽种植示范基地，茶园种植面积3.56万亩，年生产加工茶叶8000吨以上，产值2.5亿以上。以“中山纪念亭”为发端，名为“四
阅读更多2024-10-12
springboot+react实现移动端相册（上传图片到oss/ 批量删除/ 查看图片详情等功能）
这是首个利用AI+自有知识构建的简易相册系统，项目是react构造前端+spring boot构造后端。其中还在后端配置了阿里云的OSS，将图片都存储在阿里云中。Java后端结构及代码。
阅读更多2024-10-12
Java的数据类型与变量
即程序运行期间固定不变的量。System.out.println("Hello World")；语句，不论程序何时运行，输出的都是Hello World，其实"Hell
阅读更多2024-10-12
2025秋招倒计时---招联金融
直接扫下方二维码，或点击内推官网https://wecruit.hotjob.cn/SU61025e262f9d247b98e0a2c2/mc/position/campus，使用内推码 igcefb
阅读更多2024-10-12
zynq 添加lwip库
在自己的项目属性中.
阅读更多2024-10-12
登录前端笔记（一）：pinia管理用户数据
②组件里使用：把导出的方法useCounterStore 在组件里执行后，得到实例对象counterStore ，后使用对象里的属性。二、官网简单实例（定义store【state与action】后组件
阅读更多2024-10-12
自动化运维：提升效率、降低风险的利器
在中国快速发展的数字化时代，企业面临着越来越多的IT运维挑战。为了应对这些挑战，自动化运维成为了一种不可或缺的解决方案。自动化运维通过利用先进的技术和工具，可以显著提高运维效率，降低风险，并为中国企业
阅读更多2024-10-12
10.12 标准IO
编写2个.c文件,save.c 和 load.c save.c负责：使用fprintf将3个学生的所有信息保存到文件中去 load.c负责：使用fscanf读取文件中的3个学生的信息，将读取到的数
阅读更多2024-10-12
第四十五章创建和添加 SAML 令牌 - 变体：不使用 BinarySecurityToken
可以忽略此令牌，而改用标识证书的信息；接收方使用此信息从相应位置检索证书。如果指定凭证集作为第一个参数（正如我们在这个变体中所做的那样），则默认引用选项是证书的指纹。的方法在中将属性指定为 XML、字
阅读更多2024-10-12

广目多闻--基于多模态大模型的文旅游览助手 | OPENAIGC开发者大赛企业组优秀作品

相关文章