自学内容网 自学内容网

知识库发展趋势的衍生技术栈

目录

一、前言

由于人工智能大模型时代的到来,也进入了大模型跟知识库结合的阶段。尤其对非关系型数据的采集、存储、应用,相关技术也越来越多。
本人结合这么多年接触的技术栈及相关项目,依照自己的理解,对知识库的技术发展做一些汇总。
说明:内容总结会慢慢更新!!!!!】

传统、简单的文件解析技术—只解析基本的文本内容
tika、hutool技术、easyExcel
tika提取文档内容

hutool提取excel文档

文件(多样性)解析技术—能提取复杂格式、提取图片信息等
【待研究,利用python去提取实现】


原文地址:https://blog.csdn.net/xunmengyou1990/article/details/143835272

免责声明:本站文章内容转载自网络资源,如本站内容侵犯了原著者的合法权益,可联系本站删除。更多内容请关注自学内容网(zxcms.com)!