自学内容网 自学内容网

LLaVA1.5:Improved Baselines with Visual Instruction Tuning

论文:https://arxiv.org/abs/2310.03744

代码:https://github.com/haotian-liu/LLaVA#train

微调:https://github.com/haotian-liu/LLaVA/blob/main/docs/Finetune_Custom_Data.md

模型 论文时间 Vision Encoder VL Adapter Projection Layer LLM 训练模块
BLIP-2

原文地址:https://blog.csdn.net/lilai619/article/details/142517200

免责声明:本站文章内容转载自网络资源,如本站内容侵犯了原著者的合法权益,可联系本站删除。更多内容请关注自学内容网(zxcms.com)!