LLaVA1.5:Improved Baselines with Visual Instruction Tuning
论文:https://arxiv.org/abs/2310.03744
代码:https://github.com/haotian-liu/LLaVA#train
微调:https://github.com/haotian-liu/LLaVA/blob/main/docs/Finetune_Custom_Data.md
模型 | 论文时间 | Vision Encoder | VL Adapter | Projection Layer | LLM | 训练模块 |
---|---|---|---|---|---|---|
BLIP-2 |
原文地址:https://blog.csdn.net/lilai619/article/details/142517200
免责声明:本站文章内容转载自网络资源,如本站内容侵犯了原著者的合法权益,可联系本站删除。更多内容请关注自学内容网(zxcms.com)!