【多模态】资料小抄 - 代码天地

【多模态】资料小抄

企业开发 2023-05-04 17:05:39 阅读次数: 0

================My blog=====================

【跨模态】神经搜索实践：Jina VCED： http://t.csdn.cn/EqFww

================资料=====================

1. CLIP模型的使用和训练-利用CLIP实现zero-shot的分类任务 http://t.csdn.cn/lbRlg

2. CLIP 论文逐段精读【论文精读】 https://www.bilibili.com/video/BV1SL4y1s7LQ/?spm_id_from=333.999.0.0&vd_source=fab4cd66aafcb3b54c4bc627c1dcaac1

3. 基于矩阵或注意力《Efficlent Low*rank Multimodal Fusion with Modality-Specific Factors》

4. 双塔《Pretralning Task.Agnostic Vislolinguistic Representations for Vislonand·Language Tasks》

5. 单流《A Universal Encoder for Vislon and Language by Cross-modal Pre-training》

6. 基于对比学习的预训练模型《CommerceMM: Large-Scale Commerce MultiModsl Representatlon Learning with Omni Retrleval》

扫描二维码关注公众号，回复： 14955164 查看本文章

7. 多模态预训练《BEIT: BERT Pre-Training of lmage Transformers》

8. 基于predict masked patch的预训练模型《Masked Autoencoders Aro Scalable Vislon Leaners》

猜你喜欢

转载自blog.csdn.net/weixin_42322991/article/details/127996142

【多模态】资料小抄

多模态

多模态AI算法

什么是多模态学习？

多模态融合

NLP/多模态比赛

聊聊大火的多模态

多模态技术综述

多模态融合技术

多模态：InstructBLIP

多模态概述

【多模态】CLIP模型

多模态智能的发展

医学多模态综述

经典多模态模型

多模态梳理

多模态网络

多模态知识学习

多视图与多模态之争

跨模态/多模态 cross-modal

跨模态学习与多模态学习

【多模态】平衡多模态学习（讨论与文章汇总）

多模态人脸识别——概述

什么是多模态机器学习？

多模态人体识别技术

多模态融合 Multimodal Fusion

pytorch多模态实践基础

CLIP多模态代码试玩

多模态论文汇总

多模态论文串讲笔记

今日推荐

TIOBE 5 月榜单：Fortran “复活”进入 Top 10

GCC 14.1 发布

面壁智能发布 Eurux-8x22B 开源大模型 —— 堪称「理科状元」

开源日报 | 谷歌扶持鸿蒙上位；开源Rabbit R1；Docker加持的安卓手机；微软的焦虑和野心；海尔电器把开放平台关了

中国码农的“35岁魔咒”

蘭雅 CorelDRAW 插件 2024.5.1 国际劳动节版，免费下载

Arc Browser for Windows 1.0 正式 GA

90后程序员开发视频搬运软件、不到一年获利超 700 万，结局很刑！

周排行

Java自定义时间格式

同步整形电路

在开发中最最最常用的字符串的属性大集合

Linux 查看端口占用并杀掉

Java基础四：ArrayList

多线程之死锁就是这么简单

mysql 基础命令集

awk 命令详解

Centos6.3编译安装nginx+php步骤

OCR （Optical Character Recognition，光学字符识别）

每日归档

更多

2024-05-08(42)

2024-05-07(14)

2024-05-06(40)

2024-05-05(0)

2024-05-04(7)

2024-05-03(19)

2024-05-02(0)

2024-05-01(4)

2024-04-30(1)

2024-04-29(40)