CVPR2023

CVPR 2023 採択論文

CVPR 2023 統計:

投稿:9155論文
採択:2360論文(採択率25.8%)
ハイライト:235論文(採択論文の10%、投稿論文の2.6%)
受賞候補:12論文(採択論文の0.51%、投稿論文の0.13%)


受理された論文のリスト (盗作と二重投稿のチェック中):

Generating Human Motion from Textual Descriptions with High Quality Discrete Representation
Jianrong Zhang · Yangsong Zhang · Xiaodong Cun · Yong Zhang · Hongwei Zhao · Hongtao Lu · Xi SHEN · Ying Shan
SadTalker: Learning Realistic 3D Motion Coefficients for Stylized Audio-Driven Single Image Talking Face Animation
Wenxuan Zhang · Xiaodong Cun · Xuan Wang · Yong Zhang · Xi SHEN · Yu Guo · Ying Shan · Fei Wang
Explicit Visual Prompting for Low-Level Structure Segmentations
Weihuang Liu · Xi SHEN · Chi-Man Pun · Xiaodong Cun
Privacy-preserving Adversarial Facial Features
Zhibo Wang · He Wang · Shuaifan Jin · Wenwen Zhang · Jiahui Hu · Yan Wang · Peng Sun · Wei Yuan whu · Kaixin Liu · Kui Ren
NeRF-RPN: NeRF における物体検出のための一般的なフレームワーク
Benran Hu Junkai Huang Yichen Liu Yu-Wing Tai Chi-Keung Tang
カテゴリ 人間とオブジェクトのインタラクションのためのクエリ学習分類
Chi Xie Fangao Zeng Yue Hu Shuang Liang · Yichen Wei
A Unified Pyramid Recurrentビデオ フレーム補間ネットワーク
Xin Jin · LONG WU · Jie Chen · Chen Youxin · Jay Koo · Cheul-hee Hahm
SINE: 事前ガイド編集フィールドを使用したセマンティック駆動型画像ベースの NeRF 編集
Chong Bao · yingda Zhang · Bangbang Yang · Tianxing Fan · Zesong Yang · Hujun Bao · Guofeng Zhang · Zhaopeng Cui
PATS: 局所特徴マッチングのためのサブディビジョンによるパッチ エリア輸送
Junjie Ni、Yijin Li、Zhaoyang Huang、Hongsheng Li、Zhaoopeng Cui、Hujun Bao、Guofeng Zhang
DualVector: デュアルパート表現による教師なしベクトル フォント合成
Ying-Tian Liu、Zhifei Zhang、Yuan-Chen Guo、Matthew Fisher、Zhaowen Wang、 Song-Hai Zhang
文書画像内の堅牢な改ざんテキスト検出に向けて: 新しいデータセットと新しいソリューション
chenfan Qu · Chongyu · Yuliang liu · xinhong Chen · Dezhi Peng · FENGJUN Guo · Lianwen Jin
Panoswin: A Pano-Style Swin Transformer for Panorama Understanding
Zhixin Ling · Zhen Xing · Xiangdong Zhou · Man Cao · Guichun Zhou
SV旧: アクション認識用の半教師ありビデオトランスフォーマー
Zhen Xing · Qi Dai · Han Hu · Jingjing Chen · Zuxuan Wu · Yu-Gang Jiang
オブジェクト中心のニューラル散乱関数による複数オブジェクトの操作
Stephen Tian Yancheng Cai Hong-Xing Yu Sergey Zakharov Katherine Liu Adrien Gaidon Yunzhu Li Jiajun Wu RealImpact
: 現実のオブジェクトの衝撃音場のデータセット
Samuel Clarke Ruohan Gao Mason L Wang Mark Rau Julia Xu Jui-Hsien Wang Doug James Jiajun Wu
トライプレーン拡散を使用した 3D ニューラル フィールド生成
Jesse Shue Eric Chan Ryan Po Zachary Ankner Jiajun Wu Gordon Wetzstein
人間をその場に置く: アフォーダンスを意識した人間のシーンへの挿入
スミス・クラール ティム・ブルックス アレックス・エイケン・ジアジュン・ウー・ジメイヤン・ジンワン・ルー・アレクセイ・A・エフロス クリシュナ・クマール・シン
部分ラベル学習のための効果的な視覚表現に向けて
Shiyu Xia Jiaqi Lyu Ning Xu Gang Niu Xin Geng
AMT: 効率的なフレーム補間のための全ペア マルチフィールド変換
Zhen Li Zuo-Liang Zhu Ling-Hao Han Qibin Hou Chunle Guo Ming-Ming Cheng
DNF: 暗闇で見るためのデカップリングおよびフィードバック ネットワーク
Xin Jin Ling-Hao Han Zhen Li Chunle Guo Zhi Chai Chongyi Li
ハイパースペクトル画像ノイズ除去用のスペクトル拡張長方形トランスフォーマー
Miaoyu Li Ji Liu · Ying Fu · Yulun Zhang · Dejing Dou
動的集約ネットワーク歩行認識
Kang Ma、Ying Fu、Dezhi Zheng、Chunshui Cao、Xuecai Hu、Yongzhen Huang
LG-BPN: 自己監視型現実世界ノイズ除去のためのローカルおよびグローバル ブラインドパッチ ネットワーク
ZiChun Wang Ying Fu Ji Liu Yulun Zhang
モバイル デバイス上のリアルタイム ニューラル ライト フィールド
Junli Cao Huan Wang Pavlo Chemerys Vladislav Shakhrai · Ju Hu · Yun Fu · Denys Makoviichuk · Sergey Tulyakov · Jian Ren
ScaleDet: スケーラブルなマルチデータセット オブジェクト検出器
Yanbei Chen · Manchen Wang · Abhay Mittal · Zhenlin Xu · Paolo Favaro · Joseph Tighe · Davide Modolo
All in One: 統合ビデオ言語の事前トレーニングの探索
ジンペン・ワン・イーシャオ・ゲー・ルイ・ヤン・ユーイン・ゲー・ケビン・チンホン・リン・筒井聡・シュドン・リン・グアンユー・カイ・ジャンピン・ウー・インシャン・シャオフー・チー・マイク・ジェンショウ
自然文字知識からの転送可能な時空間表現の学習
Ziyun Zeng Yuying Ge Xihui Liu Bin Chen Ping Luo Shu-Tao Xia Yixiao Ge
KD-GAN: 知識蒸留によるデータ限定画像生成
Kaiwen Cui Yingchen Yu Fangneng Zhan · Shengcai Liao · Shijian Lu · Eric Xing
マッピングの縮退とラベルの進化の出会い: 単一点監視による赤外線小型ターゲット検出の学習
Xinyi Ying、Li Liu、Yingqian Wang、Ruojing Li、Nuo Chen、Zaiping Lin、Weidong Sheng、Shilin Zhou 顔の毛の属性を学習するための論理的一貫性と優れた
記述力
Haiyuウー・グレース・ベゾルド アマン・バッタ ケビン・ボウヤー
Diffusion Video Autoencoders: Toward Temporally Consistent Face Video Editing via Disentangled Video Encoding
Gyeongman Kim · Hajin Shim · Hyunsu Kim · Yunjey Choi · Junho Kim · Eunho Yang
3D Video Object Detection with Learnable Object-Centric Global Optimization
Jiawei He · Yuntao Chen · Naiyan Wang · Zhaoxiang Zhang
BEVFormer v2: Adapting Modern Image Backbones to Bird’s-Eye-View Recognition via Perspective Supervision
Chenyu Yang · Yuntao Chen · Hao Tian · Chenxin Tao · Xizhou Zhu · Zhaoxiang Zhang · Gao Huang · Hongyang Li · Yu Qiao · Lewei Lu · Jie Zhou · Jifeng Dai
MarS3D: A Plug-and-Play Motion-Aware Model for Semantic Segmentation on Multi-Scan 3D Point Clouds
Jiahui Liu · Chirui CHANG · Jianhui Liu · Xiaoyang Wu · Lan Ma · XIAOJUAN QI
神経崩壊による不均衡なセマンティック セグメンテーションの理解
Zhisheng Zhong Jiequan Cui Yibo Yang Xiaoyang Wu XIAOJUAN QI Xiangyu Zhang Jia Jia
少数ショット セグメンテーションのための階層的密相関蒸留
Bohao PENG Zhuotao Tian Xiaoy ang Wu · Chengyao Wang · Shu Liu · Jingyong Su · Jiaya Jia
Maskedシーンコントラスト: 教師なし 3D 表現学習のためのスケーラブルなフレームワーク
Xiaoyang Wu · Xin Wen · Xihui Liu · Hengshuang Zhao
一般化可能な人間の姿勢推定のための自己修正可能で適応可能な推論
Zhehan Kan · Shuoshuo Chen · Ce Zhang Yushun Tang · Zhihai He
Neuro-Modulatedテスト時に完全に適応するための Hebbian 学習
Yushun Tang · Ce Zhang · Heng Xu · Shuoshuo Chen · Jie Cheng · Luziwei Leng · Qinghai Guo · Zhihai He
メタ類似性補正によるノイズ対応学習
Haochen Han · Kaiyao Miao · Qinghua Zheng · Minnan Luo
Corr に基づく推論段階でのバックドアの検出堅牢性 一貫性
xiaogeng liu、minghui li、haoyu wang、shengshan hu、dngpan year jin wu、chaowei xiao
ポリフォーマー: 参照画像セグメンテーション、シーケンシャル ポリゴン生成
jiang liu、hui ding、zhaowei cai、yuting zhang、ravi satzoda、vijay Mahadevan R.マンマサ
少数ショットのオープンセット認識のためのグローカル エネルギーベースの学習
Haoyu Wang Guansong Pang Peng Wang Lei Zhang Wei Wei Yanning Zhang
PointDistiller: 効率的でコンパクトな 3D 検出に向けた構造化された知識の蒸留
Linfeng Zhang Runpei Dong Hung-Shuo Tai Kaisheng Ma
LipFormer: 事前学習された顔コードブックによる高忠実度で一般化可能な話し顔生成
Jiayu Wang Kang Zhao · Shiwei Zhang · Yingya Zhang · Yujun Shen · Deli Zhao · Jingren Zhou
マルチモーダル感情空間学習による高忠実度の一般化された感情的な会話顔生成
Chao Xu · Junwei Zhu · Jiangning Zhang · Yue Han · Wenqing Chu · Ying Tai · Chengjie Wang · Zhifeng Xie · Yong Liu EC
^ 2: 身体制御のための緊急通信
ヤオ・ムー、ヤオ・シュンユウ、ミンギュ・ディン、ピン・ルオ、チュアン・ガン
意味論的に耐性のある対比損失による自己監視型の画像から点への蒸留
Anas Mahmoud · Jordan Sir Kwang Hu · Tianshu Kuai · Ali Harakeh · Liam Paull · Steven Waslander
インスタンス関係グラフ ガイド付きソースフリー ドメイン 適応オブジェクト検出
Vibashan Vishnukumar Sharmini · Poojan Oza · Vishal Patel
マスクフリー OVIS: 手動マスク アノテーションを使用しないオープンボキャブラリー インスタンス セグメンテーション
Vibashan Vishnukumar Sharmini · Ning Yu · Chen Xing · Can Qin · Mingfei Gao · Juan Carlos Niebles · Vishal Patel · Ran Xu STMT: 時空間メッシュ
トランスフォーマーMoCap ベースのアクション認識用
Xiaoyu Zhu、Po-Yao Huang、Junwei Liang、Celso de Melo、Alexander Hauptmann
DropMAE: Masked Autoencoders with Spatial-Attention Dropout for Tracking Tasks
Qiangqiang Wu · Tianyu Yang · Ziquan Liu · Baoyuan Wu · Ying Shan · Antoni Chan
TWINS: A Fine-Tuning Framework for Improved Transferability of Adversarial Robustness and Generalization
Ziquan Liu · Yi Xu · Xiangyang Ji · Antoni Chan
Optimal Transport Minimization: Crowd Localization on Density Maps for Semi-Supervised Counting
Wei Lin · Antoni Chan
Music-Driven Group Choreography
Nhat Le · Trong Thang Pham · Tuong Do · Erman Tjiputra · Quang Tran · Anh Nguyen
Where is my Wallet? Modeling Object Proposal Sets for Egocentric Visual Query Localization
Mengmeng Xu · Yanghao Li · Cheng-Yang Fu · Bernard Ghanem · Tao Xiang · Juan-Manuel Perez-Rua
Rotation-Invariant Transformer for Point Cloud Matching
Hao Yu · Zheng Qin · Ji Hou · Mahdi Saleh · Dongsheng Li · Benjamin Busam · Slobodan Ilic
Mask3D: Pre-training 2D Vision Transformers by Learning Masked 3D Priors
Ji Hou · Xiaoliang Dai · Zijian He · Angela Dai · Matthias Niessner
Boosting Semi-Supervised Learning by Exploiting All Unlabeled Data
Yuhao Chen · Xin Tan · Borui Zhao · ZhaoWei CHEN · Renjie Song · jiajun liang · Xuequan Lu
Implicit Identity Leakage: The Stumbling Block to Improving Deepfake Detection Generalization
Shichao Dong · Jin Wang · Renhe Ji · jiajun liang · Haoqiang Fan · Zheng Ge
EFEM: Equivariant Neural Field Expectation Maximization for 3D Object Segmentation Without Scene Supervision
Jiahui Lei · Congyue Deng · Karl Schmeckpeper · Leonidas Guibas · Kostas Daniilidis
SemiCVT: Semi-Supervised Convolutional Vision Transformer for Semantic Segmentation
Huimin Huang · Shiao Xie · Lanfen Lin · Tong Ruofeng · Yen-wei Chen · Yuexiang Li · Hong Wang · Yawen Huang · Yefeng Zheng
CNVid-3.5M: Build, Filter, and Pre-train the Large-scale Public Chinese Video-text Dataset
Tian Gan · Qing Wang · Xingning Dong · Xiangyuan Ren · Liqiang Nie · Qingpei Guo
Disentangling Writer and Character Styles for Handwriting Generation
Gang Dai · Yifan Zhang · Qingfeng Wang · Qing Du · Zhuliang Yu · Zhuoman Liu · Shuangping Huang
A2J-Transformer: Anchor-to-Joint Transformer Network for 3D Interacting Hand Pose Estimation from a Single RGB Image
Changlong Jiang · Yang Xiao · Cunlin Wu · Mingyang Zhang · Jinghong Zheng · Zhiguo Cao · Joey Zhou
Uni-Perceiver v2: A Generalist Model for Large-Scale Vision and Vision-Language Tasks
Hao Li · Jinguo Zhu · Xiaohu Jiang · Xizhou Zhu · Hongsheng Li · Chun Yuan · Xiaohua Wang · Yu Qiao · Xiaogang Wang · Wenhai Wang · Jifeng Dai
ShapeTalk: A Language Dataset and Framework for 3D Shape Edits and Deformations
Panos Achlioptas · Ian Huang · Minhyuk Sung · Sergey Tulyakov · Leonidas Guibas
Lite DETR : An Interleaved Multi-Scale Encoder for Efficient DETR
Feng Li · Ailing Zeng · Shilong Liu · Hao Zhang · Hongyang Li · Lionel Ni · Lei Zhang
Mask DINO: Towards A Unified Transformer-based Framework for Object Detection and Segmentation
Feng Li · Hao Zhang · Huaizhe Xu · Shilong Liu · Lei Zhang · Lionel Ni · Heung-Yeung Shum
MP-Former: Mask-Piloted Transfomer for Image Segmentation
Hao Zhang · Feng Li · Huaizhe Xu · Shijia Huang · Shilong Liu · Lionel Ni · Lei Zhang
Enlarging Instance-specific and Class-specific Information for Open-set Action Recognition
Jun Cen · Shiwei Zhang · Xiang Wang · Yixuan Pei · Zhiwu Qing · Yingya Zhang · Qifeng Chen
MoLo: Motion-augmented Long-short Contrastive Learning for Few-shot Action Recognition
Xiang Wang · Shiwei Zhang · Zhiwu Qing · Changxin Gao · Yingya Zhang · Deli Zhao · Nong Sang
PCR: Proxy-based Contrastive Replay for Online Class-Incremental Continual Learning
Huiwei Lin Baoquan Zhang Shanshan Feng Xutao Li Yunming Ye
4D 点群からの任意の 3D オブジェクトの再パーティキュラブル モデルの構築
Shaowei Liu Saurabh Gupta Shenlong Wang
Slide-Transformer: ローカルセルフアテンションを備えた階層型ビジョントランスフォーマー
Xuran Pan Tianzhu Ye · Zhuofan Xia · Shiji Song · Gao Huang
容積放射フィールドを 1 MB に圧縮
Lingzhi Li · Zhen Shen · Zhongshu Wang · Li Shen · Liefeng Bo
REVEAL: マルチソース マルチモーダル知識メモリによる検索拡張視覚言語事前トレーニング
Ziniu Hu · Ahmet Iscen · Chen Sun · Zirui Wang · Kai-Wei Chang · Yizhou Sun · Cordelia Schmid · David Ross · Alireza Fathi
Improving Image Recognition by Retrieving from Web-Scale Image-Text Data
Ahmet Iscen · Alireza Fathi · Cordelia Schmid
Learning to Name Classes for Vision and Language Models
Sarah Parisot · Yongxin Yang · Steven McDonagh
SteerNeRF: Accelerating NeRF Rendering via Smooth Viewpoint Trajectory
Sicheng Li · Hao Li · Yue Wang · Yiyi Liao · Lu Yu
Semi-Supervised Video Inpainting with Cycle Consistency Constraints
Zhiliang Wu · Han Xuan · Changchang Sun · Weili Guan · Kang Zhang · Yan Yan
Deep Stereo Video Inpainting
Zhiliang Wu · Changchang Sun · Han Xuan · Yan Yan
VoP: Text-Video Co-operative Prompt Tuning for Cross-Modal Retrieval
Siteng Huang · Biao Gong · Yulin Pan · Jianwen Jiang · Yiliang Lv · Yuyuan Li · Donglin Wang
NeRF-Supervised Deep Stereo
Fabio Tosi · Alessio Tonioni · Daniele Gregorio · Matteo Poggi
Collaborative Static and Dynamic Vision-Language Streams for Spatio-Temporal Video Grounding
Zihang Lin · Chaolei Tan · Jian-Fang Hu · Zhi Jin · Tiancai Ye · Wei-Shi Zheng
Hierarchical Semantic Correspondence Networks for Video Paragraph Grounding
Chaolei Tan · Zihang Lin · Jian-Fang Hu · Wei-Shi Zheng · Jianhuang Lai
Combining Implicit-Explicit View Correlation for Light Field Semantic Segmentation
Ruixuan Cong · Da Yang · Rongshan Chen · Sizhe Wang · Zhenglong Cui · HaoSheng
パッチ破損に対する感度を低減することによるビジョントランスフォーマーの堅牢性の向上
Yong Guo · David Stutz · Bernt Schiele
DF-Platter: Multi-Face Heterogeneous Deepfake Dataset
Kartik Narayan · Harsh Agarwal · Kartik Thakral · Surbhi Mittal · Mayank Vatsa · Richa Singh
Metadata-Based暗黙的ニューラル関数による RAW 再構成
Leyi Li Huijie Qiao Qi Ye Qinmin Yang
I
2
-SDF: ニューラル SDF でのレイトレーシングによる固有の屋内シーンの再構成と編集
Jingsen Zhu Yuchi Huo Qi Ye Fujun Luan Jifan Li Dianbing Xi Lisha Wang · Rui Tang · Wei Hua · Hujun Bao · Rui Wang
偏光カラー画像ノイズ除去
Zhuoxiao Li · Haiyang Jiang · Mingdeng Cao · yingqiang Zheng
NeFII: 近接場間接照明による反射率分解のための逆レンダリング
Haoqian Wu、Zhipeng Hu、Lincheng Li、Yongqiang Zhang、Changjie Fan、Xin Yu
分布外検出のための平衡エネルギー正則化損失
Hyunjun Choi、Hawook Jeong、Jin Choi
DeCo : 粗密対比ランク付けによる構成的時間グラウンディングのための分解と再構成
Lijin Yang · Quan Kong · Hsuan-Kung Yang · Wadim Kehl · 佐藤洋一 · 小堀憲正
CREPE: 視覚言語基礎モデルは構成的に推論できるか?
Zixian Ma · Jerry Hon · Mustafa Omer Gul · Mona Gandhi · Irena Gao · Ranjay Krishna
2D で 3D 自然を描く: 単一のセマンティック マスクからの自然シーンの合成を見る
Shangzhan Zhang · Sida Peng · Tianrun Chen · Linzhan Mou · Haotong Lin · Kaicheng Yu · Yiyi Liao · Xiaowei Zhou
Learning 3D-aware Image Synthesis with Unknown Pose Distribution
Zifan Shi · Yujun Shen · Yinghao Xu · Sida Peng · Yiyi Liao · Sheng Guo · Qifeng Chen · Dit-Yan Yeung
StyleSync: High-Fidelity Generalized and Personalized Lip Sync in Style-based Generator
Jiazhi Guan · Zhanwang Zhang · Hang Zhou · Tianshu Hu · Kaisiyuan Wang · Dongliang He · Haocheng Feng · Jingtuo Liu · Errui Ding · Ziwei Liu · Jingdong Wang
A Whac-A-Mole Dilemma: Shortcuts Come in Multiples Where Mitigating One Amplifies Others
Zhiheng Li · Ivan Evtimov · Albert Gordo · Caner Hazirbas · Tal Hassner · Cristian Canton · Chenliang Xu · Mark Ibrahim
Cooperation or Competition: Avoiding Player Domination for Multi-target Robustness by Adaptive Budgets
Yimu Wang · Dinghuai Zhang · Yihan Wu · Heng Huang · Hongyang Zhang
Gated Stereo: Joint Depth Estimation from Gated and Wide-Baseline Active Stereo Cues
Stefanie Walz · Mario Bijelic · Andrea Ramazzina · Amanpreet Walia · Fahim Mannan · Felix Heide
SliceMatch: Geometry-guided Aggregation for Cross-View Pose Estimation
Zimin Xia · Holger Caesar · Julian Kooij · Ted Lentsch
Towards Compositional Adversarial Robustness: Generalizing Adversarial Training to Composite Semantic Perturbations
Lei Hsiung · Yun-Yun Tsai · Pin-Yu Chen · Tsung-Yi Ho
StyleGAN Salon: Multi-View Latent Optimization for Pose-Invariant Hairstyle Transfer
Sasikarn Khwanmuang · Pakkapon Phongthawee · Patsorn Sangkloy · Supasorn Suwajanakorn
軽量 CAD モデル、またはゼロリアル 3D ペアを使用した 2D 表現での幾何学的認識プロパティの学習
Pattaramanee Arsomngern · Sarana Nutanong · Supasorn Suwajanakorn
可視性の制約された広帯域の照明スペクトル設計によるシーインイン- the-Dark
Muyao Niu Zhuoxiao Li Zhihang Zhong yingqiang Zheng
ToThePoint: リサイクルによる 3D 点群の効率的な対照学習
Xinglin Li Jiajing Chen Jinhui Ouyang Hanhui Deng Senem Velipasalar Di Wu
AUNet: 顔偽造検出のためのアクション ユニット間の関係の学習
Weiming Bai Yufan Liuジーペン・チャン・ビン・リー・ウェイミン・フー
3D 顔認識に対する物理世界の光学的敵対的攻撃
Yanjie Li Yiquan Li Xuelong Dai Songtao Guo Bin Xiao
敵対的攻撃に対する堅牢な単一画像反射除去
Zhenbo Song Zhenyuan Zhang Kaihao Zhang Wenhan Luo Zhaoxin F an · Wenqi Ren · Jianfeng Lu
The Enemy of My Enemyは私の友人です: 敵対的トレーニングを改善するための逆敵対者の探索
Junhao Dong Seyed-Mohsen Moosavi-Dezfooli Jianhuang Lai Xiaohua Xie
適応的敵対的蒸留による学生モデルの精度と堅牢性の向上
Bo Huang · Mingyang Chen · Yi Wang JUNDA LU Minhao Cheng Wei Wang
コンペティションの紹介クリーンな機能の混合により、標的を絞った敵対的な例の転送可能性を高める
Junyoung Byun · Myung-Joon Kwon · Seungju Cho · Yoonji Kim · Changick Kim
サードパーティ物体検出器のパフォーマンスを改善するための Angelic Patches
Wenwen Si · Shuo Li · Sangdon Park · Insup Lee · Osbert Bastani
兄弟攻撃: 顔に対する転移可能な敵対的攻撃の再考認識
Zexin Li、Bangjie ying、Taiping Yao、Junfeng Ding、Shohong Ding、Simin Chen、Cong Liu 最悪の
場合の帰属逸脱の実際的な上限
ファン・ワン、アダムス・コン
あなたは私の注意を引いています: ビジョン・トランスフォーマーはバックドアの下で悪い学習者ですか攻撃?
Zenghui Yuan、Pan Zhou、Kai Zou、Yu Cheng
ニューラル ネットワークのアーキテクチャー バックドア
Mikel Bober-Irizar、Ilia Shumailov、Yiren Zhao、Robert Mullins、Nicolas Papernot
ダイナミック ルーティング ニューラル ネットワークのダークサイド: 効率化に向けて バックドア インジェクション
Simin Chen、Hanlin Chen、Mirazul Haque、Cong Liu、Wei Yang スタイル
Adv: メタ スタイル敵対的トレーニングクロスドメインのフューショット学習用
Yuqian Fu · YU XIE · Yanwei Fu · Yu-Gang Jiang
顔のなりすまし対策のためのドメイン一般化の再考: 分離性と整列
Yiyou Sun · Yaojie Liu · Xiaoming Liu · Yixuan Li · Vincent Chu
風景をより平坦にするIn Differentially Private Federated Learning
Yifan Shi Yingqi Liu Kang Wei Li Shen Xueqian Wang Dacheng Tao
Confidence-aware Personalized Federated Learning via Variational Expectation Maximization
Junyi Zhu · Xingchen Ma · Matthew Blaschko
ScaleFL: Resource-Adaptive Federated Learning with Heterogeneous Clients
Fatih Ilhan · Gong Su · Ling Liu
MetaMix: Towards Corruption-Robust Continual Learning with Temporally Self-Adaptive Data Transformation
Zhenyi Wang · Li Shen · Donglin Zhan · Qiuling Suo · Yanjun Zhu · Tiehang Duan · Mingchen Gao
Revisiting Reverse Distillation for Anomaly Detection
Tran Dinh Tien · Anh Tuan Nguyen · Nguyen Tran · Huy Ta · Soan Duong · Chanh Nguyen · Steven Truong
Generating Anomalies for Video Anomaly Detection with Prompt-based Feature Mapping
Zuhao Liu · Xiao-Ming Wu · Dian Zheng · Kun-Yu Lin · Wei-Shi Zheng
Explicit Boundary Guided Semi-Push-Pull Contrastive Learning for Supervised Anomaly Detection
Xincheng Yao · Ruoqi Li · Jing Zhang · Jun Sun · Chongyang Zhang
Towards Universal Fake Image Detectors that Generalize Across Generative Models
Utkarsh Ojha · Yuheng Li · Yong Jae Lee
Edges to Shapes to Concepts: Adversarial Augmentation for Robust Vision
Aditay Tripathi · Rishubh Singh · Anirban Chakraborty · Pradeep Shenoy
Sequential training of GANs against GAN-classifiers reveals correlated “knowledge gaps” present among independently trained GAN instances
Arkanath Pathak · Nicholas Dufour
Masked Auto-Encoders Meet Generative Adversarial Networks and Beyond
Zhengcong Fei Mingyuan Fan Li Zhu Junshi Huang Xiaoming Wei Xiaolin Wei
品質に依存しない表現学習のためのセルフアテンションによるベクトル量子化
zhou yang Weisheng Dong Xin Li Mengluan Huang Yulin Sun Guangming Shi
PD-Quant: 予測差メトリックに基づくトレーニング後の量子化
Jiawei Liu Lin Niu Zhihang Yuan Dawei Yang Xinggang Wang Wenyu Liu
ゼロショット量子化ではハード サンプルが非常に重要
Huantong Li Xiangmiao Wu fanbing Lv Daihai Liao Thomas Li · Yonggang Zhang · Bo Han · Mingkui Tan
フェア スクラッチ チケット: 重みのない公平なスパース ネットワークの検索トレーニング
タン・ペンウェイ・ヤオ・ウェイ・リー・ジーコン・リウ・ヨン
Understanding Deep Generative Models with Generalized Empirical Likelihoods
Suman Ravuri · Mélanie Rey · Shakir Mohamed · Marc Deisenroth
Deep Deterministic Uncertainty: A New Simple Baseline
Jishnu Mukhoti · Andreas Kirsch · Joost van Amersfoort · Philip Torr · Yarin Gal
Compacting Binary Neural Networks by Sparse Kernel Selection
Yikai Wang · Wenbing Huang · Yinpeng Dong · Fuchun Sun · Anbang Yao
Bias in Pruned Vision Models: In-Depth Analysis and Countermeasures
Eugenia Iofinova · Alexandra Peste · Dan Alistarh
X-Pruner: eXplainable Pruning for Vision Transformers
Lu Yu · Wei Xiang
Deep Graph Reprogramming
Yongcheng Jing · Chongbin Yuan · Li Ju · Yiding Yang · Xinchao Wang · Dacheng Tao
FlowGrad: 勾配による生成 ODE の出力の制御
Xingchao Liu Lemeng Wu Shujian Zhang Chengyue Gong Wei Ping qiang liu
Exploring Data Geometry for Continuing Learning
Zhi Gao Chen Xu Feng Li Yunde Jia Mehrtash Harandi Yuwei Wu
ドメイン凸ゲームによる一般化の改善
Fangrui Lv · Jian Liang · Shuang Li · Jinming · Di Liu
Slack: Stable Learning of Augmentations with Cold-Start And Kl. Regularization
Juliette Marrie · Michael Arbel · Diane Larlus · Julien Mairal
Critical Learning Periods for Multisensory Integration in Deep Networks
Michael Kleinman Alessandro Achille Stefano Soatto
後方特徴射影による継続学習における線形分離性の維持
Qiao Gu Dongsub Shim Florian Shkurti
マルチレベルロジット蒸留
Ying Jin Jiaqi Wang Dahua Lin
特徴交換および活性化領域制約によるデータフリー知識蒸留
Shikang Yu Jiachen Chen Hu Han Shuqiang Jiang
マスクされたオートエンコーダの有効化効率的な知識蒸留者
Yutong Bai Zeyu Wang Junfei Xiao Chen Wei Huiyu Wang Alan Yuille Yuyin Zhou Cihang Xie
DKT: クラス増分学習のための多様な知識伝達トランスフォーマー
Xinyuan Gao Yuhang He · SongLin Dong Jie Cheng Xing Wei Yihong Gong
BlackVIP: ブラックボックスのビジュアルプロンプト堅牢な転移学習
Changdae Oh · Hyeji Hwang · Hee-young Lee · YongTaek Lim · Geunyoung Jung · Jiyoung Jung · Hosik Choi · Kyungwoo Song
PIVOT: Prompting for Video Continual Learning
Andres Villa · Juan Leon Alcazar · Motasem Alfarra · Kumail Alhamoud · Julio Hurtado · Fabian Caba · Alvaro Soto · Bernard Ghanem
MixPHM: Redundancy-Aware Parameter-Efficient Tuning for Low-Resource Visual Question Answering
Jingjing Jiang · Nanning Zheng
NIFF: Alleviating Forgetting in Generalized Few-Shot Object Detection via Neural Instance Feature Forging
Karim Guirguis · Johannes Meier · George Eskandar · Matthias Kayser · Bin Yang · Jürgen Beyerer
Learning with Fantasy: Semantic-Aware Virtual Contrastive Constraint for Few-Shot Class-Incremental Learning
Zeyin Song · Yifan Zhao · Yujun Shi · Peixi Peng · Li Yuan · Yonghong Tian
ドメイン一般化のためのテスト時間適応の改善
Liang Chen · Yong Zhang · Yibing Song · Ying Shan · Lingqiao Liu
TIPI: 変換不変性によるテスト時間適応
Anh Tuan Nguyen · Thanh Nguyen-Tang · Ser-Nam Lim · Philip Torr
ActMAD: テスト時間トレーニングのための分布を揃えるためのアクティベーション マッチング
Muhammad Mirza Mirza · Pol Jane Soneira · Wei Lin · Mateusz Kozinski · Horst Possegger · Horst Bischof
モダリティに依存しない偏り解消単一ドメインの一般化
Sanqing Qu、Yingwei Pan、Guang Chen、Ting Yao、changjun jiang、Tao Mei
ALOFT: A Lightweight MLP-like Architecture with Dynamic Low-frequency Transform for Domain Generalization
Jintao Guo · Na Wang · Lei Qi · Yinghuan Shi
C-SFDA: A Curriculum Learning Aided Self-Training Framework for Efficient Source Free Domain Adaptation
Nazmul Karim · Niluthpol Chowdhury Mithun · Abhinav Rajvanshi · Han-pang Chiu · Supun Samarasekera · Nazanin Rahnavard
Adjustment and Alignment for Unbiased Open Set Domain Adaptation
Wuyang Li · Jie Liu · Bo Han · Yixuan Yuan
Semi-Supervised Domain Adaptation with Source Label Adaptation
Yu-Chu Yu · Hsuan-Tien Lin
Dynamically Instance-Guided Adaptation: A Backward-free Approach for Test-Time Domain Adaptive Semantic Segmentation
Wei Wang · Zhun Zhong · Weijie Wang · Xi Chen · Charles Ling · Boyu Wang · Nicu Sebe
FCC: ロングテール視覚認識のための特徴クラスタ圧縮
Jian Li · Ziyao Meng · daqian Shi · Rui Song · Xiaolei Diao · Jingwen Wang · Hao Xu
DISC: 動的インスタンス固有の選択と修正によるノイズの多いラベルからの学習
Yifan Li Hu Han Shiguang Shan Xilin CHEN
表現強化によるスーパークラス学習
Zeyu Gan Suyun Zhao Jinlong Kang Liyuan Shang Hong Chen Cuiping Li
同僚から学ぶことによる選択的視覚的質問の回答の改善
コランタン・ダンセット・スペンサー・ホワイトヘッド・リシャブ・マヘシュワリー・シャンムカ・ラーマクリシュナ・ヴェダンタム・ステファン・シェーラー・シンレイ・チェン・マチュー・コード マーカス・ロールバッハ
Difficulty-based Sampling for Debiased Contrastive Representation Learning
Taeuk Jang · Xiaoqian Wang
Token Boosting for Robust Self-Supervised Visual Transformer Pre-training
Tianjiao Li · Lin Geng Foo · Ping Hu · Xindi Shang · Hossein Rahmani · Zehuan Yuan · Jun Liu
HyperMatch: Noise-Tolerant Semi-Supervised Learning via Relaxed Contrastive Constraint
Beitong Zhou · Jing Lu · Kerui Liu · Yunlu Xu · Zhanzhan Cheng · Yi Niu
Open-Set Likelihood Maximization for Few-Shot Learning
Malik Boudiaf · Etienne Bennequin · Myriam Tami · Antoine Toubhans · Pablo Piantanida · CELINE HUDELOT · Ismail Ayed
Transductive Few-Shot Learning with Prototypes Label-Propagation by Iterative Graph Refinement
Hao Zhu · Piotr Koniusz
相互情報の最大化と最小化によるディープフェアクラスタリング: 理論、アルゴリズム、メトリクス
Pengxin Zeng · Yunfan Li · Peng Hu · Dezhong Peng · Jiancheng Lv · Xi Peng
ディープマルチビュークラスタリングにおける自己監視と対照的調整の効果について
Daniel J Trosten · Sigurd Løkse · Robert Jensen · Michael Kampffmeyer
サンプルレベルのマルチビュー グラフ クラスタリング
Yuze Tan · Yixi Liu · Shudong Huang · Wentao Feng · Jiancheng Lv
構造強化再帰変分オートエンコーダーによる既知オブジェクトと未知オブジェクトの識別
Aming WU · Cheng Deng
GEN: Softmax ベースの配布外検出の限界を押し上げる
Xixi Liu、Yaroslava Lochman、Christopher Zach
RankMix: 多様なサイズと不均衡なカテゴリを持つスライド画像全体を分類する弱教師あり学習のためのデータ拡張
Yuan-Chih Chen · Chun-Shien Lu
両方の長所: 表形式データと画像データによるマルチモーダル対照学習
Paul Hager · Martin J. Menten · Daniel Rueckert
DeGPR: マルチクラス細胞の検出と計数のためのディープガイド事後正則化
Aayush Tyagi、Chirag Mohapatra、Prasenjit Das、Govind Makharia、Lalita Mehra、Prathosh AP、Mausam。
OCELOT: 組織病理学用の組織データセット上の重複セル
Jeongun Ryu、Aaron Valero Puche、JaeWoong Shin、Seonwook Park、Biagio Brattoli、Jinhee Lee、Wonkyung Jung、Soo Ik Cho、Kyunghyun Paeng、Chan-Young Ock、Donggeun Yuo、Sérgio Pereira
SQUID: 教師なし異常検出のための深層フィーチャー インペインティング
Tiange Xiang Yixiao Zhang Yongyi Lu Alan Yuille Chaoyi Zhang Weidong Cai Zongwei Zhou
Devil is in the Queries: Advancing Mask Transformers for Real-world Medical Image Segmentation and Out-of-Distribution Localization
Mingze Yuan Yingda Xia Hexin Dong Zifan Chen Jiawen Yao Mingyan Qiu Ke Yan Xiaoli ying Yu Shi Xin Chen Zaiyi Liu Bin Dong Jingren Zhou Le Lu Ling Zhang Li Zhang MagicNet
: Magic-Cube Partition and Recovery による半教師あり多臓器セグメンテーション
Duowen Chen · Yunhaoバイ・ウェイ・シェン・チンリー・リー・楽泉宇・ヤン・ワン
(ML)
2
P エ​​ンコーダ: マルチラベル ゼロショット学習のためのチャネルクラス相関の探索について
Ziming Liu Song Guo Xiaocheng Lu Jingcai Guo Jiewei Zhang Yue Zeng Fushuo Huo
堅牢な半教師あり学習のための分散型セマンティック プルーニング
Yu Wang Pengchong Qiao Chang Liu Guoli Song Xiawu Zheng Jie Chen
ドメイン適応物体検出器の対比平均教師
Shengcao Cao Dhiraj Joshi Liangyan Gui Yu-Xiong Wang
クロスドメイン物体検出の調和教師
Jinhong Deng · Dongli Xu · Wen Li · Lixin Duan
階層監視およびシャッフル データ3D 半教師あり物体検出のための拡張
Chuandong Liu · CHENQIANG GAO · Fangcen Liu · Pengcheng Li · Deyu Meng · Xinbo Gao
Semi-DETR: 検出トランスによる半教師あり物体検出Jiacheng Zhang Xiangru Lin Wei Zhang Kuo Wang Xiao Tan Junyu Han Errui Ding Jingdong Wang Guanbin Li増分物体検出用の
連続検出トランスYaoyao Liu Bernt Schiele、Andrea Vedaldi、Christian Rupprecht DA-DETR : 情報融合を備えたドメイン適応検出トランスフォーマーJingyi Zhang · Jiaxing Huang · Zhipeng Luo · Gongjie Zhang · Xiaoqin Zhang · Shijian Lu CIGAR: クロスモダリティ グラフによるドメイン適応オブジェクト検出の推論Y abo Liu Jinghua Wang · Chao Huang · Yaowei Wang · Yong Xuボックスレベルのアクティブ検出







Mengyao Lyu Jundong Zhou Hui Chen Yi-Jie Huang Dongdong Yu Yaqian Li Yandong Guo Yuchen Guo Liuyu Xiang Guiguang Ding 選択的クエリ想起によるクエリベースの
オブジェクト検出トレーニングの強化
Fangyi Chen Han Zhang Kai Hu · Yu-Kai Huang · Chechen Zhu · Marios Savvides
Vision Transformers は優れたマスク自動ラベラー
Shiyi Lan、Xitong Yang、Zhiding Yu、Zuxuan Wu、Jose Alvarez、Anima Anandkumar きめ細かい分類の
ための弱教師付きポスチャ マイニング
Zhenchao Tang、Hualin Yang、Calvin Yu-Chian Chen
IDGI: フレームワーク統合された勾配から説明ノイズを除去するには
Ruo Yang、Binghui Wang、Mustafa Bilgic
アクティブな微調整: 事前トレーニング微調整パラダイムでのアノテーション バジェットの活用
Yichen Xie Han Lu Junchi Yan Xiaokang Yang Makimasa 富塚 Wei Zhan
半教師ありセマンティック セグメンテーションのインスタンス固有およびモデル適応型の監督
Zhen Zhao Sifan Long Jimin Pi Jingdong Wang Luping Zhou
Long-知識発掘による自己異種統合による尾付視覚認識
Yan Jin Mengke LI Yang Lu Yiu-ming Cheung Hanzi Wang
Foundation Model Drives Weakly Incremental Learning for Semantic Segmentation
Chaohui Yu Q iang Zhou · Jinliang Li · Jianlong Yuan · Zhibin Wang · Fan Wang
Out弱く監視されたセマンティック セグメンテーションに対する -of-Candidate の修正
Zesen Cheng · Pengchong Qiao · Kehan Li · Siheng Li · Pengxu Wei · Xiangyang Ji · Li Yuan · Chang Liu · Jie Chen FastInst
: リアルタイムインスタンスセグメンテーションのためのシンプルなクエリベースモデル
Junjie He · Pengyu Li · Yifeng Geng · Xuansong Xie
によるセマンティック セグメンテーション モデルの調整について: 分析とアルゴリズム
Dongdong Wang Boqing Gong Liqiang Wang
Vision Transformers を使用した効率的なセマンティック セグメンテーションのためのコンテンツ認識型トークン共有
Chenyang Lu Daan de Geus Gijs Dubbelman
超リッチ コンテキストを使用した超高解像度セグメンテーション : A Novel Benchmark
Deyi Ji、Feng Zhao、Hongtao Lu、Mingyuan Tao、Jieping Ye
クラス親和性転送による少数ショットのセマンティック画像合成
Marlene Careil · Jakob Verbeek · Stéphane Lathuilière
合成画像によるネットワークフリーの教師なしセマンティック セグメンテーション
Qianli Feng · Raghdeep Gadde · Wentong Liao · Eduard Ramon · Aleix Martinez
MISC210K: マルチインスタンス セマンティック対応のための大規模データセット
Yixuan Sun Yiwen Huang · HaJing Guo · Yuzhou zhao · Runmin wu · yizhou yu · Weifeng Ge · wenqiang zhang
Gres: Generalize Referring EXPRESINTATATION
LIANG LIANG LIANGHUIDHUIIIDOIIIIIDEG · XUDON G Jiang
数ショット画像認識のセマンティックプロンプト goao
Chen · Chenyang Si · zhang zhang · liang · Liang Wang Zilei Wang Tieniu Tan
画像セグメンテーションを参照するためのトランスフォーマーを使用した対照的なグループ化
Jiajin Tang · Ge Zheng · Cheng Shi · Sibei YANG
分解されたソフト プロンプト ガイド付き融合による構成的ゼロショット学習の強化
Xiaocheng Lu · Song Guo · Ziming Liu · Jingcai Guo
GP-VTON: 共同ローカルフローによる汎用仮想試着に向けてグローバル解析学習
Zhenyu Xie Zaiyu Huang Xin Dong Fuwei Zhao Haoye Dong Xijin Zhang Feida Zhu Xiaodan Liang
OvarNet: オープン語彙オブジェクト属性認識に向けて
Keyyan Chen Xiaolong Jiang Yao Hu Xu Tang Yan Gao · Jianqi Chen · Weidi Xie
HOICLIP: 効率的な知識伝達視覚言語モデルによる HOI 検出
Shan Ning · Longtian Qiu · Yongfei Liu · Xuming He
DetCLIPv2: 単語領域アライメントによるスケーラブルなオープン語彙オブジェクト検出 事前トレーニング
Lewei Yao Jianhua Han Xiaodan Liang Dan Xu Wei Zhang Zhenguo Li Hang Xu
段階的類似性監督によるデータ効率の高い大規模場所認識
Maria Leyva- Vallina · Nicola Strisciuglio · Nicolai Petkov
ConZIC: サンプリングベースの研磨による制御可能なゼロショット画像キャプション
Zequn Zeng、Hao Zhang、Zhengjue Wang、Ruiying Lu、Dongsheng Wang、Bo Chen
最小距離で分離されたハッシュ センターによるディープ ハッシュ
Liangdao Wang、Yan Pan、Cong Liu、 Hanjiang Lai、Jian ying、Ye Liu
ビジュアル分布キャリブレーションとクロスモーダル分布調整を使用したフューショット学習
Runqi Wang · Hao ZHENG · Xiaoyue Duan · Jianzhuang Liu · Yuning Lu · Tian Wang · Songcen Xu · Baochang Zhang
Masked Autoencoding Does Not Help Natural Language Supervision at Scale
Floris Weers · Vaishaal Shankar · Angelos Katharopoulos · Yinfei Yang · Tom Gunter
Improving Cross-Modal Retrieval with Set of Diverse Embeddings
Dongwon Kim · Namyup Kim · Suha Kwak
Revisiting Self-Similarity: Structural Embedding for Image Retrieval
Seongwon Lee · Suhyeon Lee · Hongje Seong · Euntai Kim
LANIT: Language-Driven Image-to-Image Translation for Unlabeled Data
Jihye Park · Sunwoo Kim · Soohyun Kim · Seokju Cho · Jaejun Yoo · Youngjung Uh · Seungryong Kim
Scaling Language-Image Pre-training via Masking
Yanghao Li · Haoqi Fan · Ronghang Hu · Christoph Feichtenhofer · Kaiming He
Variational Distribution Learning for Unsupervised Text-to-Image Generation
MINSOO KANG · Doyup Lee · Jiseob Kim · Saehoon Kim · Bohyung Han
Semantic-Conditional Diffusion Networks for Image Captioning
Jianjie Luo · Yehao Li · Yingwei Pan · Ting Yao · Jianlin Feng · Hongyang Chao · Tao Mei
Zero-Shot Everything Sketch-Based Image Retrieval, and in Explainable Style
Fengyin Lin · Mingkang Li · Da Li · Timothy Hospedales · Yi-Zhe Song · Yonggang Qi
MAGVLT: Masked Generative Vision-and-Language Transformer
Sungwoong Kim · Daejin Jo · Donghoon Lee · Jongmin Kim
SketchXAI: A First Look at Explainability for Human Sketches
Zhiyu Qu · Yulia Gryaditskaya · Ke Li · Kaiyue Pang · Tao Xiang · Yi-Zhe Song
Learning Geometry-aware Representations by Sketching
Hyundo Lee · Inwoo Hwang · Hyunsung Go · Won-Seok Choi · Kibeom Kim · Byoung-Tak Zhang
Towards Generalisable Video Moment Retrieval: Visual-Dynamic Injection to Image-Text Pre-Training
Dezhao Luo · Jiabo Huang · Shaogang Gong · Hailin Jin · Yang Liu
Vita-CLIP: Video and text adaptive CLIP via Multimodal Prompting
Syed Talal Wasim · Muhammad Muzammal Naseer · Salman Khan · Fahad Khan · Mubarak Shah
Query-Dependent Video Representation for Moment Retrieval and Highlight Detection
WonJun Moon · Sangeek Hyun · SangUk Park · Dongchan Park · Jae-Pil Heo
Are Binary Annotations Sufficient? Video Moment Retrieval via Hierarchical Uncertainty-based Active Learning
Wei Ji · Renjie Liang · Zhedong Zheng · Wenqiao Zhang · Shengyu Zhang · Juncheng Li · Mengze Li · Tat-Seng Chua
Improving Weakly Supervised Temporal Action Localization by Bridging Train-Test Gap in Pseudo Labels
Jingqiu Zhou · Linjiang Huang · Liang Wang · Si Liu · Hongsheng Li
PivoTAL: Prior-Driven Supervision for Weakly-Supervised Temporal Action Localization
Mamshad Nayeem Rizve · Gaurav Mittal · Ye Yu · Matthew Hall · Sandra Sajeev · Mubarak Shah · Mei Chen
Open Set Action Recognition via Multi-Label Evidential Learning
Chen Zhao · Dawei Du · Anthony Hoogs · Christopher Funk
Object Discovery from Motion-Guided Tokens
Zhipeng Bao Pavel Tokmakov Yu-Xiong Wang Adrien Gaidon Martial Hebert
構造化キーポイント プーリングによる統合キーポイントベースのアクション認識フレーム
ワーク 八馬良 佐藤文昭 関井大樹
アクション認識のためのビデオテスト時間適応
Wei Lin Muhammad Mirza ミルザ・マテウシュ・コジンスキー・ホルスト・ポセガー・ヒルデKuehne · Horst Bischof
トリミングされていないビデオにおけるオーディオビジュアル イベントの高密度ローカライズ: 大規模ベンチマークとベースライン
Tiantian Geng · Teng WANG · Jinming Duan · Runmin Cong · Feng Zheng
アクティブ スピーカー検出のための軽量モデル
Junhua Liao · Haihan Duan · Kanghui Feng、WanBing Zhao、Yanbing Yang、Liangyin Chen
AVFormer: ゼロショット AV-ASR の凍結音声モデルにビジョンを注入
Paul Honsuck Seo、Arsha Nagrani、Cordelia Schmid
自己中心的なオーディオビジュアル オブジェクトのローカリゼーション
Chao Huang、Yapeng Tian、Anurag Kumar、Chenliang Xu
マスクされたビジュアル モデリングによるエンドツーエンドのビデオ言語トランスフォーマーの実証研究
Tsu-Jui Fu、Linjie Li · Zhe Gan · Kevin Lin · William Yang Wang · Lijuan Wang · Zicheng Liu
メモリ効率の高い双方向トランスフォーマーによる長いビデオのエンドツーエンドの生成モデリングに向けて
Jehoon Yu · Semin Kim · Doyup Lee · Chiheon Kim · Seunghoon Hon
短編とグラフ階層による長期追跡
Orcun Cetintas、Guillem Braso、Laura Leal-Taixé
低遅延イベント処理のための階層型ニューラル メモリ ネットワーク
浜口隆平 古川康隆 大西正樹 桜田健
マスクフリービデオインスタンスセグメンテーション
Lei Ke Martin Danelljan Henghui Ding Yu-Wing Tai Chi-Keung Tang Fisher Yu シーン
アウェアビデオ異常検出のための階層的セマンティックコントラスト
Shengyang sun Xiaojin Gong
「オブジェクト」の破壊ビデオ オブジェクト セグメンテーション
Pavel Tokmakov Jie Li Adrien Gaidon
VideoTrack: ビデオ トランスフォーマーによるオブジェクト追跡の学習
Fei Xie Lei Chu Jiahao Li Yan Lu Chao Ma
再発のない再発: 深い平衡モデルによる安定したビデオ ランドマーク検出
Paul Micaelli Arash Vahdat Honxu ying Jan Kautz Pavlo Molchanov
ビデオにおける公平なシーングラフ生成
Sayak Nag · Kyle Min · Subarna Tripathi · Amit Roy-Chowdhury
Graph Representation for Order-aware Visual Transformation
Yue Qiu · Yanjun Sun · Fumiya Matsuzawa · Kenji Iwata · Hirokatsu Kataoka
Prototype-based Embedding Network for Scene Graph Generation
Chaofan Zheng · Xinyu Lyu · Lianli Gao · Bo Dai · Jingkuan Song
Efficient Mask Correction for Click-Based Interactive Image Segmentation
Fei Du · Jianlong Yuan · Zhibin Wang · Fan Wang
G-MSM: Unsupervised Multi-Shape Matching with Graph-based Affinity Priors
Marvin Eisenberger · Aysim Toker · Laura Leal-Taixé · Daniel Cremers
Shape-Erased Feature Learning for Visible-Infrared Person Re-Identification
Jiawei Feng · Ancong Wu · Wei-Shi Zheng
自己教師あり視覚表現学習のための混合オートエンコーダー
Kai Chen Zhili LIU Lanqing HONG Hang Xu Zhenguo Li Dit-Yan Yeung
見ているものを見つめる: 再構成を伴わないマスクされた画像モデリング
Honwei Xue Peng Gao Honyang Li Yu Qiao · Hao Sun · Houqiang Li · Jiebo Luo
ResFormer: 多重解像度トレーニングによる ViT のスケーリング
Rui Tian · Zuxuan Wu · Qi Dai · Han Hu · Yu Qiao · Yu-Gang Jiang
脳の向こう側を見る: ビジョン デコーディングのためのスパース マスク モデリングによる条件付き拡散モデル
Zijiao Chen Jiaxin Qing Tiange Xiang Wan Lin Yue Juan Zhou Zhou
DropKey for Vision Transformer
Bonan Li yinghan Hu Xuecheng Nie Congying Han Xiangjian Jiang Tiande Guo Luoqi Liu
Vision Transformer with Super Token Sampling
Huaibo Huang · Xiaoqiang Zhou · Jie Cao · Ran He · Tieniu Tan
Sparsifiner: Learning Sparse Instance-Dependent Attention for Efficient Vision Transformers
Cong Wei · Brendan Duke · Ruowei Jiang · Parham Aarabi · Graham Taylor · Florian Shkurti
All are Worth Words: A ViT Backbone for Diffusion Models
Fan Bao · Shen Nie · Kaiwen Xue · Yue Cao · Chongxuan Li · Hang Su · Jun Zhu
Boost Vision Transformer with GPU-Friendly Sparsity and Quantization
Chong Yu · Tao Chen · Zhongxue Gan · Jiayuan Fan
DisCo-CLIP: A Distributed Contrastive Loss for Memory Efficient CLIP Training
Yihao Chen · Xianbiao Qi · Jianan Wang · Lei Zhang
Structured Sparsity Learning for Efficient Video Super-Resolution
Bin Xia · Jingwen He · Yulun Zhang · Yitong Wang · Yapeng Tian · Wenming Yang · Luc Van Gool
Efficient Semantic Segmentation by Altering Resolutions for Compressed Videos
Yubin Hu · Yuze He · Yanghao Li · Jisheng Li · Yuxing Han · jiangtao wen · Yong-jin Liu
Neural Video Compression with Diverse Contexts
Jiahao Li · Bin Li · Yan Lu
Large-capacity and Flexible Video Steganography via Invertible Neural Network
Chong Mou · Youmin Xu · Jiechong Song · Chen Zhao · Bernard Ghanem · Jian Zhang
Towards Accurate Image Coding: Improved Autoregressive Image Generation with Dynamic Vector Quantization
Mengqi Huang · Zhendong Mao · Zhuowei Chen · Yongdong Zhang
バイナリ潜在拡散
Ze Wang、Jiang Wang、Zicheng Liu、Qiang Qiu
潜在を調整する: 潜在拡散モデルによる高解像度ビデオ合成
Andreas Blattmann、Robin Rombach、Huan Ling、Tim Dockhorn、Seung Wook Kim、Sanja Fidler、Karsten Kreis
拡散確率Model Made Slim
Xingyi Yang、Daquan Zhou、Jiashi Feng、Xinchao Wang
事前トレーニング済み 2D 拡散モデルから 3D 逆問題を解く
Hyungjin Chung、Dohoon Ryu、Michael McCann、Marc Klasky、Jong Ye
編集: 結合変換による正確な拡散逆変換
Bram Wallace、 Akash Gokul および Nikhil Naik の
安全な潜在的拡散: 拡散モデルにおける不適切な変性の軽減
Patrick Schramowski Manuel Brack Björn Deiseroth Kristian Kersting
GLIGEN: オープンセットのグラウンデッド テキストから画像への生成
Yuheng Li Haotian Liu Qingyang Wu Fangzhou Mu Jianwei Yang Jianfeng Gao Chunyuan Li Yong Jae Lee
DreamBooth: 被写体に合わせたテキストから画像への拡散モデルの微調整-駆動生成
Nataniel Ruiz Yuanzhen Li Varun Janpani Yael Pritch Michael Rubinstein Kfir Aberman
レイアウト拡散: レイアウトから画像への生成のための制御可能な拡散モデル
Guangcong Zheng Xianpan Zhou Xuewei Li · Zhongang Qi · Ying Shan · Xi Li
アフォーダンス拡散: ハンドオブジェクトの合成インタラクション
Yufei Ye · Xueting Li · Abhinav Gupta · Shalini De Mello · Stan Birchfield · Jiaming Song · Shubham Tulsiani · Sifei Liu
Scene作曲者: Any-Level Semantic Image Synthesis
Yu Zeng · Zhe Lin · Jianming Zhang · Qing Liu · John Collomosse · Jason Kuen · Vishal Patel
ビジュアルアーキタイプからの手書きテキスト生成
Vittorio Pippi · Silvia Cascianelli · Rita Cucchiara
イメージマットの参照
Jizhizi Li · Jing Zhang · Dacheng Tao
任意スタイルのフォント生成のための神経変換フィールド
Bin Fu · Junjun He · Jianjun Wang · Yu Qiao
SmartBrush: Text拡散モードを使用した形状ガイド付きオブジェクトの修復
Shaoan Xie Zhifei Zhang Zhe Lin Tobias Hinz Kun Zhang
イグザンプラベースの画像変換のためのマスクされた適応トランスフォーマー
chang jiang Fei Gao Biao Ma Lin Yuhao Nannan Wang Gang Xu
列行エンタングルドピクセル合成を備えた効率的なスケール不変ジェネレーター
Thuan Nguyen Thanh Le Anh Tran
RWSC-Fusion: リージョンごとのスタイル制御フュージョン禁止された X 線セキュリティ画像合成ネットワーク
luwen duan Min Wu Lijian Mao Jun ying Xiong Jianping Xi Li
芸術的画像の美的評価に向けて: 大規模データセットと新しい手法
Ran Yi Haoyuan Tian Zhihao Gu Yu-Kun Lai Paul Rosin
Omni軽量画像超解像度のためのアグリゲーション ネットワーク
Hang Wang Xuanhong Chen Bingbing Ni Yutian Liu Jinfan Liu
Activating More Pixels in Image Super-Resolution Transformer
Xiangyu Chen · Xintao Wang · Jiantao Zhou · Yu Qiao · Chao Dong
Spatial-Frequency Mutual Learning for Face Super-Resolution
Chenyang Wang · Junjun Jiang · Zhiwei Zhong · Xianming Liu
Kernel Aware Resampler
Michael Bernasconi · Abdelaziz Djelouah · Farnood Salehi · Markus Gross · Christopher Schroers
RGB no more: Minimally-decoded JPEG Vision Transformers
Jeongsoo Park · Justin Johnson
Multi-Realism Image Compression with a Conditional Generator
Eirikur Agustsson · David Minnen · George Toderici · Fabian Mentzer
Learning to Exploit the Sequence-Specific Prior Knowledge for Image Processing Pipelines Optimization
Haina Qin Longfei Han Weihua Xiong Juan Wang Wentao Ma Bing Li Weiming Hu
ブラインド画質評価用の品質を意識した事前トレーニング済みモデル
Kai Zhao Kun Yuan Ming Sun Mading Li Xing Wen
ロバストな教師なし StyleGAN Image Restoration
Yohan Poirier-Ginter Jean-Francois Lalonde
RIDCP : 高品質コードブックによるリアルイメージのかすみ除去の活性化 事前の
Rui-Qi Wu Zheng-Peng Duan Chunle Guo Zhi Chai Chongyi Li
安定性、解釈可能、軽量のハイパースペクトル超解像度を目指して
Wenjin Guo · Weiying Xie · Kai Jiang · Yunsong Li · Jie Lei ·
圧縮スペクトル イメージングのためのスペクトルおよび空間にわたる事前混合を使用したLeyuan Fang残留劣化学習展開フレームワーク
Yubo Dong Dahua Gao Tian Qiu Yuyan Li Minxi Yang Guangming Shi
ペアの低照度インスタンスから簡単な低照度画像エンハンサーを学習
Zhenqi Fu Yan Yang Xiaotong Tu Yue Huang Xinghao Ding Kai-Kuang Ma
写真画像の深い色差メトリクスを学習
Haoyu Chen Zhihua Wang Yang Yang Qilin Sun Kede Ma
新しいデータセットと劣化モデルを使用した実践的な SDR から HDRTV へのアップコンバージョンの学習
Cheng Guo Leidong Fan Ziyu Xue Xiuhua Jiang
BiasBed - 厳密なテクスチャ バイアス評価
Nikolai Kalischek、Rodrigo Daudt、Torben Peters、Reinhardファーラー · ヤン D. ウェグナー · コンラッド シンドラー
ピクセルとパッチレベルによる統合 HDR イメージング手法
Qingsen Yan · Weiye Chen · song zhang · Yu Zhu · Jinqiu Sun · Yanning Zhang
Gated Multi-Resolution Transfer Network for Burst Restoration and Enhancement
Nancy Mehta · Akshay Dudhane · Subrahmanyam Murala · Syed Waqas Zamir · Salman Khan · Fahad Khan
Deep Discriminative Spatial and Temporal Network for Efficient Video Deblurring
Jinshan Pan · Boming Xu · Jiangxin Dong · Jianjun Ge · Jinhui Tang
1000 FPS HDR Video with a Spike-RGB Hybrid Camera
Yakun Chang · Chu Zhou · Yuchen Hong · hu liwen · Chao Xu · Tiejun Huang · Boxin Shi
Exploring Motion Ambiguity and Alignment for High-Quality Video Frame Interpolation
Kun Zhou · Wenbo Li · Xiaoguang Han · Jiangbo Lu
焦点化された動き推定によるレンジヌル空間ビデオ フレーム補間
Zhiyang Yu、Yu Zhang、Dongqing Zou、Xijun Chen、Jimmy Ren、Shunqing Ren
PDAVIS イベントによる深偏光再構成
Haiyang Mei、Zuowen Wang、Xin Yang、Xiaopeng Wei、Tobi Delbruck
教師なし空間- 複数のモーションの一時的に一貫したセグメンテーションのためのタイム ネットワークEtienne
Meunier Patrick Bouthemy
NeMo: Learning 3D Neural Motion Fields from Multiple Video Instances of the Same Action

TranSG: トランスフォーマー ベースのスケルトン グラフ プロトタイプ 構造軌跡を使用した対照学習による個人再識別の再構成
Haocong Rao Chunyan Miao
FLAG3D: 言語指導を備えた 3D フィットネス アクティビティ データセット
Yansong Tang Jinpeng Liu Aoyang Liu Bin Yang Wenxun Dai · Yongming Rao · Jiwen Lu · Jie Zhou · Xiu Li
MetaPortrait: 高速パーソナライズ適応によるアイデンティティ保持トーキング ヘッド生成
Bowen Zhang · Chenyang Qi · Pan Zhang · Bo Zhang · HsiangTao Wu · Dong Chen · Qifeng Chen · Yong Wang · Fang Wen
アダプティブによる特徴表現学習微表情認識のための変位生成と変換融合
Zhijun Zhai · Jianhui Zhao · Chengjiang Long · Wenju Xu · He Shuangjiang · huijuan zhao
Clothing-Change Feature Augmentation for Person Re-Identification
Ke Han · Shaogang Gong · Yan Huang · Liang Wang · Tieniu Tan
MOTRv2: Bootstrapping End-to-End Multi-Object Tracking by Pretrained Object Detectors
Yuang Zhang · Tiancai Wang · Xiangyu Zhang
Camouflaged Object Detection with Feature Decomposition and Edge Reconstruction
Chunming He · Kai Li · Yachao Zhang · Longxiang Tang · Yulun Zhang · Zhenhua Guo · Xiu Li
Source-free Adaptive Gaze Estimation with Uncertainty Reduction
Xin Cai · Jiabei Zeng · Shiguang Shan · Xilin CHEN
PyPose: A Library for Robot Learning with Physics-based Optimization
チェン・ワン・ダソン・ガオ・クアン・シュー・ジュンイー・ゲン・ヤオユー・フー・ユヘン・チウ・ボーウェン・リー・ファン・ヤン・ブレイディ・ムーン・アビナブ・パンディ・アーリアン FNU Jiahe Xu Tianhao Wu Haonan He Daning Huang Zhonqiang Ren Shibo Zhao・Taimeng Fu・Pranay Reddy Anthireddy・Xiao Lin・Wenshan Wang・Jingnan Shi · Rajat Talak · Kun Cao · Yi Du · Han Wang · Huai Yu · Shanzhao Wang · Siyu Chen · Ananth Kashyap · Rohan Bandaru · Karthik Dantu · Jiajun Wu · Lihua Xie · Luca Carlone · Marco Hutter · Sebastian Scherer 刺激検証は普遍的
ですマルチモーダルな人間の軌跡予測における効果的なサンプラー
Jianhua Sun · Yuxuan Li · Liang Chai · Cewu Lu
StarCraftImage: マルチエージェント環境向けの空間推論方法のプロトタイピングのためのデータセット
Sean Kulinski、Nicholas Waytowich、James Hare、David I. Inouye
ProphNet: アンカー情報に基づいた提案による効率的なエージェント中心のモーション予測
Xishun Wang、 Tong Su、Fang Da、Xiaodong Yang
Think Twice before Driving: Towards Scalable Decoders for End-to-自動運転終了
xiaosong JIA · Penghao wu · Li Chen · Jiangwei xiel He · JUNCHI yan · Honyang Li
Humanbench: Toward General Human-Centric Perception with
Yuanzheng Ci · LEI BAI · Feng Zhu · Haiyang Yang · Li Yi · Rui Zhao · Wanli欧陽
BEV 誘導による運転知覚のためのマルチモダリティ融合
Yunze Man、Liangyan Gui、Yu-Xiong Wang
ロバストかつスケーラブルなガウス過程回帰とその応用
Yifan Lu · Jiayi Ma · Leyuan Fang · Xin Tian · Junjun Jiang
イベントベースの増分オプティカル フロー推定のための接線方向に延長されたガウス ビリーフ伝播
永田 淳 · 関川 祐介 ロバスト
な幾何推定のための適応アニーリング
Sidhartha Chitturi · Lalit Manam · Venu Madhav Govindu
ステレオ マッチングのための反復幾何エンコーディング ボリューム
Xu Gangwei · Xianqi Wang · Xiaohuan Ding · Xin Yang
PMatch: 密な幾何学的マッチングのためのペア マスク画像モデリング
Shengjie Zhu · Xiaoming Liu
一貫した局所特徴マッチングのための適応型スポットガイド トランスフォーマー
Jiahuan Yu · Jiahao Chang · Jianfeng He · Tianzhu Zhang · Jiyang Yu · Feng Wu
Learning Rotation-Equivariant Features for Visual Correspondence
Jongmin Lee · Byungjin Kim · Seungwook Kim · Minsu Cho
UTM: A Unified Multiple Object Tracking Model with Identity-Aware Feature Enhancement
Sisi You · Hantao Yao · Bing-Kun BAO · Changsheng Xu
Conjugate Product Graphs for Globally Optimal 2D-3D Shape Matching
Paul Rötzer · Zorah Laehner · Florian Bernard
LP-DIF: Learning Local Pattern-specific Deep Implicit Function for 3D Objects and Scenes
Meng Wang · Yushen Liu · Yue Gao · Kanle Shi · Yi Fang · Zhizhong Han
HGNet: Learning Hierarchical Geometry from Points, Edges, and Surfaces
Ting Yao · Yehao Li · Yingwei Pan · Tao Mei
Neural Intrinsic Embedding for Non-rigid Point Cloud Matching
puhua jiang · Mingze Sun · Ruqi Huang
PointClustering: Unsupervised Point Cloud Pre-training using Transformation Invariance in Clustering
Fuchen Long · Ting Yao · Zhaofan Qiu · Lusong Li · Tao Mei
Self-positioning Point-based Transformer for Point Cloud Understanding
Jinyoung Park · Sanghyeok Lee · Sihyeon Kim · Yunyang Xiong · Hyunwoo Kim
PointConvFormer: Revenge of the Point-Based Convolution
Wenxuan Wu · Li Fuxin · Qi Shan
Learning 3D Representations from 2D Pre-trained Models via Image-to-Point Masked Autoencoders
Renrui Zhang · Liuhui Wang · Yu Qiao · Peng Gao · Hongsheng Li
幾何学と不確実性を認識した 3D 点群クラス インクリメンタル セマンティック セグメンテーション
Yuwei Yang Munawar Hayat Zhao Jin Chao Ren yingjie Lei
複数の悪天候条件下での画像復元のための気象一般および気象固有の機能の学習
Yului Zhu Tianyu Wang · Xueyang Fu Xuanyu Yang Xin Guo Jifeng Dai Yu Qiao Xiaowei Hu
PartSLIP: 事前学習済み画像言語モデルによる 3D 点群のローショット パーツ セグメンテーション
Minghua Liu yinghao Zhu Hon Cai Shizhong Han Zhan Ling Fatih Porikli Hao Su
半弱教師付き物体の運動学的運動予測
Gengxin Liu Qian Sunハイビン・ファン・チョンヤン・マ・ユーラン・グオ・リー・イーフイ・ファン・ルイジェン・フー
Implicit Surface Contrastive Clustering for LiDAR Point Clouds
Zaiwei Zhang · Min Bai · Li Erran Li
LaserMix for Semi-Supervised LiDAR Semantic Segmentation
Lingdong Kong · Jiawei Ren · Liang Pan · Ziwei Liu
MSeg3D: Multi-modal 3D Semantic Segmentation for Autonomous Driving
Jiale Li · Hang Dai · Hao Han · Yong Ding
GraVoS: Voxel Selection for 3D Point-Cloud Detection
Oren Shrout · Yizhak Ben-Shabat · Ayellet Tal
VoxelNeXt: Fully Sparse VoxelNet for 3D Object Detection and Tracking
Yukang Chen · Jianhui Liu · Xiangyu Zhang · XIAOJUAN QI · Jiaya Jia
Virtual Sparse Convolution for Multimodal 3D Object Detection
Hai Wu · Chenglu Wen · Shaoshuai Shi · Xin Li · Cheng Wang
MSMDFusion: 3D オブジェクト検出のための多深度シードを使用した複数のスケールでの LiDAR とカメラの融合
Yang Jiao · ZEQUN JIE · Shaoxiang Chen · Jingjing Chen · Lin Ma · Yu-Gang Jiang
OrenterNet: Visual Localization in 2D Public Maps with Neural Matching
Paul-エドゥアール・サーリン · ダニエル・デトーン · ヤン・ツンイー · アルメン・アヴェティシアン · ジュリアン・ストラウブ · トマシュ・マリシェヴィッチ · サミュエル・ロタ・ブロー · リチャード・ニューコム · ピーター・コンシーダー · ヴァシリオス・バルンタス 不確実性を認識する ビジョンベースのメトリクス クロスビュー ジオローカリゼーション フロリアン・ファーヴァーズ · セバスティアン・ブリンジャー
·
クリストフBodensteiner · Michael Arens · Rainer Stiefelhagen
BEVHeight: ビジョンベースの路側 3D 物体検出のための堅牢なフレームワーク
Lei Yang · Kaicheng Yu · tao Tang · Jun Li · Kun Yuan · Li Wang · Xinyu Zhang · Peng Chen 自動
運転における鳥瞰図表現による 3D オブジェクト検出の堅牢性を理解する
Zijian Zhu · Yichi Zhang · Hai Chen · yingpeng Dong Shu Zhao Wenbo Ding Jiachen Zhong Shibao Zheng
自己監視シーン適応によるオブジェクト検出
ZEKUN ZHANG Minh Hoai
AeDet: 方位不変マルチビュー 3D オブジェクト検出
Chengjian Feng ZEQUN JIE Yujie Zhong Xiangxiang Chu L in Ma
CAPE: カメラ ビュー位置の埋め込みマルチビュー 3D オブジェクト検出
Kaixin Xiong · Shi Gong · Xiaoqing Ye · Xiao Tan · Ji Wan · Errui Ding · Jingdong Wang · Xiang Bai
VL-SAT: 点群における 3D セマンティック シーン グラフ予測のための視覚言語セマンティクス支援トレーニング
Ziqin Wang · Bowen Cheng · Lichen Zhao · Dong Xu · Yang Tang · Lyu Sheng
身体化された視覚のためのモダリティ不変視覚オドメトリ
Marius Memmel · Roman Bachmann · Amir Zamir
動的シーンにおけるマルチフレーム深度推定のための単眼キューとマルチビューキューの融合を学ぶ
Rui Li、Dong Gong、Wei ying、Hao Chen、Yu Zhu、Kaixuan Wang、Xiaozhi Chen、Jinqiu Sun、Yanning Zhang OmniVidar
: 全方向深度マルチ魚眼画像からの推定
Sheng Xie、Daochuan Wang、Yun-Hui Liu DINN360: 緯度を意識した 360画像再スケーリング
のための変形可能な反転ニューラル ネットワーク


Yichen Guo · Mai Xu · Lai Jiang · Ning Li · Leon Sigal · Yunjin Chen
GeoMVSNet: Learning Multi-View Stereo with Geometry Perception
Zhe Zhang · Rui Peng · Yuxi Hu · Ronggang Wang
A Practical Stereo Depth System for Smart Glasses
Jialiang Wang · Daniel Scharstein · Akash Bapat · Kevin Blackburn-Matzen · Matthew Yu · Jonathan Lehman · Suhib Alsisan · Yanghan Wang · Sam Tsai · Jan-Michael Frahm · Zijian He · Peter Vajda · Michael Cohen · Matt Uyttendaele
DC
2
: Dual-Camera Defocus Control by Learning to Refocus
Hadi AlZayer · Abdullah Abuolaim · Leung Chun Chan · Yang Yang · Ying Lou · Jia-Bin Huang · Abhishek Kar
iDisc: Internal Discretization for Monocular Depth Estimation
Luigi Piccinelli Christos Sagaridis Fisher Yu
SfM-TTR: 単一ビュー深度ネットワークのテスト時間改良にモーションからの構造を使用
Sergio Izquierdo Javier Civera
Inverting the Imaging Process by Learning an Implicit Camera Model
Xin Huang Qi Zhang Ying Feng · Hondong Li · Qing Wang
表現空間における点群再構成損失の測定方法の学習
Tianxin Huang · Zhonggan Dhang · Jiangning Zhang · Ying Tai · Zhenyu Zhang · Mingang Chen · Chengjie Wang · Yong Liu より
鮮明な画像を生成するより優れた「CMOS」: 空間バリアントぼけ推定の学習ブラインドイメージ用 超解像度
Xuhai Chen Jiangning Zhang Chao Xu Yabiao Wang Chengjie Wang Yong Liu
任意モーダルセマンティックセグメンテーションの提供
Jiaming Zhang Ruiping Liu Hao Shi Kailun Yang Simon Reiß Haodong Fu Kunyu Peng Kaiwei Wang Rainer Stiefelhagen
学習済み点群圧縮のための効率的な階層エントロピー モデル
Rui Song Chunyang Fu Shan Liu · Ge Li
CLIP ベースの画像の時間モデリングの再検討-ビデオへの知識の伝達
Ruyang Liu Jingjia Huang Ge Li Jiashi Feng Xinglong Wu Thomas Li
マスク適応 CLIP によるオープンボキャブラリー セマンティック セグメンテーション
Feng Liang Bichen Wu Xiaoliang Dai Kunpeng Li Yeahan Zhao Hang Zhang Peizhao Zhang Peter Vajda Diana Marculescu
Imagic: Text-拡散モデルを使用したベースの実画像編集
Bahjat Kawar · Shiran Zada · Oran Lang · Omer Tov · Huiwen Chang · Tali Dekel · Inbar Mosseri · michal Irani
Neumann Network with Recursive Kernels for Single Image Defocus Deblurring
Yuhui Quan · Zicong Wu · Hui Ji
Transfer4D: A framework for frugal motion capture and deformation transfer
Shubh Maheshwari · Rahul Narain · Ramya Hebbalaguppe
Iterative Proposal Refinement for Weakly-Supervised Video Grounding
Meng Cao · Fangyun Wei · Can Xu · Xiubo Geng · Long Chen · Can Zhang · Yuexian Zou · Tao Shen · Daxin Jiang
X
3
KD: Knowledge Distillation Across Modalities, Tasks and Stages for Multi-Camera 3D Object Detection
Marvin Klingner、Shubhankar Borse、Varun Ravi Kumar、Behnaz Rezaei、Venkatraman Narayanan、Senthil Yogamani、Fatih Porikli
AnyFlow: 暗黙的な神経表現による任意スケールのオプティカル フロー
Hyunyoung Jung、Zhuo Hui、Lei Luo、Haitao Yang、Feng Liu、Sungjoo Yu、Rakesh Ranjan · Denis Demandolx
IterativePFN: 真の反復点群フィルタリング
Dasith de Silva Edirimuni · Xuequan Lu · Zhiwen Shao · Gang Li · Antonio Robles-Kelly · Ying He
Fake it until you make it: Learning Transferablepresentation from Synthetic ImageNet clone
Mert Bulent Sariyildiz · Karteek Alahari、Diane Larlus、Yannis Kalantidis
クロススケール歪み認識による屋内パノラマ部屋のレイアウト推定のための直交平面のもつれの解消
Zhijie Shen · Zishuo Zheng · Chunyu Lin · Lang Nie · Kang Liao · Shuai Zheng · Yao Zhao
Exploring Incompatible Knowledge Transfer in Few-shot Image Generation
Yunqing Zhao · Chao Du · Milad Abdollahzadeh · Tianyu Pang · Min Lin · Shuicheng YAN · Ngai-man Cheung
OmniObject3D: Large Vocabulary 3D Object Dataset for Realistic Perception, Reconstruction and Generation
Tong Wu · Jiarui Zhang · Xiao Fu · Yuxin WANG · Jiawei Ren · Liang Pan · Wenyan Wu · Lei Yang · Jiaqi Wang · Chen Qian · Dahua Lin · Ziwei Liu
CelebV-Text: A Large-Scale Facial Text-Video Dataset
Jianhui Yu · Hao Zhu · Liming Jiang · CHEN CHANGE LOY · Weidong Cai · Wenyan Wu
TensoIR: Tensorial Inverse Rendering
Haian Jin · Isabella Liu · Peijia Xu · Xiaoshuai Zhang · Songfang Han · Sai Bi · Xiaowei Zhou · Zexiang Xu · Hao Su
Simultaneously Short- and Long-Term Temporal Modeling for Semi-Supervised Video Semantic Segmentation
Jiangwei Lao · Weixiang Hong · Xin Guo · Yingying Zhang · Wang Jian · Jingdong Chen · Wei Chu
Integral Neural Networks
Kirill Solodskikh · Azim Kurbanov · Ruslan Aydarkhanov · Irina Zhelavskaya · Yury Parfenov · Dehua Song · Stamatios Lefkimmiatis
FEND: A Future Enhanced Distribution-Aware Contrastive Learning Framework For Long-tail Trajectory Prediction
Yuning Wang · Pu Zhang · LEI BAI · Jianru Xue
NeuralEditor: Editing Neural Radiance Fields via Manipulating Point Clouds
Junkun Chen · Jipeng Lyu · Yu-Xiong Wang
3D Line Mapping Revisited
Shaohui Liu · Yifan Yu · Rémi Pautrat · Marc Pollefeys · Viktor Larsson
Single View Scene Scale Estimation using Scale Field
Byeong-Uk Lee · Jianming Zhang · Yannick Hold-Geoffroy · In So Kweon
PlaneDepth: Self-supervised Depth Estimation via Orthogonal Planes
Ruoyu Wang · Zehao Yu · Shenghua Gao
Self-supervised Super-plane for Neural 3D Reconstruction
Botao Ye · Sifei Liu · Xueting Li · Ming-Hsuan Yang
NeurOCS: Neural NOCS Supervision for Monocular 3D Object Localization
Zhixiang Min · Bingbing Zhuang · Samuel Schulter · Buyu Liu · Enrique Dunn · Manmohan Chandraker
Multi-sensor large-scale dataset for multi-view 3D reconstruction
オレグ・ヴォイノフ、グレブ・ボブロフスキフ、パベル・カルピシェフ、サヴェリー・ガロチキン、アンドレイ=ティモテ・アルデリアン、アルセニー・ボジェンコ、エカテリーナ・カルマノワ、パベル・コパネフ、ヤロスラフ・ラブティン=リムショ、ルスラン・ラヒモフ、アレクサンドル・サフィン、ヴァレリー・セルピヴァ、アレクセイ・アルテモフ、エフゲニー・ブルナエフ、ドズミトリー・ツェツェルコウ、デニスZorin
AutoRecon: 自動化された 3D オブジェクトの発見と再構成
Yuang Wang、Xingyi He、Sida Peng、Haotong Lin、Hujun Bao、Xiaowei Zhou
大規模ホモグラフィー ベンチマーク
Daniel Barath、Dmytro Mishkin、Michal Polic、Wolfgang Förstner、Jiri Matas
SparsePose: Sparse-ビュー カメラ ポーズ回帰と洗練
Samarth Sinha、Jason Zhang、Andrea Tagliasacchi、Igor Gilitschenski、David Lindell
フューショット ジオメトリを意識したキーポイント ローカリゼーション
Xingzhe He · Gaurav Bharaj · David Ferman · Helge Rhodin · Pablo Garrido
Self-Supervised Representation Learning for CAD
Benjamin Jones · Michael Hu · Milin Kodnongbua · Vladimir Kim · Adriana Schulz
IMP: Iterative Matching and Pose Estimation with Adaptive Pooling
Fei XUE · Ignas Budvytis · Roberto Cipolla
SMOC-Net: Leveraging Camera Pose for Self-Supervised Monocular Object Pose Estimation
Tao Tan · Qiulei Dong
Markerless Camera-to-Robot Pose Estimation via Self-supervised Sim-to-Real Transfer
Jingpei Lu · Florian Richter · Michael Yip
TTA-COPE: Test-Time Adaptation for Category-Level Object Pose Estimation
テヨプ・リー ジョナサン・トレンブレイ・ヴァルツ ブルーキス・ボーウェン ウェン・ビョンウク リー・インギュ シン・スタン・バーチフィールド・イン ソ・グェオン・グクジン ユン 3D
-POP - マーカーベースのモーションキャプチャーを使用して、自由に移動する鳥のマーカーレス 2D-3D 追跡を容易にする自動注釈アプローチ Hemal
Naik Hoi Hang Chan Junran Yang Mathilde Delacoux Iain Couzin 加納文博 Máté Nagy
確率的回転モデリングのための SO(3) 多様体の離散正規化フローの詳細
Yulin Liu Haoran Liu Yingda ying · Yang Wang · Baoquan Chen · He Wang
PSVT: エンドツーエンドプログレッシブ ビデオ トランスフォーマーによる複数人の 3D ポーズと形状の推定
Zhongwei Qiu、Yang Qiansheng、Jian Wang、Haocheng Feng、Junyu Han、Errui Ding、Chang Xu、Dongmei Fu、Jingdong Wang
エゴセントリック RGB ビデオからの 3D 手のポーズ推定とアクション認識のための階層的時間変換器
Yilin Wen Hao Pan Lei Yang Jia Pan Tatsu Komura Wenping Wang
GarmentTracking: カテゴリレベルの衣服ポーズ追跡
Han Xue Wenqiang Xu Jieyi Zhang Tutian Tang Yutong Li Wenxin Du Ruolin Ye Cewu Lu
転送可能な標的型敵対者の例に向けて
Zhibo Wang Honshan Yang Yunhe Feng Peng Sun Hengchang Guo Zhifei Zhang Kui Ren
セマンティックセグメンテーションのための近接分割敵対攻撃
Jérôme Rony · Jean-Christophe Pesquet · Ismail Ayed
T-SEA: Transfer-based Self-Ensemble Attack on物体検出
Hao Huang、Ziyan Chen、Huanran Chen、Yongtao Wang、Kevin Zhang
Reinforcement Learning-Based Black-Box Model Inversion Attacks
Gyojin Han · Jaehyun Choi · Haeil Lee · Junmo Kim
Progressive Backdoor Erasing via connecting Backdoor and Adversarial Attacks
Bingxu Mu · Zhenxing Niu · Le Wang · xue wang · Qiguang Miao · Rong Jin · Gang Hua
MEDIC: Remove Model Backdoors via Importance Driven Cloning
Qiuling Xu · Guanhong Tao · Jean Honorio · Yingqi Liu · Shengwei An · Guangyu Shen · Siyuan Cheng · Xiangyu Zhang
Model Barrier: A Compact Un-Transferable Isolation Domain for Model Intellectual Property Protection
Lianyu Wang · Meng Wang · Daoqiang Zhang · Huazhu Fu
Adversarially Masking Synthetic to Mimic Real: Adaptive Noise Injection for Point Cloud Segmentation Adaptation
Guangrui Li · Guoliang Kang · Xiaohan Wang · Yunchao Wei · Yi Yang
Instance-Aware Domain Generalization for Face Anti-Spoofing
Qianyu Zhou · Ke-Yue Zhang · Taiping Yao · Xuequan Lu · Ran Yi · Shouhong Ding · Lizhuang Ma
Bias-Eliminating Augmentation Learning for Debiased Federated Learning
Yuan-Yi Xu · Ci-Siang Lin · Yu-Chiang Frank Wang
Adaptive Channel Sparsity for Federated Learning under System Heterogeneity
Dongping Liao · Xitong Gao · Yiren Zhao · Cheng-zhong Xu
Reliable and Interpretable Personalized Federated Learning
Zixuan Qin · Liu Yang · Qilong Wang · Yahong Han · Qinghua Hu
DaFKD: Domain-aware Federated Knowledge Distillation
Haozhao Wang · Yichen Li · Wenchao Xu · Ruixuan Li · Yufeng Zhan · Zhigang Zeng
SimpleNet: 画像異常検出と位置特定のためのシンプルなネットワーク
Zhikang Liu · Yiming Zhou · Yuansheng Xu · Zilei Wang
半教師ありビデオ異常検出のための新しい包括的なベンチマークと期待
Congqi Cao · Yue Lu · PENG WANG · Yanning Zhang
マスク ジグソーパズル : ビジョン トランスフォーマーの多用途な位置埋め込み
Bin Ren · Yahui Liu · Yue Song · Wei Bi · Rita Cucchiara · Nicu Sebe · Wei Wang
ImageNet-E: ベンチマーク ニューラル属性編集に対するネットワークの堅牢性
Xiaodan Li YUEFENG CHEN Yao Zhu Shuhui Wang Rong Zhang Hui Xue の
デュアル目的補助分類子によるプライベート イメージ生成
Chen Chen · Daochang Liu · Siqi Ma · Surya Nepal · Chang Xu
Discriminator-Cooperated Feature Map Distillation for GAN Compression
Tie Hu · Mingbao Lin · Lizhou You · Fei Chao · Rongrong Ji
TeSLA: Test-Time Self-Learning With Automatic Adversarial Augmentation
DEVAVRAT TOMAR · Guillaume Vray · Behzad Bozorgtabar · Jean-Philippe Thiran
Practical Network Acceleration with Tiny Sets
Guo-Hua Wang · Jianxin Wu
NoisyQuant: Noisy Bias-Enhanced Post-Training Activation Quantization for Vision Transformers
Yijiang Liu · Huanrui Yang · ZHEN DONG · Kurt Keutzer · Li Du · Shanghang Zhang
Bias Mimicking: A Simple Sampling Approach for Bias Mitigation
Maan Qraitem · Kate Saenko · Bryan Plummer
Masked Images Are Counterfactual Samples for Robust Fine-tuning
Yao Xiao · Ziyi Tang · Pengxu Wei · Cong Liu · Liang Lin
Samples with Low Loss Curvature Improve Data Efficiency
Isha Garg · Kaushik Roy
Defining and Quantifying the Emergence of Sparse Concepts in DNNs
Jie Ren · Mingjie Li · Qirui Chen · Huiqi Deng · Quanshi Zhang
Network Expansion For Practical Training Acceleration
Ning Ding · Yehui Tang · Kai Han · Chao Xu · Yunhe Wang
AstroNet: When Astrocyte Meets Artificial Neural Network
Mengqiao Han · Liyuan Pan · Xiabi Liu
Gradient Norm Aware Minimization Seeks First-Order Flatness and Improves Generalization
Xingxuan Zhang · Renzhe Xu · Han Yu · Hao Zou · Peng Cui
Re-basin via implicit Sinkhorn differentiation
Fidel A Guerrero Pena · Heitor Medeiros · Thomas Dubail · Masih Aminbeidokhti · Eric Granger · Marco Pedersoli
Tunable Convolutions with Parametric Multi-Loss Optimization
Matteo Maggioni · Thomas Tanay · Francesca Babiloni · Steven McDonagh · Ales Leonardis
Frustratingly Easy Regularization on Representation Can Boost Deep Reinforcement Learning
Xinwen Hou · Huangyuan Su · Jieyu Zhang · Xinwen Hou
Simulated Annealing in Early Layers Leads to Better Generalization
Amirmohammad Sarfi · Zahra Karimpour · Muawiz Chaudhary · Nasir Khalid · Mirco Ravanelli · Sudhir Mudur · Eugene Belilovsky
On the Stability-Plasticity Dilemma of Class-Incremental Learning
Dongwan Kim Bohyung Han
学習と記憶の分離: タスク増分学習のための知識投影を備えた二値記憶フレームワーク
Wenju Sun Qingyong Li Jing Zhang Wen Wang Yangliao Geng
一般化の問題: 効率的なオンライン知識蒸留のためのパラメータハイブリッドによる損失最小平坦化
Tianli Zhang · Mengqi Xue · Jiangtao Zhang · Haofei Zhang · Yu Wang · Lechao Cheng · Jie Song · Mingli Song
継続学習のための二次影響の正規化
Zhicheng Sun · Yadong MU · Gang Hua
顔認識のための特徴ベースの知識蒸留の再考
Jing zhi li · Zidong Guo ·フィ・リ、ハン・スンジュ、ペク・ジウォン、ミン・ヤン、ラン・ヤン、ソ・ソンジュ
ERM-KTP: Knowledge-level Machine Unlearning via Knowledge Transfer
Shen Lin · Xiaoyu Zhang · Chenyang Chen · Xiaofeng Chen · Willy Susilo
Partial Network Cloning
Jingwen Ye · Songhua Liu · Xinchao Wang
Rebalancing Batch Normalization for Exemplar-based Class-Incremental Learning
Sungmin Cha · Sungjun Cho · Dasol Hwang · Sunwon Hong · Moontae Lee · Taesup Moon
1% VS 100%: Parameter-Efficient Low Rank Adapter for Dense Predictions
Dongshuo Yin · Yiran Yang · Zhechao Wang · Hongfeng Yu · kaiwen wei · Xian Sun
MELTR: Meta Loss Transformer for Learning to Fine-tune Video Foundation Models
Dohwan Ko · Joonmyung Choi · Hyeong Kyu Choi · Kyoung-Woon On · Byungseok Roh · Hyunwoo Kim
MDL-NAS: ビジョントランスフォーマーのための共同マルチドメイン学習フレームワーク
Shiguang Wang · TAO XIE · Jian Cheng · Xingcheng ZHANG · Haijun Liu
マルチタスク学習のための独立コンポーネントアライメント
Dmitry Senushkin · Nikolay Patakin · Arsenii Kuznetsov · Anton Konushin
Revising Prototy picalクロスドメイン フューショット学習用ネットワーク
Fei Zhou Peng Wang Lei Zhang Wei Wei Yanning Zhang
テスト時間適応のための特徴アライメントと均一性
Shuai Wang Daoan Zhang Zipei YAN Jianguo Zhang Rui Li
MMANet: 不完全マルチモーダルに対するマージンを意識した蒸留とモダリティを意識した正則化
shicai wei、Chunbo Luo、Yang Luo の学習
PMR: マルチモーダル学習のためのプロトタイプのモーダル リバランス
Yunfeng FAN · Wenchao Xu · Haozhao Wang · Junxiao Wang · Song Guo
Upcycling Models under Domain and Category Shift
Sanqing Qu · Tianpei Zou · Florian Röhrbein · Cewu Lu · Guang Chen · Dacheng Tao · changjun jiang
MHPL: Minimum Happy Points Learning for Active Source Free Domain Adaptation
Fan Wang · Zhongyi Han · Zhiyan Zhang · Rundong He · Yilong Yin
COT: Unsupervised Domain Adaptation with Clustering and Optimal Transport
Yang Liu · Zhipeng Zhou · Baigui Sun
FREDOM: Fairness Domain Adaptation Approach to Semantic Scene Understanding
Thanh-Dat Truong · Ngan Le · Bhiksha Raj · Jackson Cothren · Khoa Luu
Transfer Knowledge from Head to Tail: Uncertainty Calibration under Long-tailed Distribution
Jiahao Chen · Bing Su
ロングテール認識のための調整された専門家のバランスの取れた製品
Emanuel Sanchez Aimar · Arvi Jonnarth · Michael Felsberg · Marco Kuhlmann
なぜ勝者が最高なのか?
Matthias Eisenmann · Annika Reinke · Vivienn Weru · Minu Tizabi · Fabian Isensee · Tim Adler · Sharib Ali · Vincent Andrearczyk · Marc Aubreville · Ujjwal Baid · Spyridon Bakas · Niranjan Balu · Sophia Bano · Jorge Bernal · Sebastian Bodenstedt · Alessandro Casella · Veronika Cheplygina · Marie Daum · Marleen de Bruijne · Adrien Depeursinge · Reuben Dorent · Jan Egger · David Ellis · Sandy Engelhardt · Melanie Ganz · Noha Ghatwary · Gabriel Girard · Patrick Godau · Anubha Gupta · Lasse Hansen · Kanako Harada · Mattias Heinrich · Nicholas Heller · Alessa Hering · Arnaud Huaulmé · Pierre Jannin · Ali Emre Kavur · Oldřich Kodym · Michal Kozubek · Jianning Li · Hongwei Li · Jun Ma · Carlos Isla · bjoern menze · Alison Noble · Valentin Oreiller · Nicolas Padoy · Sarthak Pati · Kelly Payette · Tim Rädsch · Jonathan Rafael-Patino · Vivek Bawa · Stefanie Speidel · Carole Sudre · Kimberlin van Wijnen · Martin Wagner · Donglai Wei · Amine Yamlahi · Moi Hoon Yap · Chun Yuan · Maximilian Zenk · Aneeq Zia · David Zimmerer · Dogu Baran Aydogan · Binod Bhattarai · Louise Bloch · Raphael Brüngel · Jihoon Cho · Chanyeol Choi · DOU QI · Ivan Ezhov · Christoph M. Friedrich · Clifton Fuller · Rebati Gaire · Adrian Galdran · Álvaro García Faura · Maria Grammatikopoulou · SeulGi Hong · Mostafa Jahanifar · Ikbeom Jang · Abdolrahim Kadkhodamohammadi · Inha Kang · Florian Kofler · Satoshi Kondo · Hugo Kuijf · Mingxing Li · Huan Luu · Tomaž Martinčič · Pedro Morais · Mohamed Naser · Bruno Oliveira · David Owen · Subeen Pang · Jinah Park · Sung-Hong Park · Szymon Plotka · Elodie Puybareau · Nasir Rajpoot · Kanghyun Ryu · Numan Saeed · Adam Shephard · Pengcheng Shi · Dejan Štepec · Ronast Subedi · Guillaume Tochon · Helena Torres · Helene Urien · João Vilaça · Kareem Wahid · haojie wang · jiacheng wang · Liansheng Wang · Xiyue Wang · Benedikt Wiestler · Marek Wodzinski · Fangfang Xia · Juanying Xie · Zhiwei Xiong · Sen Yang · Yanwu Yang · Zixuan Zhao · Klaus Maier-Hein · Paul Jaeger · Annette Kopp-Schneider · Lena Maier-hein
SuperDisco: スーパークラスのディスカバリーがロングテールの視覚認識を向上
Yingjun Du · Jiayi Shen · Xiantong Zhen · Cees Snoek
分離メタラベルピュリファイアによるノイズの多いラベルからの学習
Yuanpeng Tu · Boshen Zhang · Yuxi Li · Liang Liu · Jian Li · Yabiao Wang · Chengjie Wang · Cai Zhao
クラス プロトタイプに基づく、マルチラベルおよびきめ細かい教育ビデオを分類するための対照学習
Rohit Gupta · Anirban Roy · Sujeong Kim · Claire Christensen · Todd Grindal · Sarah Gerard · Madeline Cincebeaux · Ajay Divakaran · Mubarak Shah
MaskCon : 粗いラベル付きデータセットのマスク対照学習
Chen Feng · Ioannis Patras
HIER: 階層正則化によるクラスラベルを超えた計量学習
Sungyeon Kim Boseung Jeong Suha Kwak
トランスダクティブゼロショット学習のための双方向分布アライメント
Zhicai Wang YANBIN HAO Tingting Mu Ouxiang Li Shuo Wang Xiangnan He
BiCro: 双方向クロスモーダル類似性一貫性によるマルチモダリティデータのノイズ対応修正
Shuo Yang · Xu Pan · Kai Wang · Yang You · Honxun Yao · Tongliang Liu · Min Xu
不完全なマルチビュー分類のための不確実性の探求と利用
Mengyao Xie · Zongbo Han · Changqing Zhang · Yichen Bai · Qinghua Hu
GCFAgg: グローバルおよびクロスビュー機能の集約マルチビュー クラスタリング用
Weiqing Yan Yuanyang Zhang Chenlei Lv Chang Tang Guanghui Yue Liang Liao Liao Weisi Lin
LINe: Out-of-Distribution Detection by Leveraging Important Neurons
Yong Hyun Ahn · Gyeong-Moon Park · Seong Tae Kim
Visual prompt tuning for generative transfer learning
Kihyuk Sohn · Huiwen Chang · Jose Lezama · Luisa Polania Cabrera · Han Zhang · Yuan Hao · Irfan Essa · Lu Jiang
Interventional Bag Multi-Instance Learning On Whole-Slide Pathological Images
Tiancheng Lin · Yu Zhimiao · Hongyu Hu · Yi Xu · Chang-Wen Chen
Image Quality-aware Diagnosis via Meta-knowledge Co-embedding
Haoxuan Che · Siyu Chen · Hao Chen
KiUT: Knowledge-injected U-Transformer for Radiology Report Generation
Zhongzhen Huang · Xiaofan Zhang · Shaoting Zhang
階層的識別学習により生物医学顕微鏡の視覚的表現が改善される
Cheng Jiang、Xinhai Hou、Akhil Kondepudi、Asadur Chowdury、Christian Freudiger、Daniel Orringer、Honglak Lee、Todd Hollon 半教師あり
医療画像セグメンテーションのための擬似ラベル誘導対照学習
Hritam Basak、Zhaozheng ying
FFF: 完全なタンパク質構造を構築するためのフラグメントガイドによる柔軟なフィッティング
Weijie Chen · Xinyan Wang · Yuhang Wang
Visual Language Pretrained Multiple Instance Zero-Shot Transfer for Histopathology Images
Ming Y. Lu · Bowen Chen · Andrew Zhang · Drew Williamson · Richard Chen · Tongディン・ロン・レー・ヨンソン・チュアン・ファイサル・マフムード
ProD: クロスドメインのフューショット画像分類のためのドメイン知識の解きほぐし
Tianyi Ma · Yifan Sun · Zongxin Yang · Yi Yang
組み合わせ埋め込みによる開集合表現学習
Geeho Kim · Junoh Kang · Bohyung Han
マルチクラスの信頼性とローカリゼーションのキャリブレーション物体検出用
Bimsara Pathiraja · Malitha Gunawardhana · Muhammad Khan Khan
小型物体検出器におけるスケールを意識した知識の蒸留
Yichen Zhu · Qiqi Zhou · Ning Liu · Zhiyuan Xu · Zhicai Ou · mou xiaofeng · Jian Tang 作物関連の
多様性が増加した特徴の生成ハイブリッドマッチングによる少数ショットオブジェクト検出
Jingyi Xu、Hieu Le、Dimitris Samaras DETR

Ding Jia · Yuhui Yuan · Haodi He · Xiaopei Wu · Haojun Yu · Weihong Lin · Lei Sun · Chao Zhang · Han Hu
オブジェクト再識別のための適応スパースペアワイズ損失
Xiao Zhou · Yujie Zhong · Zhen Cheng · Fan Liang · Lin Ma
CAT : LoCalization and IdentifyAtion Cascade Detection for Open-World Object Detection Transformer
Shuailei Ma · Yuefeng Wang · Ying Wei · Jiaqi Fan · Thomas Li · Honli Liu · fanbing Lv
相互知識伝達によるウィークショットオブジェクト検出
Xuanyi Du · Weitao Wan · Chong Sun · Chen Li
顕著な物体検出モデルの分布不確実性のモデリング
Jing Zhang · Mochu Xiang · Yuchao Dai · Xinyu Tian 監修
少数ショット変圧器のマスクされた知識蒸留
Han Lin Guangxing Han Jiawei Ma Shiyuan Huang Xudong Lin Shih-Fu Chang
不確実性を認識したグループ交換マスキングによる共顕著物体検出
Yang Wu Huihui Song Bo Liu Kaihua Zhang Dong Liu
弱い監視付きフューショット用の自己監視型ビジョントランスフォーマーの蒸留分類とセグメンテーション
Dahyun Kang Piotr Koniusz Minsu Cho Naila Murray
DualRel: プロトタイプの観点からの半教師ありミトコンドリア セグメンテーション
Huayu Mai Rui Sun Tianzhu Zhang Zhiwei Xiong Feng W u
WinCLIP: Zero-/Few-Shot Anomaly 分類とセグメンテーション
Jongheon Jeong Yang Zou Taewanキム・ドンチン・チャン・アビナシュ・ラヴィチャンドラン・オンカル・ダビール
弱監視オブジェクトのマルチモーダルクラス固有トークンの学習
Lian XU · WANLI OUYANG · Mohammed BennaMoun · Farid Bourid · Dan · Dan XU 半教師あり
セマンティックセグメンテーションのための競合ベースのクロスビュー一貫性
Zicheng Wang · Zhenzhao · Xiaoxia Xing · Dong Xu Xiangyu Kong Luping Zhou
弱教師あり意味セグメンテーションのための境界強化型共同トレーニング
Shenghai Rong Bohai Tu Zilei Wang Junjie Li
ロングテールセマンティックセグメンテーションのためのロジット変動のバランシング
Yuchao Wang Jingjing Fei Haochen Wang Wei Li · Tianpeng Bao · Liwei Wu · Rui Zhao · Yujun Shen
教師なしセマンティック セグメンテーションの隠れたポジティブな要素を活用する
Hyun Seok Seong、WonJun Moon、Su Been Lee、Jae-Pil Heo
PIDNet: PID コントローラーに触発されたリアルタイム セマンティック セグメンテーション ネットワーク
Jiacong Xu、Zixiang Xiong、Shankar P Bhattacharyya
AttendanceShift: 点監視インスタンスの反復推定パーツベース アテンション マップセグメンテーション
Mingxiang Liao · Zonghao Guo · Yuze Wang · Peng Yuan · bailan feng · Fang Wan
悪天候時のドメイン増分セマンティック セグメンテーションにおける忘却の原則
Tobias Kalb · Jürgen Beyerer
ゼロショット インスタンス セグメンテーションのためのセマンティック促進によるバイアス除去と背景の曖昧さ回避
SHUTING HE・Henghui Ding・Wei Jiang
ガウス プロセス分類としてのインタラクティブ セグメンテーション
Minghao Zhou · Hong Wang · Qian Zhao · Yuexiang Li · Yawen Huang · Deyu Meng · Yefeng Zheng
Meta Compositional Referring Expression Segmentation
Li Xu · Mark Huang · Xindi Shang · Zehuan Yuan · Ying Sun · Jun Liu
DejaVu: Conditional Regenerative Learning to Enhance Dense Prediction
Shubhankar Borse · Debasmit Das · Hyojin Park · Hong Cai · Risheek Garrepalli · Fatih Porikli
Zero-shot Referring Image Segmentation with Global-Local Context Features
seonghoon yu · Paul Hongsuck Seo · Jeany Son
FreeSeg: Unified, Universal and Open-Vocabulary Image Segmentation
Jie Qin · Jie Wu · Pengxiang Yan · Ming Li · Yuxi Ren · Xuefeng Xiao · Yitong Wang · Rui Wang · Shilei Wen · Xin Pan · Xingang Wang
Semantic Human Parsing via Scalable Semantic Transfer over Multiple Label Domains
Jie Yang · Chaoqun Wang · Zhen Li · Junle Wang · Ruimao Zhang
Open Vocabulary Semantic Segmentation with Patch Aligned Contrastive Learning
Jishnu Mukhoti · Tsung-Yu Lin · Omid Poursaeed · Rui Wang · Ashish Shah · Philip Torr · Ser-Nam Lim
Neural Congealing: Aligning Images to a Joint Semantic Atlas
Dolev Ofri-Amar · Michal Geyer · Yoni Kasten · Tali Dekel
Open-Category Human-Object Interaction Pre-training via Language Modeling Framework
Sipeng Zheng · Boshen Xu · Qin Jin
Open-set Fine-grained Retrieval via Prompting Vision-Language Evaluator
Shijie Wang · Jianlong Chang · Haojie Li · Zhihui Wang · Wanli Ouyang · Qi Tian
R
2
前者: 場所認識のための統合
検索
および
ランキング
変換
Sijie Zhu Linjie Yang Chen Chen Mubarak Shah Xiaohui Shen Heng Wang
EVA: Exploring the Limits of Masked Visual Representation Learning at Scale
Yuxin Fang Wen Wang Binhui Xie · Quan Sun · Ledell Wu · Xinggang Wang、Tiejun Huang、Xinlong Wang、Yue Cao
DeepSolo: テキスト スポッティング用に明示的なポイントを使用して Transformer Decoder をソロにします
Maoyuan Ye、Jing Zhang、Shanshan Zhao、Juhua Liu、Tongliang Liu、Bo Du、Dacheng Tao を
事前トレーニングするような微調整: 改善された微調整ゼロショット ビジョン モデルの数
サチン ゴヤル アナンヤ クマール サンカルプ ガーグ J コルター アディティ ラグナサン
マルチモーダリティがユニモダリティを支援: マルチモーダル モデルを使用したクロスモーダル フューショット学習
Zhiqiu Lin Samuel Yu Zhiyi Kuang Deepak Pathak Deva Ramanan
日付: E コマース向けのドメイン適応製品探索者
Haoyuan Li Hao Jiang Tao Jin Mengyan Li Yan Chen Zhijie Lin Yang Zhao Zhou Zhao
Pic2Word: ゼロショット合成画像検索のための写真と単語のマッピング
斉藤邦昭 Kihyuk Sohn Xiang Zhang Chun-Liang Li Chen-Yu Lee Kate Saenko Tomas Pfister
多属性画像操作のためのテキストガイドによる教師なし潜在変換
Xiwen Wei Zhen Xu Cheng Liu Si Wu Zhiwen Yu Hau-San Wong
クロスモーダルハードアライメントネットワークによるきめ細かい画像とテキストのマッチング
pan zhengxin Fangyu Wu Bailing Zhang
RA-CLIP: 検索拡張対照言語イメージ事前トレーニング
Chen-Wei Xie Siyang Sun Xiong Xiong Yun Zheng Deli Zhao Jingren Zhou
ユニバーサル文書処理のためのビジョン、言語、レイアウト、タスクの統一
Zineng Tang · Ziyi Yang · Guoxin Wang · Yuwei Fang · Yang Liu · Chenguang Zhu · Michael Zeng · Cha Zhang · Mohit Bansal MSINet
: オブジェクト ReID のマルチスケール相互作用の双子対照検索
Jianyang Gu · Kai Wang · Hao Luo · Chen Chen · Wei Jiang · Yuqiang Fang · Shanghang Zhang · Yang You · Jian ZHAO
EDA: 3D ビジュアルグラウンディングのための明示的なテキスト分離と密なアライメント
Yanmin Wu · Xinhua Cheng · Renrui Zhang · Zesen Cheng · Jian Zhang
L-CoIns: インスタンス認識による言語ベースの色付け
Zheng Chang · Shuchen Weng · Peixuan Zhang · Yu Li · Si Li · Boxin Shi
言語ガイド付きサンプリングによる視覚表現の学習
Mohamed Samir Mahmoud Hussein Elbanani · Karan Desai · Justin Johnson
シェパーディング スロットオブジェクト: 安定した堅牢なオブジェクト中心学習に向けて
Jinwoo Kim · Janghyuk Choi · Ho-Jin Choi · Seon Joo Kim
ボトルの中の言語: 言語モデルのガイド付き概念 解釈可能な画像分類のボトルネック
Yue Yang · Artemis Panagopoulou · Shenghao Zhou · Daniel Jin · Chris Callison-Burch · Mark Yatskar
外国語としての画像: 視覚および視覚言語タスクのための BEiT 事前トレーニング
Wenhui Wang · Hangbo Bao · Li Dong · Johan Bjorck · Zhiliang Peng · Qiang Liu · Kriti Aggarwal · Owais Khan Mohammed · Saksham Singhal · Subhojit Som · Furu Wei
Improving Visual Grounding by Encouraging Consistent Gradient-based Explanations
Ziyan Yang · Kushal Kafle · Franck Dernoncourt · Vicente Ordonez
Leveraging per Image-Token Consistency for Vision-Language Pre-training
Yunhao GOU · Tom Ko · Hansi Yang · James Kwok · Yu Zhang · Mingxuan Wang
RefTeacher: A Strong Baseline for Semi-Supervised Referring Expression Comprehension
Jiamu Sun · Gen Luo · Yiyi Zhou · Xiaoshuai Sun · GUANNAN JIANG · Zhiyu Wang · Rongrong Ji
Understanding and Improving Visual Prompting: A Label-Mapping Perspective
Aochuan Chen · Yuguang Yao · Pin-Yu Chen · Yihua Zhang · Sijia Liu
ビデオ内の名前付きインスタンスを見つけるための視覚言語モデルのメタパーソナライズ
葉春暁 · Bryan Russell · Josef Sivic · Fabian Caba · Simon Jenni
MaPLe: マルチモーダル即時学習
Muhammad Uzair Khattak · Hanona Bangalat · Muhammad Maaz · Salman Khan · Fahad Khan
VQACL: A Novel Visual Question Answering Continual Learning Set
Xi Zhang · Feifei Zhang · Changsheng Xu
視覚と言語における構成的一般化のためのプリミティブの効果の探求
Chuanhao Li Zhen Li Chenchen Jing Yunde Jia Yuwei Wu
Unicode のアナロジー: 反客観主義の視覚推論への挑戦
Steven Spratley Krista A. Ehinger Tim Miller
Token Turing Machines
Michael Ryoo · Keerthana Gopalakrishnan · Kumara Kahatapitiya · Ted Xiao · Kanishka Rao · Austin Stone · Yao Lu · Julian Ibarz · Anurag Arnab
Policy Adaptation from Foundation Model Feedback
Yuying Ge · Annabella Macaluso · Li Erran Li · Ping Luo · Xiaolong Wang
LANA: A Language-Capable Navigator for Instruction Following and Generation
Xiaohan Wang · Wenguan Wang · Jiayi shao · Yi Yang
LEGO-Net: Learning Regular Rearrangements of Objects in Rooms
Qiuhong Anna Wei · Sijie Ding · Jeong Joon Park · Rahul Sajnani · Adrien Poulenard · Srinath Sridhar · Leonidas Guibas
Discovering the Real Association: Multimodal Causal Reasoning in Video Question Answering
Chuanqi Zang · Hanqing Wang · Mingtao Pei · Wei Liang
CiCo: Domain-Aware Sign Language Retrieval via Cross-Lingual Contrastive Learning
Yiting Cheng · Fangyun Wei · Jianmin Bao · Dong Chen · Wenqiang Zhang
Context De-confounded Emotion Recognition
Dingkang Yang · Zhaoyu Chen · Yuzheng Wang · Shunli Wang · Mingcheng Li · Liu Siao · Xiao Zhao · Shuai Huang · Zhiyan Dong · Peng Zhai · Lihua Zhang
Learning Emotion Representations from Verbal and Nonverbal Communication
Sitao Zhang · Yimu Pan · James Wang
CLIPPING: Distilling CLIP-Based Models with a Student Base for Video-Language Retrieval
Renjing Pei · Jianzhuang Liu · Weimian Li · Bin Shao · Songcen Xu · Peng Dai · Juwei Lu · Youliang Yan
Dual Alignment Unsupervised Domain Adaptation for Video-Text Retrieval
Xiaoshuai Hao · Wanqian Zhang · Dayan Wu · Fei Zhu · Bo Li
StepFormer: Self-supervised Step Discovery and Localization in Instructional Videos
Nikita Dvornik · Isma Hadji · Ran Zhang · Konstantinos Derpanis · Rick Wildes · Allan Jepson
Text with Knowledge Graph Augmented Transformer for Video Captioning
Xin Gu · Guang Chen · Yufei Wang · Libo Zhang · Tiejian Luo · Longyin Wen
RILS: Masked Visual Reconstruction in Language Semantic Space
Shusheng Yang · Yixiao Ge · Kun Yi · Dian Li · Ying Shan · Xiaohu Qie · Xinggang Wang
DegAE: A New Pretraining Paradigm for Low-level Vision
Yihao Liu · Jingwen He · Jinjin Gu · Xiangtao Kong · Yu Qiao · Chao Dong
Teacher-generated spatial-attention labels boost robustness and accuracy of contrastive models
Yushi Yao · Chang Ye · Gamaleldin Elsayed · Junfeng He
CLAMP: Prompt-based Contrastive Learning for Connecting Language and Animal Pose
Xu Zhang · Wen Wang · Zhe Chen · Yufei Xu · Jing Zhang · Dacheng Tao
MAP: Multimodal Uncertainty-Aware Vision-Language Pre-training Model
Yatai Ji · Junjie Wang · Yuan Gong · Lin Zhang · yanru Zhu · WANG HongFa · Jiaxing Zhang · Tetsuya Sakai · Yujiu Yang
Intrinsic Physical Concepts Discovery with Object-Centric Predictive Models
qu tang · Xiangyu Zhu · Zhen Lei · Zhaoxiang Zhang
Position-guided Text Prompt for Vision-Language Pre-training
Jinpeng Wang · Pan Zhou · Mike Zheng Shou · Shuicheng YAN
LASP: Text-to-Text Optimization for Language-Aware Soft Prompting of Vision & Language Models
Adrian Bulat · Georgios Tzimiropoulos
Being Comes from Not-being: Open-vocabulary Text-to-Motion Generation with Wordless Training
Junfan Lin · Jianlong Chang · Lingbo Liu · Guanbin Li · Liang Lin · Qi Tian · Chang-Wen Chen
GeoVLN: Learning Geometry-Enhanced Visual Representation with Slot Attention for Vision-and-Language Navigation
Jingyang Huo · Qiang Sun · Boyan Jiang · Haitao Lin · Yanwei Fu
MetaCLUE: Towards Comprehensive Visual Metaphors Research
アルジュン・アクラ · ブレンダン・ドリスコル · プラデュムナ・ナラヤナ · ソラビット・チャンピニョ · ジウェイ・ジア · スヤシュ・ダムル · ガリマ・プルティ · S バス · レオニダス・ギバス · ウィリアム・フリーマン · ユアンジェン・リー · ヴァルン・ジャンパニ ANetQA: アントリムに対するきめの細かい構成推論のための大規模
ベンチマークビデオ
Zhou Yu · Lixiang Zheng · Zhou Zhao · Fei Wu · Jianping Fan · Kui Ren · Jun Yu
私たちがいる場所と私たちが見ているもの: 階層とシーンを使用したクエリベースのワールドワイド画像地理ローカライゼーション Brandon Clark
· Alec Kerrigan · Parth Parag Kulkarni · Vicente Vivanco Cepeda · Mubarak Shah
CoWs on Pasture: 言語駆動ゼロショット オブジェクト ナビゲーションのベースラインとベンチマーク
Samir Yitzhak Gadre · Mitchell Wortsman · Gabriel Ilharco · Ludwig Schmidt · Shuran Song
自由な言語モデリングによる視覚言語の事前トレーニングの加速
Teng WANG Yixiao Ge Feng Zheng Ran Cheng Ying Shan Xiaohu Qie Ping Luo
自然言語仕様による共同視覚グラウンディングと追跡
Li Zhou Zikun Zhou Kaige Mao Zhenyu He
CVT -SLR: Contrastive Visual-Textal Transformation for変分アライメントによる手話認識
Jiangbin Zheng Yile Wang Cheng Tan Siyuan Li Ge Wang Jun Xia Yidong Chen Stan Li
LAVENDER: マスクされた言語モデリングとしてのビデオ言語理解を統合する
Linjie Li Zhe Gan Kevin Lin Chung-Ching Lin Zicheng Liu Ce Liu Lijuan Wang
Learning動詞と副詞のテキスト関係を測定することによるアクションの変化
Davide Moltisanti 氏、Frank Keller 氏、Hakan Bilen 氏、Laura Sevilla-Lara
氏 勝者: 時空間ビデオの弱教師付き階層分解と位置合わせ
Mengze Li 氏、Han Wang 氏、Wenqiao Zhang 氏、Jiaxu Miao 氏、Zhou Zhao 氏、Shengyu Zhang 氏、Wei Ji 氏、Fei 氏Wu
HierVL: 階層型ビデオ言語埋め込みの学習
Kumar Ashutosh Rohit Girdhar Lorenzo Torresani Kristen Grauman
階層型ビデオモーメントの取得とステップキャプション アバイ・
ザラ・ジェミン・チョー・サトウィク・コトゥル・キシルン・チェン バーラス・オグズ ヤシャール・メハド広告・モヒト・バンサル AutoAD
: コンテキスト内の映画説明
Tengda Han Max Bain Arsha Nagrani Gul Varol Weidi Xie Andrew Zisserman
SViTT: スパースビデオテキストトランスフォーマーの時間学習
Yi Li、Kyle Min、Subarna Tripathi、Nuno Vasconcelos
不確実性ガイドによる自己トレーニングによる弱く監視された時間的文のグラウンディング
Yifei Huang、Lijin Yang、Yoichi SATO
コラボレーティブ ノイジー ラベル クリーナー: 映画におけるマルチモーダル ハイライト検出のためのシーンを意識した予告編の学習
Bei Gan · Xiujun Shu · Ruizhi Qiao · Haoqian Wu · Keyu Chen · Hanjun Li · Bo Ren
クロスモーダル時間消去ネットワークによる弱い教師付きビデオ感情の検出と予測
Zhicheng Zhang · Lijuan Wang · Jufeng Yang 弱教師
付き時間ビデオ用の 2 ストリーム ネットワークセマンティック認識メカニズムによるアクションのローカリゼーション
Yu Wang、Yadong Li、Hongbin Wang
ビデオ アクション検出のためのディープ クラスタリングによるハイブリッド アクティブ ラーニング
Aayush Jung B Rana · Yogesh Rawat
TriDet: 相対境界モデリングによる時間的行動検出
Dingfeng Shi · Yujie Zhong · Qiong Cao · Lin Ma · Jia Li · Dacheng Tao
HaLP: スケルトンベースの行動の自己教師あり学習に対する幻覚潜在ポジティブ
Anshul Shah · Aniket Roy · Ketul Shah · Shlok Mishra · David Jacobs · Anoop Cherian · Rama Chellappa
後処理時間的動作検出
Sauradip Nag · Xiatian Zhu · Yi-Zhe Song · Tao Xiang 弱
教師付き音声のクロスモーダル存在-不在証拠の収集-視覚イベント認識
Junyu Gao、Mengyuan Chen、Changsheng Xu
SynthVSR: 合成監視による視覚音声認識のスケールアップ
Xubo Liu、Egor Lakomkin、Konstantinos Vougeoukas、Pingchuan Ma、Honglie Chen、Ruiming Xie、Morrie Doulaty、Niko Moritz、Jachym Kolar、Stavros Petridis、Maja Pantic、Christian Fuegen ReVISE: 普遍的および一般化された音声のための視覚入力による自己教師あり音声再
合成Regeneration
Wei-Ning Hsu、Tal Remez、Bowen Shi、Jacob Donley、Yossi Adi
見るか聞く: 視覚的破損モデリングと信頼性スコアリングによる堅牢なオーディオビジュアル音声認識
ジョアンナ・ホン、ミンス・キム、ジョンス・チョイ、ヨンマン・ロ
時間的注意ユニット:効率的な時空間予測学習に向けて
Cheng Tan、Zhangyang Gao、Lirong Wu、Yongjie Xu、Jun Xia、Siyuan Li、Stan Li
遅延は重要: リアルタイム アクション予測トランスフォーマー
Harshayu Girase · Nakul Agarwal · Chiho Choi · Karttikeya Mangalam
Efficient Movie Scene Detection using State-Space Transformers
Md Mohaiminul Islam · Mahmudul Hasan · Kishan Shamsundar Athrey · Tony Braskich · Gediminas Bertasius
TarViS: A Unified Approach for Target-based Video Segmentation
Ali Athar · Alexander Hermans · Jonathon Luiten · Deva Ramanan · Bastian Leibe
HOOD: Hierarchical Graphs for Generalized Modelling of Clothing Dynamics
Artur Grigorev · Bernhard Thomaszewski · Michael Black · Otmar Hilliges
Structured 3D Features for Reconstructing Controllable Avatars
Enric Corona · Mihai Zanfir · Thiemo Alldieck · Eduard Bazavan · Andrei Zanfir · Cristian Sminchisescu
MonoHuman: Animatable Human Neural Field from Monocular Video
Zhengming Yu · Wei Cheng · Xian Liu · Wenyan Wu · Kwan-Yee Lin
JAWS: Just A Wild Shot for Cinematic Transfer in Neural Radiance Fields
Xi WANG · Robin Courant · Jinglei Shi · Eric Marchand · Marc Christie
InstantAvatar: Learning Avatars from Monocular Video in 60 Seconds
Tianjian Jiang · Xu Chen · Jie Song · Otmar Hilliges
X-Avatar: Expressive Human Avatars
Kaiyue Shen · Chen Guo · Manuel Kaufmann · Juan Zarate · Julien Valentin · Jie Song · Otmar Hilliges
OTAvatar: One-shot Talking Face Avatar with Controllable Tri-plane Rendering
Zhiyuan Ma · Xiangyu Zhu · Guo-Jun Qi · Zhen Lei · Lei Zhang
Learning Personalized High Quality Volumetric Head Avatars from Monocular RGB Videos
Ziqian Bai · Feitong Tan · Zeng Huang · Kripasindhu Sarkar · Danhang Tang · Di Qiu · Abhimitra Meka · Ruofei Du · Mingsong Dou · Sergio Orts-Escolano · Rohit Pandey · Ping Tan · Thabo Beeler · Sean Fanello · Yinda Zhang
AVFace: Towards Detailed Audio-Visual 4D Face Reconstruction
Aggelina Chatziagapi · Dimitris Samaras
NeuFace: Realistic 3D Neural Face Rendering from Multi-view Images
Mingwu Zheng · Haiyu Zhang · Hongyu Yang · Di Huang
Continuous Landmark Detection with 3D Queries
Prashanth Chandran · Gaspard Zoss · Paulo Gotardo · Derek Bradley
GlassesGAN: Eyewear Personalization using Synthetic Appearance Discovery and Targeted Subspace Modeling
Richard Plesh、Peter Peer、Vitomir Struc
偏光スマートフォン画像からの高解像度の顔の外観キャプチャ
Dejan Azinovic、Olivier Maury、Christophe Hery、Matthias Niessner、Justus Thies
制御可能な知覚要素によるインタラクティブ漫画化
Namhyuk Ahn、Patrick Kwon、Jihye Back、Kibeom Hon、 Mark Kim
SECAD-Net: スケッチ押し出し操作の学習による自己監視型 CAD 再構成
Pu Li · Jianwei Guo · Xiaopeng Zhang · Dong-ming Yan
TAPS3D: 擬似監視からのテキストガイドによる 3D テクスチャ形状生成
Jiacheng Wei · Hao Wang · Jiashi Feng · Guosheng Lin · Kim-Hui Yap
スケーラブルなグラフ周波数分解による高忠実度 3D 手の形状再構成
Tianyu Luan · Yuanhao Zhai · Jingjing Meng · Zhong Li · Zhang Chen · Yi Xu · Junsong Yuan
部分離散拡散プロセスによる一般化された深い 3D 形状
Yuhan Li · Yishun Dou · Xuanhong Chen · Bingbing Ni · Yilin Sun · Yutian Liu · Fuzhen Wang
ポーズガイド拡散モデルによる一貫したビューの合成
Hung-Yu Tseng Qinbo Li Changil Kim Suhib Alsisan Jia-Bin Huang Johannes Kopf
単一サンプルからのパッチベースの 3D 自然シーン生成
Weiyu Li Xuelin Chen Jue Wang · Baoquan Chen
拡散ベースの生成、最適化、3D シーンでのプランニング
Siyuan Huang、Zan Wang、Puhao Li、Baoxiong Jia、Tengyu Liu、Yixin Zhu、Wei Liang、Song-Chun Zhu
DA Wand: ニューラル メッシュ パラメーター化を使用した歪みを考慮した選択
Richard Liu · Noam Aigerman · Vladimir Kim · Rana Hanocka
神経ベクトル場: 明示的学習による暗黙的表現
Xianghui Yang · Guosheng Lin · Zhenhao Chen · Luping Zhou
Octree Guided Unowned Surface Reconstruction
Chamin Hewa Koneputugodage · Yizhak Ben-Shabat · Stephen Gould
構造マルチプレーン イメージ: ブリッジング ニューラル ビュー合成と 3D 再構成
Mingfang Zhang · Jinglu Wang · Xiao Li · Yifei Huang · 佐藤洋一 · Yan Lu
Multi-View Reconstruction using Signed Ray Distance Functions (SRDF)
Pierre Zins · Yuanlu Xu · Edmond Boyer · Stefanie Wuhrer · Tony Tung
VolRecon: Volume Rendering of Signed Ray Distance Functions for Generalizable Multi-View Reconstruction
Yufan Ren · Fangjinhua Wang · Tong Zhang · Marc Pollefeys · Sabine Süsstrunk
TMO: Textured Mesh Acquisition of Objects with a Mobile Device by using Differentiable Rendering
Jaehoon Choi · Dongki Jung · Taejae Lee · SangWook Kim · YoungDong Jung · Dinesh Manocha · Donghwan Lee
RelightableHands: Efficient Neural Relighting of Articulated Hand Models
Shun Iwase · Shunsuke Saito · Tomas Simon · Stephen Lombardi · Timur Bagautdinov · Rohan Joshi · Fabian Prada · Takaaki Shiratori · Yaser Sheikh · Jason Saragih
Computational Flash Photography through Intrinsics
Sepideh Sarajian Maralan · Chris Careaga · Yagiz Aksoy
PixHt-Lab: Pixel Height Based Light Effect Generation for Image Compositing
Yichen Sheng · Jianming Zhang · Julien Philip · Yannick Hold-Geoffroy · Xin Sun · HE Zhang · Lu Ling · Bedrich Benes
Tensor4D : Efficient Neural 4D Decomposition for High-fidelity Dynamic Reconstruction and Rendering
Ruizhi Shao · Zerong Zheng · Hanzhang Tu · Boning Liu · Hongwen Zhang · Yebin Liu
UV Volumes for Real-time Rendering of Editable Free-view Human Performance
Yue Chen · Xuan Wang · Xingyu Chen · Qi Zhang · Xiaoyu Li · Yu Guo · Jue Wang · Fei Wang
HyperReel: High-Fidelity 6-DoF Video with Ray-Conditioned Sampling
Benjamin Attal · Jia-Bin Huang · Christian Richardt · Johannes Kopf · Michael Zollhöfer · Matthew O’Toole · Changil Kim
屋外シーンの再照明のためのニューラル ラディアンス フィールドと CNN からの補完組み込み関数
Siqi Yang、Xuanning Cui、Yongjie Zhu、Jiajun Tang、Si Li、Zhaofei Yu、Boxin Shi
自己中心的なビュー合成のためのバランスのとれた球面グリッド
Changwoon Choi、Sang Min Kim、Young Min Kim
pCON : ニューラル シーン表現のための偏光座標ネットワーク
Henry Peters · Yunhao Ba · Achuta Kadambi
MobileNeRF: Exploiting the Polygon Rasterization Pipeline for Efficient Neural Field Rendering on Mobile Architectures
Zhiqin Chen · Thomas Funkhouser · Peter Hedman · Andrea Tagliasacchi
ABLE-NeRF: Attendance-Based Rendering Neural Radiance Field の学習可能な埋め込みを使用
Zhe Jun Tang · Tat-Jen Cham · Haiyu Zhao
NeRFVS: ジオメトリ スキャフォールドによるフリー ビュー合成のためのニューラル ラディアンス フィールド
chen yang · Peihao Li · Zanwei Zhou · Shanxin Yuan · Bingbing Liu · Xiaokang Yang · Weichao Qiu · Wei Shen ロバストなビュー合成のための
ローカル ラディアンス フィールドを段階的に最適化
Andreas Meuleman · Yu-Lun Liu · Chen Gao · Jia-Bin Huang · Changil Kim · Min Kim Kim · Johannes Kopf
Removing Objects From Neural Radiance Fields
Silvan Weder · Guillermo Garcia-Hernando · Aron Monszpart · Marc Pollefeys · Gabriel Brostow · Michael Firman · Sara Vicente
SCADE: Space曖昧さを意識した深さ推定による彫刻
ミカエラ・ウイ / リカルド・マルティン・ブルアラ / レオニダス・ギバス / Ke Li
ContraNeRF: 対照学習による合成から現実の小説ビューへの合成のための一般化可能な神経放射フィールド
Hao Yang Lanqing HONG Aoxue Li Tianyang Hu Zhenguo Li Gim Lee Liwei Wang
JacobiNeRF: 相互情報勾配による NeRF シェーピング
Xiaomeng Xu · Yanchao Yang Kaichun Mo Boxiao Pan Li Yi Leonidas Guibas
フレネル マイクロファセット BRDF: ポラリ放射測定表面-物体反射の統合
市川智樹 深尾良樹 延原祥平 西野耕
DartBlur: 検出アーティファクト抑制によるプライバシー保護
Baow ei Jiang · Bing Bai · Haozhe Lin · Yu Wang · Yuchen Guo · LU FANG
属性条件付きの敵対的な顔を使用したフォレンジック分類器の回避
Fahad Shamshad · Koushik Srivatsan · Karthik Nandakumar
RIATIG: Reliable and Imperceptible Adversarial Text-to-Image Generation with Natural Prompts
Han Liu · Yuhao Wu · Shixuan Zhai · Bo Yuan · Ning Zhang
Improving Robust Generalization by Direct PAC-Bayesian Bound Minimization
Zifan Wang · Nan Ding · Tomer Levinboim · Xi Chen · Radu Soricut
Randomized Adversarial Training via Taylor Expansion
Gaojie Jin · Xinping Yi · Dengyu Wu · Ronghui Mu · Xiaowei Huang
Adversarial Counterfactual Visual Explanations
Guillaume Jeanneret · Loic Simon · Frederic Jurie
Transferable Adversarial Attacks on Vision Transformers with Token Gradient Regularization
Jianping Zhang · Yizhan Huang · Weibin Wu · Michael Lyu
パターン注入による動的生成標的型攻撃
Weiwei Feng Nanqing Xu Tianzhu Zhang Yongdong Zhang
強みを弱みに変える: グラフ ニューラル ネットワークに対する認定された堅牢性をインスピレーションにした攻撃フレームワーク
Binghui Wang Meng Pang Yun Dong
ディープ ニューラル ネットワークに対するモデル反転攻撃の再考
Ngoc-Bao Nguyen · Keshigeyan Chandrasegaran · Milad Abdollahzadeh · Ngai-man Cheung
Can't Steal? Cont-Steal! Contrastive Stealing Attacks Against Image Encoders
Zeyang Sha · Xinlei He · Ning Yu · Michael Backes · Yang Zhang
Detecting Backdoors in Pre-trained Encoders
Shiwei Feng ·タオ・グアンホン、チェン・シーユアン、シェン・グアンユー、シュー・シャンゼー、リュウ・インチー、チャン・カイユアン、マー・シーチン、チャン・シャンユー
STDLens: Model Hijacking-resilient Federated Learning for Object Detection
Ka-Ho Chow · Ling Liu · Wenqi Wei · Fatih Ilhan · Yanzhao Wu
Alias-Free Convnets: Fractional Shift Invariance via Polynomial Activations
Hagay Michaeli · Tomer Michaeli · Daniel Soudry
FedDM: Iterative Distribution Matching for Communication-Efficient Federated Learning
Yuanhao Xiong · Ruochen Wang · Minhao Cheng · Felix Yu · Cho-Jui Hsieh
Rethinking Federated Learning with Domain Shift: A Prototype View
Wenke Huang · Mang Ye · Zekun Shi · He Li · Bo Du
Fair Federated Medical Image Segmentation via Client Contribution Estimation
Meirui Jiang · Holger Roth · Wenqi Li · Dong Yang · Can Zhao · Vishwesh Nath · Daguang Xu · DOU QI · Ziyue Xu
Class Balanced Adaptive Pseudo Labeling for Federated Semi-Supervised Learning
Ming Li · Qingli Li · Yan Wang
Prototypical Residual Networks for Anomaly Detection and Localization
Hui Zhang · Zuxuan Wu · Zheng Wang · Zhineng Chen · Yu-Gang Jiang
Exploiting Completeness and Uncertainty of Pseudo Labels for Weakly Supervised Video Anomaly Detection
Chen Zhang · Guorong Li · Yuankai Qi · Shuhui Wang · Laiyun Qing · Qingming Huang · Ming-Hsuan Yang
A New Dataset Based on Images Taken by Blind People for Testing the Robustness of Image Classification Models Trained for ImageNet Categories
Reza Akbarian Bafghi · Danna Gurari
Boosting Verified Training for Robust Image Classifications via Abstraction
Zhaodi Zhang · Zhiyi Xue · Yang Chen · Si Liu · Yueling Zhang · Jing Liu · Min Zhang
画像分類のためのソフト拡張
Yang Liu · Shen Yan · Laura Leal-Taixé · James Hays · Deva Ramanan
Re-GAN: データ効率の高い GAN トレーニングアーキテクチャー再構成経由
Divya Saxena · Jiannong Cao · Jiahao XU · Tarun Kulshrestha
AdaptiveMix: 機能空間縮小による GAN トレーニングの改善
Haozhe Liu · Wentian Zhang · Bing Li · Haoqian Wu · Nanjun He · Yawen Huang · Yuexiang Li · Bernard Ghan em Yefeng Zheng
Enhancing迷惑拡張情報ボトルネックによる複数の信頼性対策
チョン・ジョンホン、ユ・シヒョン、イ・ハングク、シン・ジヌ
Bit-shrinking: Limiting Instantaneous Sharpness for Improving Post-training Quantization
Lin Chen · Bo Peng · Zheyang Li · Wenming Tan · Ye Ren · Jun Xiao · Shiliang Pu
Robust Generalization against Photon-Limited Corruptions via Worst-Case Sharpness Minimization
Zhuo Huang · Miaoxi Zhu · Xiaobo Xia · Li Shen · Jun Yu · Chen Gong · Bo Han · Bo Du · Tongliang Liu
OT-Filter: An Optimal Transport Filter for Learning with Noisy Labels
Chuanwen Feng · Yilong Ren · Xike Xie
Don’t Lie to Me! Robust and Efficient Explainability with Verified Perturbation Analysis
Thomas FEL · Melanie Ducoffe · David Vigouroux · Remi Cadene · Mikaël Capelle · Claire NICODEME · Thomas Serre
ディープ ニューラル ネットワークの評価におけるトップダウンのランダム化ベースの健全性チェックの欠点
Alexander Binder · Leander Weber · Sebastian Lapuschkin · Grégoire Montavon · Klaus Muller · Wojciech Samek
ConvNeXt V2: マスクされたオートエンコーダによる ConvNets の共同設計とスケーリング
Sanghyun Woo · Shoubhik Debnath · Ronghang Hu · Xinlei Chen · Zhuang Liu · In So Kweon · Saining Xie
画像認識のための多項式ネットワークの正則化
Grigorios Chrysos · Bohan Wang · Jiankang Deng · Volkan Cevher
ステッチ可能ニューラル ネットワーク
Zizheng Pan · Jianfei Cai · Bohan Zhuang
DepGraph: Towards Any構造剪定
Gongfan Fang、Xinyin Ma、Mingli Song、Michael Bi Mi、Xinchao Wang
Meta-Learning with a Geometry-Adaptive Preconditioner
Suhyun Kang · Duhun Hwang · Moonjung Eo · Taesup Kim · Wonjong Rhee
Class Adaptive Network Calibration
Bingyuan Liu · Jérôme Rony · Adrian Galdran · Jose Dolz · Ismail Ayed
Differentiable Architecture Search with Random Features
zhang xuanyang · Yonggang Li · Xiangyu Zhang · Yongtao Wang · Jian Sun
DART: Diversify-Aggregate-Repeat Training Improves Generalization of Neural Networks
Samyak Jain · Sravanti Addepalli · Pawan Sahu · Priyam Dey · Venkatesh Babu Radhakrishnan
NICO++: Towards better bechmarks for Out-of-Distribution Generalization
Xingxuan Zhang · Yue He · Renzhe Xu · Han Yu · Zheyan Shen · Peng Cui
継続学習のための双方向記憶の強化
Xing Nie Shixiong Xu Xiyan Liu Gaofeng Meng Chunlei Huo Shiming Xiang CafeBoost
: 授業の増分学習におけるタスク誘発バイアスを排除する因果特徴ブースト
Benliu Qiu Honliang Li Haitao Wen Heqian Qi u · Lanxiao Wang Fanman Meng Qingbo Wu Lili小規模な学生向けのパン
: 効率的な画像検索のための容量動的蒸留
Yi Xie Huaidong Zhang Xuemiao Xu Jianqing Zhu Shengfeng He
マスクされたオートエンコーダの汎用から特定への蒸留
Wei Huang Zhili ang Peng Li Dong Furu Wei Jianbin Jiao Qixiang Ye
異種混合継続学習
Divyam Madaanホンシュ・イン ウォンミン・ビョン ジャン・カウツ パブロ・モルチャノフ
Manipulating Transfer Learning for Property Inference
Yulong Tian · Fnu Suya · Anshuman Suri · Fengyuan Xu · David Evans
Adapting Shortcut with Normalizing Flow: An Efficient Tuning Framework for Visual Recognition
Yaoming Wang · Bowen Shi · XIAOPENG ZHANG · Jin Li · Yuchen Liu · Wenrui Dai · Chenglin Li · Hongkai Xiong · Qi Tian
A New Benchmark: On the Utility of Synthetic Data with Blender for Bare Supervised Learning and Downstream Domain Adaptation
Hui Tang · Kui Jia
Switchable Representation Learning Framework with Self-compatibility
shengsen wu · Yan Bai · Yihang Lou · Xiongkun Linghu · Jianzhong He · LINGYU DUAN
Domain Expansion of Image Generators
Yotam Nitzan · MICHAEL GHARBI · Richard Zhang · Taesung Park · Jun-Yan Zhu · Daniel Cohen-Or · Eli Shechtman
動的シナリオにおける堅牢なテスト時間適応
Longhui Yuan · Binhui Xie · Shuang Li 取得
によるトレイン/テスト時間適応
Luca Zancato · Alessandro Achille · Tian Yu Liu · Matthew Trager · Pramuditha Perera · Stefano Soatto
少数ショット領域の一般化のためのバイレベルメタ学習
Xiaorong Qin · Xinhang Song · Shuqiang Jiang
マルチモーダルの最大化によるオールインワンの事前トレーニングに向けて相互情報Weijie Su · Xizhou Zhu · Chenxin Tao · Lewei Lu · Bin Li · Gao Huang · Yu Qiao · Xiaogang Wang · Jie Zhou · Jifeng Dai共有固有特徴モデリング
による欠落モダリティによるマルチモーダル学習

Hu Wang、Yuanhong Chen、Congbo Ma、Jodie Avery、M. Louise Hull、Gustavo Carneiro
DiGA: 蒸留して一般化し、ドメイン適応型セマンティック セグメンテーションに適応する
Fengyi Shen、Akhil Gurram、Ziyuan Liu、He Wang、Alois Knoll
プログレッシブ オープン スペース拡張オープンセットモデルの属性
Tianyun Yang · Danding Wang · Fan Tang · Xinying Zhao · Juan Cao · Sheng Tang
DLBD: 自己教師あり直接学習型バイナリ記述子
Bin Xiao · Yang Hu · Bo Liu · Xiuli Bi · Weisheng Li · Xinbo Gao
DAA: バイナリコード変換器による年齢推定のためのデルタ年齢 AdaIN 演算
Ping Chen Xingpeng Zhang Ye Li Ju Tao Bin Xiao Bing Wang zongjie jiang
Curvature-Balanced Feature Manifold Learning for Long-Tailed Classification
Yanbiao Ma · Licheng Jiao · Fang Liu · Shuyuan Yang · Xu Liu · Lingling Li
Global and Local Mixture Consistency Cumulative Learning for Long-tailed Visual Recognitions
Fei Du · peng yang · Qi Jia · Fengtao Nan · xiaoting chen · Yun Yang
No One Left Behind: Improving the Worst Categories in Long-Tailed Learning
Yingxiao Du · Jianxin Wu
Learning Imbalanced Data with Vision Transformers
Zhengzhuo Xu · Ruikang Liu · Shuo Yang · Zenghao Chai · Chun Yuan
Ranking Regularization for Critical Rare Classes: Minimizing False Positives at a High True Positive Rate
Kiarash Mohammadi · He Zhao · Mengyao Zhai · Frederick Tung
MarginMatch: 半教師あり学習のためのラベルなしデータのトレーニング ダイナミクスの使用
Tiberiu Sosea · Cornelia Caragea
CHMATCH: 対照的階層マッチングと堅牢な適応閾値ブーストによる半教師あり学習
Jianlong Wu · Haozhe Yang · Tian Gan · Ning Ding · Feijun Jiang · Liqiang Nie
Boostingマージンベースの不確実性重み付けと確率正則化によるトランスダクティブ・フューショット微調整
Ran Tao / Hao Chen / Marios
普遍的にスリム化可能な自己教師あり学習のために知っておくべき 3 つのガイドライン
Yun-Hao Cao / Peiqin Sun / Shuchang Zhou
パフォーマンスの橋渡しに向けて共同エネルギーベースモデルのギャップ
Xiulong Yang、Qing Su、Shihao Ji
Siamese DETR
Zeren Chen Gengshi Huang Wei Li Jianing Teng Kun Wang Jing Shao CHEN CHANGE LOY Lyu Sheng
不完全マルチビュー クラスタリングのための自信の高いローカル構造ベースのコンセンサス グラフ学習
Jie Wen Chengliang Liu Gehui Xu Zhihao Wu Chao Huang Lunke Fei Yong Xu を
使用するためのブロック選択方法分布外検出における特徴規範
Yeonguk Yu Sungho Shin Seongju Lee Changhyun Jun Kyoobin Lee
全生存時間予測のための因果関係を意識した術中代入
Xiang Li Xuelin Qian Litian Liang Lingjie Kong Qiaole Dong Chen Jiejun Dingxia Liu Xiuzhong Yao Yanwei Fu
PEFAT: Boosting Semi-supervised Medical Image Classification via Pseudo-loss Estimation and Feature Adversarial Training
Zeng Qingjie · Yutong Xie · Lu Zilin · Yong Xia
Histopathology Whole Slide Image Analysis with Heterogeneous Graph Representation Learning
Tsai Chan Chan · Fernando Julio Cendra · Lan Ma · Guosheng Yin · Lequan Yu
MCF: Mutual Correction Framework for Semi-Supervised Medical Image Segmentation
Yongchao Wang · Bin Xiao · Xiuli Bi · Weisheng Li · Xinbo Gao
DoNet: Deep De-overlapping Network for Cytology Instance Segmentation
Hao JIANG · Rushan Zhang · Yanning Zhou · Yumeng Wang · Hao Chen
Weakly supervised segmentation with point annotations for histopathology images via contrast-based variational model
hongrun zhang · Liam Burrows · Yanda Meng · Declan Sculthorpe · ABHIK MUKHERJEE · Sarah Coupland · Ke Chen · Yalin Zheng
Self-Supervised Learning from Images with a Joint-Embedding Predictive Architecture
Mido Assran · Quentin Duval · Pascal Vincent · Ishan Misra · Piotr Bojanowski · Michael Rabbat · Yann LeCun · Nicolas Ballas
Boosting Detection in Crowd Analysis via Underutilized Output Features
Shaokai Wu · Fengyu Yang
Bi3D: Bi-domain Active Learning for Cross-domain 3D Object Detection
Jiakang Yuan · Bo Zhang · Xiangchao Yan · Tao Chen · Botian Shi · Yikang LI · Yu Qiao
Ambiguity-Resistant Semi-Supervised Learning for Dense Object Detection
Chang Liu · Weiming Zhang · Xiangru Lin · Wei Zhang · Xiao Tan · Junyu Han · Xiaomao Li · Errui Ding · Jingdong Wang
Large-scale Training Data Search for Object Re-identification
Yue Yao · Tom Gedeon · Liang Zheng
SOOD: Towards Semi-Supervised Oriented Object Detection
Wei Hua · Dingkang Liang · jingyu li · Xiaolong Liu · Zhikang Zou · Xiaoqing Ye · Xiang Bai
Zero-Shot Object Counting
Jingyi Xu · Hieu Le · Vu Nguyen · Viresh Ranjan · Dimitris Samaras
SAP-DETR: Bridging the Gap between Salient Points and Queries-Based Transformer Detector for Fast Model Convergency
Yang Liu · Yao Zhang · Yixin Wang · Yang Zhang · Jiang Tian · zhongchao shi · Jianping Fan · Zhiqiang He
回転アノテーションを使用しない回転検出を学ぶための知識の組み合わせ
Tianyu Zhu、Bryce Ferenczi、Pulak Purkait、Tom Drummond、Hamid Rezatofighi、Anton Hengel
複数のアノテーションの下にある宝物: 不確実性を認識したエッジ検出器
Caixia Zhou、Yaping Huang、Mengyang Pu、Qingji Guan、 Li Huang · Haibin Ling
分離されたセマンティック プロトタイプにより、専門家主導のドメインにおける半弱セグメンテーションの任意のアノテーション タイプからの学習が可能
Simon Reiß · Constantin Seibold · Alexander Freytag · Erik Rodner · Rainer Stiefelhagen
による教師なし事前トレーニングによる低データ インスタンスのセグメンテーションの強化顕著性プロンプト
HAO LI、Dingwen Zhang、Nian Liu、Lechao Cheng、Yalun Dai、Chao Zhang、Xinggang Wang、Junwei Han
STAR Loss: Reducing Semantic Ambiguity in Facial Landmark Detection
Zhenglin Zhou · Huaxia Li · Hon Liu · Nanyang Wang · Gang Yu · Rongrong Ji
半教師ありセマンティックセグメンテーションのためのファジィポジティブ学習
Pengchong Qiao · Zhidan Wei · Yu Wang · Zhennan Wang · Guoli S ong・FAN XU・XIANYGANG JIANG LIU・JIE CHEN
適応ガウス混合によるまばらな注釈付きセマンティック・セグメンテーション
Linshan wu・zhunzan fangxin h E・qiang Liu・JIAYI Ma・Hao Chen
時空間概念
ベース Ji・Yu Wang・Jien Kata
Weakly - プロトタイプ対照学習による教師ありドメイン適応型セマンティック セグメンテーション
Anurag Das · Yongqin Xian · Dengxin Dai · Bernt Schiele
Exemplar-FreeSOLO: Exemplars を使用した教師なしインスタンス セグメンテーションの強化
TAOSEEF ISHTIAK · Qing En · Yuhong Guo
野生のビデオから人間とカメラの動きを切り離す
Vickie Ye · Georgios Pavlakos · Jitendra Malik · Angjoo金沢
CIRCLE: 豊かなコンテキスト環境でのキャプチャ
Joao Araujo · Jiaman Li · Karthik Vetrivel · Rishi Agarwal · Deepak Gopinath · Jiajun Wu · Alexander Clegg · Karen Liu
CARTO: ARTiculated Objects のカテゴリーと共同非依存的再構築
Nick Heppert · Muhammad Zubair Irshad · Sergey Zakharov · Katherine Liu · Rareř Ambrush · Jeannette Bohg · Abhinav Valada · Thomas Kollar
DexArt: 多関節オブジェクトを使用した一般化可能な器用な操作のベンチマーク
Chen Bao · Helin Xu · Yuzhe Qin · Xiaolong Wang
FLEX: 全身把握なしの全身把握
Purva Tendulkar · Didac Suris Coll-Vinent · Carl Vondrick
Im2Hands: 相互作用する両手の形状の注意深い暗黙的表現の学習
Jihyun Lee · Minhyuk Sung · Hongyu Choi · Tae-Kyun Kim
コンポーネント認識トランスフォーマーを使用した 1 段階 3D 全身メッシュ復元
Jing Lin · Ailing Zeng · Haoqian Wang · Lei Zhang · Yu Li 目に
見えないビューからのポーズと形状の一貫性を使用した暗黙的な 3D ヒューマン メッシュ復元
ハンビエル・チョー、ユシン・チョー、ジェソン・アン、ジュンモ・キム
・フロー監修、変形可能な NeRF
チャオヤン・ワン、ラクラン・マクドナルド、ラズロ・ジェニ、サイモン・ルーシー
FlexNeRF: Photorealistic Free-viewpoint Rendering of Moving Humans from Sparse Views
Vinoj Yasanga Jayasundara Magalle Hewa · Amit Agrawal · Nicolas Heron · Abhinav Shrivastava · Larry Davis
POEM: Reconstructing Hand in a Point Embedded Multi-view Stereo
Lixin Yang · Jian Xu · Licheng Zhong · Xinyu Zhan · Zhicheng Wang · Kejian Wu · Cewu Lu
Clothed Human Performance Capture with a Double-layer Neural Radiance Fields
Kangkan Wang · Guofeng Zhang · Suxu Cong · Jian Yang
VGFlow: Visibility guided Flow Network for Human Reposing
Rishabh Jain · Krishna Kumar Singh · Mayur Hemani · Jingwan Lu · Mausoom Sarkar · Duygu Ceylan · Balaji Krishnamurthy
HandNeRF: Neural Radiance Fields for Animatable Interacting Hands
Zhiyang Guo · Wengang Zhou · Min Wang · Li Li · Houqiang Li
PAniC-3D: アニメキャラクターのポートレートから定型化されたシングルビュー 3D 再構成
Shuhong Chen · Kevin Zhang · Yichun Shi · Heng Wang · Yiheng Zhu · Guoxian Song · Sizhe An · Janus Kristjansson · Xiao Yang · Matthias Zwicker
PointAvatar: ビデオからの変形可能なポイントベースのヘッド アバター
Yufeng Zheng · Wang Yifan · Gordon Wetzstein · Michael Black · Otmar Hilliges
Ham2Pose: 手話表記をポーズ シーケンスにアニメーション化
Rotem Shalev Arkushin · Amit Moryossef Ohad Fried
Auto -カード: リアルタイム モバイル テレプレゼンスのための効率的で堅牢なコーデック アバター ドライビング
Yonggan Fu、Yuecheng Li、Chenghui Li、Jason Saragih、Peizhao Zhang、Xiaoliang Dai、Yingyan Lin
ローカルで編集可能な仮想ヒューマンの学習
Hsuan-I Ho Lixin Xue Jie Song Otmar Hilliges
ゲーム キャラクター自動作成のためのゼロショット テキストからパラメータへの変換
Rui Zhao Wei Li Zhipeng Hu Lincheng Li Zhengxia Zou Zhenwei Shi · Changjie Fan
ニューラル パラメトリック頭部モデルの学習
Simon Giebenhain · Tobias Kirschstein · Markos Georgopoulos · Martin Rünz · Lourdes Agapito · Matthias Niessner
Next3D: 3D 対応頭部アバターのための生成ニューラル テクスチャ ラスタライゼーション
Jingxiang Sun · Xuan Wang · Lizhen Wang Xiaoyu Li Yong Zhang Honwen Zhang Yebin Liu
Graphics Capsule: Learning Hierarchical 2D 画像からの 3D 顔表現
Chang Yu Xiangyu Zhu Xiaomei Zhang Zhaxiang Zhang Zhen Lei
顔セグメンテーションのためのパラメータ効率的なローカル暗黙的画像関数ネットワーク
Mausoom Sarkar · Nikitha SR · Mayur Hemani · Rishabh Jain · Balaji Krishnamurthy
StyleGene: 親族顔合成のための領域レベルの顔遺伝子の交叉と突然変異
Hao Li · Xianxu Hou · Zepeng Huang · Linlin Shen PanoHead: 360 °
でのジオメトリを意識した 3D フルヘッド合成

Sizhe An · Hongyi Xu · Yichun Shi · Guoxian Song · Umit Ogras · Linjie Luo
Self-Supervised Geometry-Aware Encoder for Style-Based 3D GAN Inversion
Yushi LAN · Xuyi Meng · Shuai Yang · CHEN CHANGE LOY · Bo Dai
3D Highlighter: Localizing Regions on 3D Shapes via Text Descriptions
Dale Decatur · Itai Lang · Rana Hanocka
Dream3D: Zero-Shot Text-to-3D Synthesis Using 3D Shape Prior and Text-to-Image Diffusion Models
Jiale Xu · Xintao Wang · Weihao Cheng · Yan-Pei Cao · Ying Shan · Xiaohu Qie · Shenghua Gao
Efficient View Synthesis and 3D-based Multi-Frame Denoising with Multiplane Feature Representations
Thomas Tanay · Ales Leonardis · Matteo Maggioni
Diffusion-Based Signed Distance Fields for 3D Shape Generation
Jaehyeok Shim · Changwoo Kang · Kyungdon Joo
Persistent Nature: A Generative Model of Unbounded 3D Worlds
Lucy Chai · Richard Tucker · Zhengqi Li · Phillip Isola · Noah Snavely
OReX: Object Reconstruction from Planar Cross-sections Using Neural Fields
Haim Sawdayee · Amir Vaxman · Amit Bermano
Sphere-Guided Training of Neural Implicit Surfaces
Andreea Dogaru · Andrei-Timotei Ardelean · Savva Ignatyev · Egor Zakharov · Evgeny Burnaev
NeuralUDF: Learning Unsigned Distance Fields for Multi-view Reconstruction of Surfaces with Arbitrary Topologies
Xiaoxiao Long · Cheng Lin · Lingjie Liu · Yuan Liu · Peng Wang · Christian Theobalt · Taku Komura · Wenping Wang
ガラス越しに見る: 高鏡面反射に対する神経表面の再構成
Jiaxiong Qiu、Peng-Tao Jiang、Yifan Zhu、Ze-Xin ying、Ming-Ming Cheng、Bo Ren
マイクロスケール 3D 形状再構成のための望遠鏡イメージング システム、
Ryo Kawahara、Meng-Yu Kuo · 延原翔平 微分
レンズ: 物体検出のためのガラス表面および材料上の複合レンズ検索
ジェフロワ・コテ · ファヒム・マナン · シモン・ティボー · ジャン=フランソワ・ラロンド · フェリックス・ハイデ
SunStage: 太陽をライトステージとして使用したポートレートの再構成と再照明
Yifan Wang · Aleksander Holynski、Xiuming Zhang、Cecilia Zhang
事前の光学中心対称を使用した夜間スマートフォン反射フレア除去
Yuekun Dai · Yihang Luo · Shangchen Zhou · Chongyi Li · CHEN CHANGE LOY
ORCA: Radiance Field Cameras としての光沢のあるオブジェクト
Kushagra Tiwary · Akshat Dave · Nikhil Behari · Tzofi Klinghoffer · Ashok Veeraraghavan · Ramesh Raskar
ReLight My NeRF: A Dataset for Novel View Synthesis
マルコ・トスキ、リッカルド・デ・マッテオ、リッカルド・スペツィアレッティ、ダニエレ・グレゴリオ、ルイージ・ディ・ステファノ、サムエレ・サルティニューラル
シーン年表
林ハオトン、王銭前、蔡若仁、鵬シダ、ハダール・アヴェルブーシュ・エロール、周暁偉、ノア・スネーブリー
DyNCA: ニューラル セルラー オートマトンを使用したリアルタイム ダイナミック テクスチャ合成
Ehsan Pajouheshgar · Yitao Xu · Tong Zhang · Sabine Süsstrunk
TriVol: トリプル ボリュームによる点群レンダリング
Tao Hu Xiaogang Xu Ruihang Chu Jiaya Jia
ニューラル ラディアンス フィールドによるオクルージョンフリーのシーン回復
Chengxuan Zhu Renjie Wan Yunkai Tang Boxin Shi
Photorea Listic 3D シーン スタイライゼーションのための Lipschitz ネットワークによるラディアンス フィールドの変換
Zicheng Zhang · Yinglu Liu · Congying Han · Yingwei Pan · Tiande Guo · Ting Yao
PaletteNeRF: ニューラル ラディアンス フィールドのパレットベースの外観編集
Zhengfei Kuang · Fujun Luan · Sai Bi · Zhixin Shu · Gordon Wetzstein · Kalyan Sunkavalli
コンパクトなニューラル ラディアンス フィールドのマスク ウェーブレット表現
Danielロ・ビョンヒョン イ・スンテ ナムジュチャン イ・ジョンファン コ・ウンビョン パク
SPIn-NeRF: 神経放射フィールドを使用したマルチビュー セグメンテーションと知覚修復
Ashkan Mirzaei · Tristan Aumentado-Armstrong · Konstantinos Derpanis · Jonathan Kelly · Marcus Brubaker · Igor Gilitschenski · Alex Levinshtein MixNeRF
: スパース入力からの新しいビュー合成のための混合密度による光線のモデリング
Seunghyeon Seo · Donghoon Han · Yeonjin Chang · Nojun Kwak
GM-NeRF: マルチビュー画像からの一般化可能なモデルベースの神経放射フィールドの学習
Jianchuan Chen · Wentao Yi · Liqian Ma · Xu Jia · Huchuan Lu
NeRDi: シングルビュー NeRF 合成一般的なイメージとしての
言語による普及
RobustNeRF: 堅牢な損失による妨害者を無視する
Sara Sabour、Suhani Vora、Daniel Duckworth、Ivan Krasin、David Fleet、Andrea Tagliasacchi
過渡イベント周波数による高忠実度イベント - Radiance Recovery
Jin Han、Yuta Asano、Boxin Shi、yingqiang Zheng、Zhihang Zhong
TruFor : 信頼できる画像偽造の検出と位置特定のためのオールラウンドな手がかりの活用
ファブリツィオ・ギラーロ、ダヴィデ・コッツォリーノ、アヴニーシュ・スッド、ニコラス・デュフォー、ルイーザ・ヴェルドリヴァ
CLIP2Protect: 敵対的潜在検索によるテキストガイドメイクアップを使用した顔のプライバシーの保護
ファハド・シャムシャド、ムハンマド・ムザマル・ナシール、カルティク・ナンダクマール
離散的な点単位の攻撃では不十分: 顔認識のための一般化された多様な敵対的攻撃
Qian Li · Yuxiao Hu · Ye Liu · Dongxiao Zhang · Xin Jin · Yuntian Chen
Generalist: Decoupling Natural and Robust Generalization
Hongjun Wang · Yisen Wang
AGAIN: Adversarial Training with Attribution Span Enlargement and Hybrid Feature Fusion
Shenglin Yin · kelu Yao · Sheng Shi · Yangzhou Du · Zhen Xiao
HGFormer: Hierarchical Grouping Transformer for Domain Generalized Semantic Segmentation
Jian Ding · Nan Xue · Gui-Song Xia · Bernt Schiele · Dengxin Dai
Pruning Parameterization with Bi-level Optimization for Efficient Semantic Segmentation on the Edge
Changdi Yang · Pu Zhao · Yanyu Li · Wei Niu · Jiexiong Guan · Hao Tang · Minghai Qin · Bin Ren · Xue Lin · Yanzhi Wang
Towards Open-World Segmentation of Parts
Tai-Yu Pan · Qing Liu · Wei-Lun Chao · Brian Price
SegLoc: Learning Segmentation-based Representations for Privacy-Preserving Visual Localization
Maxime Pietrantoni · Martin Humenberger · Torsten Sattler · Gabriela Csurka
GeoNet: Benchmarking Unsupervised Adaptation across Geographies
Tarun Kalluri · Wangdong Xu · Manmohan Chandraker
Modeling Entities as Semantic Points for Visual Information Extraction in the Wild
Zhibo Yang · Rujiao Long · Pengfei Wang · Sibo Song · Humen Zhong · Wenqing Cheng · Xiang Bai · Cong Yao
DPF: Learning Dense Prediction Fields with Weak Supervision
Xiaoxue Chen · Yuhang Zheng · Yupeng Zheng · Qiang Zhou · Hao Zhao · Guyue Zhou · Ya-Qin Zhang
一般化されたゼロショット学習のための漸進的意味視覚的相互適応
Man Liu Feng Li Chunjie Zhang Yunchao Wei Huihui Bai Yao Zhao
オブジェクトの発見と検索としての普遍的なインスタンスの認識
Bin Yan Yi Jiang Jiannan Wu Dong Wang Ping Luo Zehuan Yuan Huchuan Lu
解絡者としての学習注意構成ゼロショット学習用
Shaozhe Hao Kai Han Kwan-Yee K. Wong
CLIP は効率的なセグメンタでもあります: 弱教師付きセマンティック セグメンテーションのためのテキスト駆動アプローチ
Yuqi Lin Minghao Chen · Wenxiao Wang · Boxi Wu · Ke Li · Binbin Lin · Haifeng Liu と Xiaofei He による
テキスト認識のための自己監視型暗黙的グリフ アテンション
Tongkun Guan · Chaochen Gu · Jingzheng Tu · Xue Yang · Qi Feng · yudi zhao · Wei Shen
Visual Recognition by Request
Chufeng Tang · Lingxi Xie · XIAOPENG ZHANG · Xiaolin Hu · Qi Tian
Aligning Bag of Regions for Open-Vocabulary Object Detection
Size Wu · Wenwei Zhang · Sheng Jin · Wentao Liu · CHEN CHANGE LOY
CLIP^2: Contrastive Language-Image-Point Pretraining from Real-World Point Cloud Data
Yihan Zeng · Chenhan Jiang · Jiageng Mao · Jianhua Han · Chaoqiang Ye · Qingqiu Huang · Dit-Yan Yeung · Zhen Yang · Xiaodan Liang · Hang Xu
CapDet: Unifying Dense Captioning and Open-World Detection Pretraining
Yanxin Long · Youpeng Wen · Jianhua Han · Hang Xu · Pengzhen Ren · Wei Zhang · Shen Zhao · Xiaodan Liang
シーケンス生成に基づく統一シーンテキストスポッティングに向けて
Taeho Kil Seonghyeon Kim Sukmin Seo Yuonsik Kim Daehee Kim
プロンプト、生成、そしてキャッシュ: 基礎モデルのカスケードにより強力な少数ショット学習者が作成
Renrui Zhang Xiangfei Hu Bohao Li Siyuan Huang · Hanqiu Deng · Yu Qiao · Peng Gao · Honsheng Li
画像検索における敵対的学習による境界を意識した下位互換性表現
Tan Pan · Furon Xu · Xudong Yang · Sifeng He · Chen Jiang · Qingpei Guo · Feng Qian · Xiaobo Zhang · Yuan Cheng Lei Yang Wei Chu
Q : 大規模な視覚言語モデルをデータ不足の VQA タスクに特化させる方法? A: ラベルのない画像で自己学習!
Zaid Khan Vijay Kumar BG Samuel Schulter Xiang Yu Yun Fu Manmohan Chandraker
ConStruct-VL: Data-Free Continual Structured VL Concepts Learning
James Smith · Paola Cascante-Bonilla · Assaf Arbelle · Donghyun Kim · Rameswar Panda · David Cox · Diyi Yang · Zsolt Kira · Rogerio Feris · Leonid Karlinsky
À-la-carte Prompt Tuning (APT): Combining Distinct Data Via Composable Prompting
Benjamin Bowman · Alessandro Achille · Luca Zancato · Matthew Trager · Pramuditha Perera · Giovanni Paolini · Stefano Soatto
Prompting Large Language Models with Answer Heuristics for Knowledge-based Visual Question Answering
Zhenwei Shao · Zhou Yu · Meng Wang · Jun Yu
Super-CLEVR: A Virtual Benchmark to Diagnose Domain Robustness in Visual Reasoning
Zhuowan Li · Xingrui Wang · Elias Stengel-Eskin · Adam Kortzlewski · Wufei Ma · Benjamin Van Durme · Alan Yuille
ビジュアル プログラミング: トレーニングなしの構成的視覚推論
Tanmay Gupta · Aniruddha Kembhavi
視覚認識のためのモダリティが欠落しているマルチモーダル プロンプト
Yi-Lun Lee · Yi - Hsuan Tsai、Wei-Chen Chiu、Chen-Yu Lee
EXCALIBUR: 身体化された探求の奨励と評価
Hao Zhu、Raghav Kapoor、So Yeon Min、Winson Han、Jiatai Li、Kaiwen Geng、Graham Neubig、Yonatan Bisk、Aniruddha Kembhavi、Luca Weihs
視覚と言語の反復ナビゲーション
ジェイコブ・クランツ、シュルジョ・バナジー、ワン・ズー、ジェイソン・コルソ、ピーター・アンダーソン、ステファン・リー、ジェシー・トマソン
視覚言語ナビゲーションのための適応ゾーン認識階層プランナー
Chen Gao、Xingyu Peng、Mi Yan、He Wang、Lirong Yang、Haibing Ren、Hongsheng Li、Si Liu
SkyEye: 単眼正面ビューを使用した自己監視鳥瞰図セマンティック マッピング画像
Nikhil Gosala · Kürsat Petek · Paulo Drews-Jr · Wolfram Burgard · Abhinav Valada
自然言語支援手話認識
Ronglai Zuo · Fangyun Wei · Brian Mak
状況予測の学習 ビデオ質問応答用のハイパーグラフ
Aisha Urooj · Hilde Kuehne · Bo Wu · Kim Chheu · Walid Bousselham · Chuang Gan · Niels Lobo · Mubarak Shah
整列して出席: 二重対照損失によるマルチモーダル要約
Bo He · Jun Wang · Jielin Qiu · Trung Bui · Abhinav Shrivastava · Zhaowen Wang
Clover: Towards A Unified Video-Language Alignment and Fusion Model
Jingjia Huang · Yinan Li · Jiashi Feng · Xinglong Wu · Xiaoshuai Sun · Rongrong Ji
Towards Fast Adaptation of Pretrained Contrastive Models for Multi-channel Video-Language Retrieval
Xudong Lin · Simran Tiwari · Shiyuan Huang · Manling Li · Mike Zheng Shou · Heng Ji · Shih-Fu Chang
PDPP:Projected Diffusion for Procedure Planning in Instructional Videos
Hanlin Wang · Yilu Wu · Sheng Guo · Limin Wang
Learning Procedure-aware Video Representation from Instructional Videos and Their Narrations
Yiwu Zhong · Licheng Yu · Yang Bai · Shangwen Li · Xueting Yan · Yin Li
Text-Visual Prompting for Efficient 2D Temporal Video Grounding
Yimeng Zhang · Xin Chen · Jinghan Jia · Sijia Liu · Ke Ding
Language-Guided Music Recommendation for Video via Prompt Analogies
Daniel McKee · Justin Salamon · Josef Sivic · Bryan Russell
MIST: Multi-modal Iterative Spatial-Temporal Transformer for Long-form Video Question Answering
Difei Gao · Luowei Zhou · Lei Ji · Linchao Zhu · Yi Yang · Mike Zheng Shou
Distilling Vision-Language Pre-training to Collaborate with Weakly-Supervised Temporal Action Localization
Chen Ju · Kunhao Zheng · Jinxiang Liu · Peisen Zhao · Ya Zhang · Jianlong Chang · Qi Tian · Yanfeng Wang
Cascade Evidential Learning for Open-world Weakly-supervised Temporal Action Localization
Mengyuan Chen Junyu Gao Changsheng Xu
STMixer: 1 段階のスパース アクション検出器
Tao Wu Mengqi Cao Ziteng Gao Gangshan Wu Limin Wang
The Wisdom of Crowds: 早期アクション予測に対する時間的進歩的注意
Alexandros Stergiou Dima Damen
ビデオ アクションの大規模ロバストネス分析認識モデル
Madeline Chantry Naman Biyani Prudvi Kamtam Shruti Vyas Hamid Palangi Vibhav Vineet Yogesh Rawat
階層韻律モデルによる映画の吹き替え学習
Gaoxiang Cong Liang Li Yuankai Qi Zheng -Jun Zha · Qi Wu · Wenyu Wang · Bin. Jiang · Ming-Hsuan Yang · Qingming Huang
iQuery: オーディオビジュアル音分離のためのクエリとしての機器
Jiaben Chen · Renrui Zhang · Dongze Lian · Jiaqi Yang · Ziyao Zeng · Jianbo Shi
Egocentric Auditory Attention Localization in Conversations
Fiona Ryan · Hao Jiang · Abhinav Shukla · James Rehg · Vamsi Krishna Ithapu
Seeing What You Said: Talking Face Generation Guided by a Lip Reading Expert
Jiadong Wang · Xinyuan Qian · Malu Zhang · Robby Tan · Haizhou Li
Source-Free Video Domain Adaptation with Spatial-Temporal-Historical Consistency Learning
Kai Li · Deep A Patel · Erik Kruus · Martin Min
Referring Multi-Object Tracking
Dongming Wu · Wencheng Han · Tiancai Wang · Xingping Dong · Xiangyu Zhang · Jianbing Shen
A Generalized Framework for Video Instance Segmentation
Miran Heo · Sukjun Hwang · Jeongseok Hyun · Hanjung Kim · Seoung Wug Oh · Joon-Young Lee · Seon Joo Kim
LSTFE-Net:Long Short-Term Feature Enhancement Network for Video Small Object Detection
Jinsheng Xiao · Yuanxu Wu · Yunhua Chen · Shurui Wang · Zhongyuan Wang · Jiayi Ma
Streaming Video Model
Yucheng Zhao · Chong Luo · Chuanxin Tang · Dongdong Chen · Noel Codella · Zheng-Jun Zha
Video Event Restoration Based on Keyframes for Video Anomaly Detection
Zhiwei Yang · Jing Liu · Zhaoyang Wu · Peng Wu · Xiaotao Liu
Bootstrapping Objectness from Videos by Relaxed Common Fate and Visual Grouping
Long Lian · Zhirong Wu · Stella Yu
SeqTrack: Sequence to Sequence Learning for Visual Object Tracking
Xin Chen · Houwen Peng · Dong Wang · Huchuan Lu · Han Hu
VideoMAE V2: Scaling Video Masked Autoencoders with Dual Masking
Limin Wang · Bingkun Huang · Zhiyu Zhao · Zhan Tong · Yinan He · Yi Wang · Yali Wang · Yu Qiao
Iterative Next Boundary Detection for Instance Segmentation of Tree Rings in Microscopy Images of Shrub Cross Sections
Alexander Gillert · Giulia Resente · Alba Anadon-Rosell · Martin Wilmking · Uwe Freiherr von Lukas
Visual Dependency Transformers: Dependency Tree Emerges from Reversed Attention
Mingyu Ding · Yikang Shen · Lijie Fan · Zhenfang Chen · Zitian Chen · Ping Luo · Joshua Tenenbaum · Chuang Gan
SimpSON: Simplifying Photo Cleanup with Single-Click Distracting Object Segmentation Network
Chuong Huynh · Yuqian Zhou · Zhe Lin · Connelly Barnes · Eli Shechtman · Sohrab Amirghodsi · Abhinav Shrivastava
Ada
MAE: Adaptive Masking for Efficient Spatiotemporal Learning with Masked Autoencoders
Wele Bandara Bandara · Naman Patel · Ali Gholami · Mehdi Nikkhah · Motilal Agrawal · Vishal Patel
FlexiViT: One Model for All Patch Sizes
Lucas Beyer · Pavel Izmailov · Alexander Kolesnikov · Mathilde Caron · Simon Kornblith · Xiaohua Zhai · Matthias Minderer · Michael Tschannen · Ibrahim Alabdulmohsin · Filip Pavetic
Improving Visual Representation Learning through Perceptual Understanding
Samyakh Tukra · Fred Hoffman · Ken Chatfield
Revealing the Dark Secrets of Masked Image Modeling
Zhenda Xie · Zigang Geng · Jingcheng Hu · Zheng Zhang · Han Hu · Yue Cao
ビデオからの生理学的信号の非対照的教師なし学習
Jeremy Speth · Nathan Vance · Patrick Flynn · Adam Czajka
人間の脳からの潜在拡散モデルによる高解像度画像再構成アクティビティ
高木 優 西本 真司
RI前者: ビジョン バックボーンを効果的に保つが、トークン ミキサーを削除する
Jiahao Wang Songyang Zhang Yong Liu Taiqiang Wu Yujiu Yang Xihui Liu Kai Chen Ping Luo Dahua Lin
Castling-ViT: 線形角​​度の注意への切り替えによる自己注意の圧縮ビジョントランスフォーマー推論中
Haoran You Yunyang Xiong Xiaoliang Dai Peizhao Zhang Bichen Wu Haoqi Fan Peter Vajda Yingyan Lin
EfficientViT: カスケード グループ アテンションを備えたメモリ効率の高いビジョン トランスフォーマー
Xinyu Liu Houwen Peng Ningxin Zheng Yuqing Yang Han Hu · Yixuan Yuan
InterImage: 変形可能な大規模ビジョン基本モデルの探索畳み込み
文海 王吉峰 戴哲 陳振航 黄志斉 李西州 朱暁偉 胡同 魯偉偉 ルー・ホンシェン 李暁剛 王友喬 メモリに優しい スケーラブルな超解像
宝くじの巻き戻しによる 仮説
林晋・羅暁通・ミン・ホン・屈燕雲・袁Xie · Zongze Wu は、
混合トランスフォーマーと CNN アーキテクチャを使用して画像圧縮を学習しました
Jinming Liu · Heming Sun · Jiro Katto
NIRVANA: Neural Implicit Representations of Videos with Adaptive Networks and Autoregressive Patch-wise Modeling
Shishira Maiya · Sharath Girish · Max Ehrlich · Hanyu Wang · Kwot Sin Lee · Patrick Poirson · Pengxiang Wu · Chen Wang · Abhinav Shrivastava
Complexity-guided Slimmable Decoder for Efficient Deep Video Compression
Zhihao Hu · Dong Xu
Context-Based Trit-Plane Coding for Progressive Image Compression
Seungmin Jeon · KWANG PYO CHOI · YOUNGO PARK · Chang-Su Kim
End-to-end Video Matting with Trimap Propagation
Wei-Lun Huang · Ming-Sui Lee
Rethinking Image Super Resolution from Long-Tailed Distribution Learning Perspective
Yuanbiao Gou · Peng Hu · Jiancheng Lv · Hongyuan Zhu · Xi Peng
Shape-aware Text-driven Layered Video Editing
Yao-Chih Lee · Ji-Ze Jang · Yi-Ting Chen · Elizabeth Qiu · Jia-Bin Huang
Dimensionality-Varying Diffusion Process
Han Zhang · Ruili Feng · Zhantao Yang · Lianghua Huang · Yu Liu · Yifei Zhang · Yujun Shen · Deli Zhao · Jingren Zhou · Fan Cheng
On Distillation of Guided Diffusion Models
Chenlin Meng · Robin Rombach · Ruiqi Gao · Diederik Kingma · Stefano Ermon · Jonathan Ho · Tim Salimans
Towards Flexible Multi-modal Document Models
Naoto Inoue · Kotaro Kikuchi · Edgar Simo-Serra · Mayu Otani · Kota Yamaguchi
Toward verifiable and reproducible human evaluation for text-to-image generation
Mayu Otani · Riku Togashi · Yu Sawai · Ryosuke Ishigami · Yuta Nakashima · Esa Rahtu · Janne Heikkila · Shin’ichi Satoh
Specialist Diffusion: Plug-and-Play Sample-Efficient Fine-Tuning of Text-to-Image Diffusion Models to Learn Any Unseen Style
Haoming Lu · Hazarapet Tunanyan · Kai Wang · Shant Navasardyan · Zhangyang Wang · Humphrey Shi
Freestyle Layout-to-Image Synthesis
Han Xue · Zhiwu Huang · Qianru Sun · Li Song · Wenjun Zhang
ReCo: Region-Controlled Text-to-Image Generation
Zhengyuan Yang · Jianfeng Wang · Zhe Gan · Linjie Li · Kevin Lin · Chenfei Wu · Nan Duan · Zicheng Liu · Ce Liu · Michael Zeng · Lijuan Wang
Conditional Text Image Generation with Diffusion Models
Yuanzhi Zhu Zhaohai Li Tianwei Wang Mengchao He Cong Yao
Fix the Noise: 制御可能なドメイン翻訳のためのソース機能のもつれを解く
Donyeun Lee Jae Young Lee Doyeon Kim Jaehyun Choi Jaejun Yu Junmo Kim
GALIP: テキストから画像への合成のための生成敵対的クリップ
Ming Tao · Bing - Kun BAO · Hao Tang · Changsheng Xu
DATID-3D: 3D 生成モデルのテキストから画像への拡散を使用した多様性維持ドメイン適応
Gwanghyun Kim · Se Young Chun
NÜWA-LIP: 欠陥のない VQGAN
Minhengを使用した言語ガイド付き画像修復Ni Xiaoming Li Wangmeng Zuo
カラースタイル転送用ニューラルプリセット
Zhanghan Ke Yuhao LIU Lei Zhu Nanxuan Zhao Rinson Lau
Restoration of Hand-Drawn Architecture Drawing using Latent Space Mapping with Degradation Generator
Nakkwan Choi Seungjae Lee Yongsik Lee Seungjoon Yang
Neural Fourier Filter Bank
Zhijie Wu Yuhe Jin Kwang Moo Yi
PyramidFlow: ピラミッド正規化フローを使用した高解像度欠陥コントラスト位置特定
Jiarui Lei · Xiaobo Hu · Yue Wang · Dong Liu
PHA: トランスベースの人物再識別のためのパッチワイズ高周波増強
Guiwei Zhang · Yongfei Zhang · Tianyu Zhang · Bo Li · Shiliang Pu 包括的
かつ繊細: 画像復元のための効率的なトランスフォーマー
Haiyu Zhao · Yuanbiao Gou · Boyun Li · Dezhong Peng · Jiancheng Lv · Xi Peng
時空間分散による超高解像度画像/ビデオ マッティング
ヤナン SUN Chi-Keung Tang Yu-Wing Tai
モバイル画像のための等価変換とデュアルストリームネットワーク構築 超解像度
Jiahao Chao Zhou Zhou Honfan Gao Jiali Gong Zhengfeng Yang · Zhenbing Zeng · Lydia Dehbi
レート歪み最適化によるリアルタイム 6K 画像リスケーリング
Chenyang Qi · XIN YANG · Ka Leong Cheng · Ying-Cong Chen · Qifeng Chen
リアルな画像のための人間誘導グラウンドトゥルース生成
Du Chen · Jie Liang Xindong Zhang Ming Liu Hui Zeng Lei Zhang
視覚言語対応によるブラインド画像品質評価: マルチタスク学習の視点
Weixia Zhang · Guangtao Zhai · Ying Wei · Xiaokang Yang · Kede Ma 固有
セマンティクス回復による複数劣化に対する視覚認識駆動型画像復元
Zizheng Yang · Jie Huang · Jiahao Chang · man zhou · Hu Yu · Jinghao Zhang · Feng Zhao
ShadowDiffusion : いつシャドウ除去のための劣化プリアと拡散モデルの融合
Lanqing Guo Chong Wang Wenhan Yang Siyu Huang Yufei Wang Hanspeter Pfister Bihan Wen
パンシャープニングのための確率ベースのグローバル クロスモーダル アップサンプリング
Zeyu Zhu Xiangyong Cao man zhou Junha o Huang Deyu Meng
リアルタイム制御可能なノイズ除去画像およびビデオ用
趙陽 張一通 江文斉 邵小剛 王平 羅開毛 林錦偉古
Zero-Shot Noise2Noise: Efficient Image Denoising without any Data
Youssef Mansour · Reinhard Heckel
Rawgment: Noise-Accounted RAW Augmentation Enables Recognition in a Wide Variety of Environments
Masakazu Yoshimura · Junji Otsuka · Atsushi Irie · Takeshi Ohashi
Structure Aggregation for Cross-Spectral Stereo Image Guided Denoising
Zehua Sheng · Zhu Yu · Xiongwei Liu · Siyuan Cao · Yuqi Liu · Hui-liang Shen · Huaqi Zhang
Self-supervised Blind Motion Deblurring with Deep Expectation Maximization
Ji Li · Weixi Wang · YUESONG NAN · Hui Ji
Joint HDR Denoising and Fusion: A Real-World Mobile HDR Image Dataset
Shuaizheng Liu · Xindong Zhang · Lingchen Sun · Zhetong Liang · Hui Zeng · Lei Zhang
MetaFusion: 物体検出からのメタ特徴埋め込みによる赤外線画像と可視画像
の融合 Wenda Zhao Shieng Xie Fan Zhao You He Huchuan Lu
FeatER: An Efficient Network for Human Reconstruction via feature Map-Based TransformER
Ce Zheng Matias Mendieta Taojiannan Yang Guo-Jun Qi Chen Chen
Joint 未知の露光時間でのビデオ マルチフレーム補間とブレ補正
Wei Shang Dongwei Ren yi yang Honzhi Zhang Kede Ma Wangmeng Zuo
学習イベント ガイド付きハイ ダイナミック レンジ ビデオ再構築
Yixin Y ang Jin Han Jinxiu Liang Zhihang Zhong Boxin Shi
モーション拡大のためのマルチドメイン学習
JASDEEP SINGH スブラマニャム ムララ G サンカラ コスル
EvShutter: 制約のないローリング シャッター補正のためのイベントの変換
Julius Erbach、Stepan Tulyakov、Patricia Vitoria、Alfredo Bochicchio、YUANYOU LI
キーフレームベースのモーション補間のための暗黙的モーション多様体を使用した連続中間トークン学習
Clinton Mo、Kun Hu、Chengjiang Long、Zhiyong Wang
リカレント ビジョン トランスフォーマーイベント カメラによる物体検出用
Mathias Gehrig · Davide Scaramuzza
MoDi: 多様なデータからの無条件モーション合成
Sigal Raab · Inbal Leibovitch · Peizhuo Li · Kfir Aberman · Olga Sorkine-Hornung · Daniel Cohen-Or
Skinned Motion Retargeting with Residual Perception of Motion Semantics &ジオメトリ
Jiaxu Zhang · Junwu Weng · Di Kang · Fang Zhao · Shaoli Huang · Xuefei Zhe · Linchao Bao · Ying Shan · Jue Wang · Zhigang Tu
Real-time Multi-person Eyeblink Detection in the Wild for Untrimmed Video
Wenzheng Zeng · Yang Xiao · Sicheng Wei · Jinfang Gan · Xintao Zhang · Zhiguo Cao · Zhiwen Fang · Joey Zhou
SelfME: Self-Supervised Motion Learning for Micro-Expression Recognition
Xinqi Fan · Xueli CHEN · Mingjie Jiang · Ali Shahid · Hong Yan
An In-depth Exploration of Person Re-identification and Gait Recognition in Cloth-Changing Conditions
Weijia Li · Saihui Hou · Chunjie Zhang · Chunshui Cao · Xu Liu · Yongzhen Huang · Yao Zhao
Simple Cues Lead to a Strong Multi-Object Tracker
Jenny Seidenschwarz · Guillem Braso · Víctor Castro Serrano · Ismail Elezi · Laura Leal-Taixé
野生のコンテナと遮蔽物を追跡する
Basile Van Hoorick · Pavel Tokmakov · Simon Stent · Jie Li · Carl Vondrick
水中シーンでの識別できない物体の数
Guolei Sun · Zhaochong An · Yun Liu · Ce Liu · Christos Sagaridis · Deng-Ping Fan · Luc Van Gool
ロボット工学の多用途表現としてのヒューマン ビデオからのアフォーダンス
Shikhar Bahl · Russell Mendonca · Lili Chen · Unnat Jain · Deepak Pathak ギャラクティック
: スケーリング エンドツー1 秒あたり 100k ステップで再配置のための強化学習を終了
Vincent-Pierre Berges、Andrew Szot、Devendra Singh Chaplot、Aaron Gokaslan、Roozbeh Mottaghi、Dhruv Batra、Eric Undersander
トレース アンド ペース: 誘導軌道拡散による制御可能な歩行者アニメーション
Davis Rempe、Zhengyi Luo、Xue Bin Peng、Ye Yuan、Kris Kiyon、Karsten Kreis、Sanja Fidler、Or Litany FJMP
: 学習された有向非巡回相互作用グラフ上の因数分解された共同マルチエージェント モーション予測
Luke Rowe、Martin Ethier、Eli-Henry Dykhne、Krzysztof Czarnecki
目標を意識した表現学習と適応型ホライズン予測によるオープンワールド マルチタスク制御
Shaofei Cai、Zihao Wang、Xiaojian Ma、Anji Liu、Yitao Liang
ReasonNet: エンドツー時間的およびグローバルな推論で運転に終止符を打つ
ハオ・シャオ、レティアン・ワン、ルオビン・チェン、スティーブン・ヴァスランダー、ホンシェン・リー、ユー・リウ
V2V4Real: 車車間の協調認識のための大規模な実世界データセット
Runsheng Xu Xin Xia JINLONG LI Hanzhao Li Shuo Zhang Zhengzhong Tu Zonglin Meng Hao Xiang Xiaoyu Dong Rui Song Honkai Yu · Bolei Zhou · Jiaqi Ma ベイズ事後
近似確率的アンサンブル
Oleksandr Balabanov、Bernhard Mehlig、Hampus Linander
DistractFlow: Improving Optical Flow Estimation via Realistic Distractions and Pseudo-Labeling
Jisoo Jeong、Hong Cai、Risheek Garrepalli Fatih Porikli
スライスされた最適な部分輸送
Yikun Bai、Bernhard Schmitter、Matthew Thorpe、Soheil Kolouri
空間適応型自己相似性による教師なしディープ非対称ステレオ マッチング
Taeyong Song Sunok Kim Kwanghoon Sohn
RGB 赤外線グループ再識別のための類似度メトリック学習
Jianghao Xiong Jianhuang Lai
変形形状解析のための一般化可能な局所特徴の事前トレーニング
SOUHAIB ATTAIKI Lei Li Maks Ovsjanikov
Quantum Multi-Model Fitting
Matteo Farina · Luca Magri · Willi Menapace · Elisa Ricci · Vladislav Golyanik · Federica Arrigoni
ブリッジング検索領域の RGB-T 追跡用テンプレートとの相互作用
Tianrui Hui · Zizheng Xun · Fengguang Peng · Junshi Huang · Xiaoming Wei · Xiaolin Wei · Jiao Dai · Jizhong Han · Si Liu ローカル接続
ベース顔クラスタリングの密度推定
Junho Shin · Hyo-Jun Lee · Hyunsoop Kim · Jong-Hyeon Baek · Daehyun Kim · Yeong Jun Koh
部分点群登録のための教師なし深層確率的アプローチ
Guofeng Mei · Hao Tang · Xiaoshui Huang · Weijie Wang · Juan Liu · Jian Zhang · Luc Van Gool Qiang Wu
NerVE: 点群からのパラメトリック曲線抽出のためのニューラル ボリューム エッジ
Xiangyu Zhu Dong Du Weikai Chen Zhiyou Zhao yingyu Nie Xiaoguang Han
SHS-Net: Learning Signed Hyper Surfaces for Oriented Normal Estimation of Point Clouds
Qing Li · Huifang Feng · Kanle Shi · Yue Gao · Yi Fang · Yushen Liu · Zhizhong Han
Anchor旧: 識別ノードからの点群の完成
ZHIKAI CHEN · Fuchen Long · Zhaofan Qiu · Ting Yao · Wengang Zhou · Jiebo Luo · Tao Mei
GeoMAE: Masked Geometric Target Prediction for Self-supervised Point Cloud Pre-Training
Xiaoyu Tian · Haoxi Ran · Yue Wang · Hang Zhao
Symmetric Shape-Preserving Autoencoder for Unsupervised Real Scene Point Cloud Completion
Changfeng Ma · Yinuo Chen · Pengxiao Guo · Jie Guo · Chongjun Wang · Yanwen Guo
ISBNet: a 3D Point Cloud Instance Segmentation Network with Instance-aware Sampling and Box-aware Dynamic Convolution
Tuan Ngo · Binh-Son Hua · Khoi Nguyen
itKD: Interchange Transfer-based Knowledge Distillation for 3D Object Detection
Hyeon Cho · Junyong Choi · Geonwoo Baek · Wonjun Hwang
DSVT: 回転セットを使用した動的スパース ボクセル トランスフォーマー
Haiyang Wang · Chen Shi · Shaoshuai Shi · Meng Lei · Sen Wang · Di He · Bernt Schiele · Liwei Wang
WeatherStream: 単一画像ディウェザリングの光輸送自動化
Howard Zhang · Yunhao Ba · Ethan Yang · Varan Mehra、Blake Gella、Akira Kawasaki、Arnold Pfahnl、Chethan Chinder Chandraappa、Alex Wong、Achuta Kadambi
LargeKernel3D: 3D スパース CNN でのカーネルのスケールアップ
Yukan Chen、Jianhui Liu、Xiangyu Zhang、XIAOJUAN QI、Jiaya Jia
PVT -SSD:ポイントボクセル変換器を備えたシングルステージ 3D 物体検出器
Honhui Yang Wenxiao Wang Minghao Chen Binbin Lin Tong He Hua Chen Xiaofei He Wanli Ouyang
LiDAR 強度による教師なし固有画像分解
Shogo Sato · Yasuhiro Yao · Taiga Yoshida · Takuhiro Kaneko · Shingo Ando · Jun Shimamura
ALSO: Automotive Lidar Self-supervision by Occupancy estimation
Alexandre Boulch · Corentin Sautier · Björn Michele · Gilles Puy · Renaud Marlet
MV-JAR: Masked Voxel Jigsaw and Reconstruction for LiDAR-Based Self-Supervised Pre-Training
Runsen Xu · Tai Wang · Wenwei Zhang · Runjian Chen · Jinkun Cao · Jiangmiao Pang · Dahua Lin
Adaptive Sparse Convolutional Networks with Global Context Enhancement for Faster Object Detection on Drone Images
bowei du · Yecheng Huang · JX Chen · Di Huang
Center Focusing Network for Real-Time LiDAR Panoptic Segmentation
Xiaoyan Li · Gang Zhang · Boyue Wang · Yongli Hu · Baocai Yin
Learning and Aggregating Lane Graphs for Urban Automated Driving
Martin Büchner · Jannik Zürn · Ion-George Todoran · Abhinav Valada · Wolfram Burgard
LiDAR-in-the-loop Hyperparameter Optimization
Félix Antoine Goudreault · Dominik Scheuble · Mario Bijelic · Nicolas Robidoux · Felix Heide
Bi-directional LiDAR-Radar Fusion for 3D Dynamic Object Detection
颖杰 王 · Jiajun Deng · Yao Li · Jinshui Hu · Cong Liu · Yu Zhang · Jianmin Ji · Wanli Ouyang · Yanyong Zhang
Toward RAW Object Detection: A New Benchmark and A New Model
Ruikang Xu · Chang Chen · Jingyang Peng · Cheng Li · Yibin Huang · Fenglong Song · Youliang Yan · Zhiwei Xiong
Resource-Efficient RGBD Aerial Tracking
Jinyu Yang · Shang Gao · Zhe Li · Feng Zheng · Ales Leonardis
効率的な物体検出のための 2 平面透視法を学習した事前ベースの画像リサンプリング
Anurag Ghosh · Dinesh Reddy Nagapureddy · Christoph Mertz · Srinivasa Narasimhan
位相シフト コーダ: 配向された物体における正確な配向の予測検出
Yi Yu · Feipeng Da
PaCa-ViT: ビジョン トランスフォーマーにおけるパッチ対クラスター アテンションの学習
Ryan Grainger · Thomas Paniagua · Xi Song · Naresh Cuntoor · MUN WAI LEE · Tianfu Wu ヘシアンを意識した
顕著性によるグローバル ビジョン トランスフォーマー プルーニング
Huanrui Yang ·ホンシュ・イン、メイイング・シェン、パブロ・モルチャノフ、ハイ・リー、ヤン・カウツ
Lite-Mono: A Lightweight CNN and Transformer Architecture for Self-Supervised Monocular Depth Estimation
Ning Zhang · Francesco Nex · George Vosselman · Norman Kerle
CompletionFormer: Depth Completion with Convolutions and Vision Transformers
Youmin Zhang · Xianda Guo · Matteo Poggi · Zheng Zhu · Guan Huang · Stefano Mattoccia
TINC: Tree-structured Implicit Neural Compression
Runzhao Yang
WIRE: Wavelet Implicit Neural Representations
Vishwanath Saragadam · Daniel LeJeune · Jasper Tan · Guha Balakrishnan · Ashok Veeraraghavan · Richard Baraniuk
Video Compression with Entropy-Constrained Neural Representations
Carlos Gomes · Roberto Azevedo · Christopher Schroers
MMVC: ブロックベースの予測モード選択と密度適応型エントロピー コーディングによる学習型マルチモード ビデオ圧縮
Bowen Liu、Yu Chen、Rakesh Chowdary Machineni、Shiyu Liu、Hun-Seok Kim
EfficientSCI: 大規模向け時空因数分解を使用した高密度接続ネットワーク-スケールビデオスナップショット圧縮イメージング
lishun wang / Miao Cao / Xin Yuan
トークン化画像合成のための正則化ベクトル量子化
Jiahui Zhang / Fangneng Zhan / Christian Thebalt / Shijian Lu
投影された潜在空間におけるビデオの確率的拡散モデル
Sihyun Yu / Kihyuk Sohn / Subin Kim / Jinwoo Shin
潜在フロー拡散モデルによる条件付き画像からビデオへの生成
Haomiao Ni、Changhao Shi、Kai Li、Sharon Huang、Martin Min
Class-Balancing Diffusion Models
Yiming QIN · Huangjie Zheng · Jiangchao Yao · Mingyuan Zhou · Ya Zhang
HOLODIFFUSION: Training a 3D Diffusion Model using 2D Images
Animesh Karnewar · Andrea Vedaldi · David Novotny · Niloy Mitra
Self-Guided Diffusion Models
Tao Hu · David Zhang · Yuki Asano · Gertjan Burghouts · Cees Snoek
LayoutFormer++: Conditional Graphic Layout Generation via Constraint Serialization and Decoding Space Restriction
Zhaoyun Jiang · Jiaqi Guo · Shizhao Sun · Huayu Deng · Zhongkai Wu · Vuksan Mijovic · Zijiang Yang · Jian-Guang Lou · Dongmei Zhang
InstructPix2Pix: Learning to Follow Image Editing Instructions
Tim Brooks · Aleksander Holynski · Alexei A. Efros
SpaText: 制御可能な画像生成のための空間テキスト表現 オムリ アブラハミ · トーマス ヘイズ. 例によるペイント
:
制御可能な画像生成のための空間テキスト表現
オムリ アブラハミ · トーマス ヘイズ · オラン ガフニ · ソナル グプタ · ヤニフ タイグマン · デヴィ パリク · ダニ リシンスキー · オハドFried · Xi ying
画像エディターと EditBench: テキストガイドによる画像絵画の進歩と評価
Su Wang · Chitwan Saharia · Ceslee Montgomery · Jordi Pont-Tuset · Shai Noy · Stefano Pellegrini · 尾上泰正 · Sarah Laszlo · David Fleet · Radu Soricut · Jason Baldridge · Mohammad Norouzi · Peter Anderson · William Chan
LayoutDM: レイアウト生成のためのトランスフォーマーベースの拡散モデル
Shang Chai · Liansheng Zhuang · Fengying Yan
CLIP-Sculptor: Zero-Shot Generation of High-Fidelity and Diverse Shapes from Natural Language
Aditya Sanghi · Rao Fu · Vivian Liu · Karl Willis · Hooman Shayani · Amir Khasahmadi · Srinath Sridhar · Daniel Ritchie
Master: Meta Style Transformer for Controllable Zero-Shot and Few-Shot Artistic Style Transfer
Hao Tang · Songhua Liu · Tianwei Lin · Shaoli Huang · Fu Li · Dongliang He · Xinchao Wang
DeepVecFont-v2: Exploiting Transformers to Synthesize Vector Fonts with Higher Quality
Yuqing Wang · Yizhi Wang · Longhui Yu · Yuesheng Zhu · Zhouhui Lian
ObjectStitch: Object Compositing with Diffusion Model
Yizhi Song · Zhifei Zhang · Zhe Lin · Scott Cohen · Brian Price · Jianming Zhang · Soo Ye Kim · Daniel Aliaga
CAP-VSTNet: Content Affinity Preserved Versatile Style Transfer
Linfeng Wen · Chengying Gao · Changqing Zou
LEMaRT: ラベル効率的なマスク領域変換画像調和用
Sheng Liu · Cong Phuoc Huynh · Cong Chen · Maxim Arap · Raffay Hamid 画像
復元のための画像階層の効率的かつ明示的なモデリング
Yawei Li · Yuchen Fan · Xiaoyu Xiang · Denis Demandolx · Rakesh Ranjan · Radu Timofte · Luc Van Gool
GamutMLP : 色損失回復のための軽量 MLP
Hoang Le、Brian Price、Scott Cohen、Michael Brown
任意スケールの超解像度のためのカスケード ローカル暗黙的トランスフォーマー
ハオ・ウェイ・チェン・ユー・シュアン・シュー・ミンフォン・ホン・イーミン・ツァイ・シェンカイ・クオ・チュンイー・リー 超解像ニューラル・
オペレーター
ミン・ウェイ・シュエソン・チャン
深部異方性拡散による誘導深度超解像
ナンド・メッツガー、ロドリゴ・ダウト、コンラッド・シンドラー
AutoFocusFormer: グリッドからの画像セグメンテーション
Ziwen Chen · Kaushik Patnaik · Shuangfei Zhai · Alvin Wan · Zhile Ren · Alexander Schwing · R Colburn · Li Fuxin AccelIR
: 神経回復を加速するためのタスク認識画像圧縮
J uncheol Ye · Hyunho Yeo Jinwoo Park Dongsu学習されたコンパクトメタデータを使用したHan
Raw 画像再構成
Yufei Wang Yi Yu Wenhan Yang Lanqing Guo Lap-Pui Chau Alex Kot Bihan Wen
効率的なブラインド画像分解のためのコンテキスト認識型事前トレーニング
Chao Wang、Zhedong Zheng、Ruijie Quan、Yifan Sun、Yi Yang
ディープランダムプロジェクター:
Taihui Li、Hengkang Wang、Zhong Zhuang、Ju Sun によるディープ画像の高速化
画像超解像のためのスペクトルベイジアン不確実性アクション
Tao Liu Jun Cheng Shan Tan
Reliable Bank を介した水中画像復元のための対照的半教師あり学習
Shirui Huang Keyan Wang Huan Liu Jun Chen Yunsong Li
Retinex ベースの低照度画像強化では追加の事前学習や正則化は必要ありません
Huiyuan Fu · Wenkai Zheng · Xiangyu Meng · Xin Wang · Chuanming Wang · Huadong Ma
画像露出補正のための分離と集約
Yang Wang · Long Peng · Liang Li · Yang Cao · Zheng-Jun Zha
Self-supervised Non-uniform Kernel Estimation with Flow-based Motion Prior for Blind Image Deblurring
Zhenxuan Fang · Fangfang Wu · Weisheng Dong · Xin Li · Jinjian Wu · Guangming Shi
Neural Texture Synthesis with Guided Correspondence
Yang Zhou · Kaijian Chen · rongjun xiao · Hui Huang
GradICON: Approximate Diffeomorphisms via Gradient Inverse Consistency
Lin Tian · Thomas Greer · François-Xavier Vialard · Roland Kwitt · Raul San Jose Estepar · Richard Rushmore · Nikolaos Makris · Sylvain Bouix · Marc Niethammer
TransFlow: Transformer as Flow Learner
Yawen Lu · Qifan Wang · Siqi Ma · Tong Geng · Yingjie Victor Chen · Huaijin Chen · Dongfang Liu
物理的な事前の物理的な事前調整を使用したマルチレンジ時間的アライメント ネットワークによるビデオかすみ除去
Jiaqi Xu、Xiaowei Hu、Lei Zhu、DOU QI、Jifeng Dai、Yu Qiao、Pheng-Ann Heng イベントベースの
フレーム補間とアドホックぼけ除去
Lei Sun、Christos Sagaridis · Jingyun Liang · Peng Sun · Jiezhang Cao · Kai Zhang · Qi Jiang · Kaiwei Wang · Luc Van Gool クロスモーダル非対称双方向モーション フィールドによるイベント
ベースのビデオ フレーム補間
Taewoo Kim · Yujeong Chae · Hyun-Kurl Jang · Kuk-Jin YOON
イベントから電気ネットワークの周波数を「見る」
Lexuan Xu Guang Hua Haijian Zhang Lei Yu Ning Qiao
潜在空間でのモーション拡散によるコマンドの実行
Xin Chen · Biao Jiang · Wen Liu · Zilong Huang · BIN FU · Tao Chen · Gang Yu
Event-guided Person Re-Identification via Sparse-Dense Complementary Learning
Chengzhi Cao · Xueyang Fu · Hongjian Liu · Yukun Huang · Kunyu Wang · Jiebo Luo · Zheng-Jun Zha
Progressive Disentangled Representation Learning for Fine-Grained Controllable Talking Head Synthesis
Duomin Wang · Yu Deng · Zixin Yin · Heung-Yeung Shum · Baoyuan Wang
One-Shot High-Fidelity Talking-Head Synthesis with Deformable Neural Radiance Field
Weichuang Li · Longhao Zhang · Dong Wang · Bin Zhao · Zhigang Wang · Mulin Chen · Bang Zhang · Zhongjian Wang · Liefeng Bo · Xuelong Li
Rethinking the Learning Paradigm for Dynamic Facial Expression Recognition
Hanyang Wang · Bo Li · Shuang Wu · Siyuan Shen · Feng Liu · Shouhong Ding · Aimin Zhou
Multi-modal Gait Recognition via Effective Spatial-Temporal Feature Fusion
Yufeng Cui · Yimei Kang
MotionTrack: Learning Robust Short-term and Long-term Motions for Multi-Object Tracking
Zheng Qin · Sanping Zhou · Le Wang · Jinghai Duan · Gang Hua · Wei Tang
Standing Between Past and Future: Spatio-Temporal Modeling for Multi-Camera 3D Multi-Object Tracking
Ziqi Pang · Jie Li · Pavel Tokmakov · Dian Chen · Sergey Zagoruyko · Yu-Xiong Wang
Camouflaged Instance Segmentation via Explicit De-camouflaging
Naisong Luo · Yuwen Pan · Rui Sun · Tianzhu Zhang · Zhiwei Xiong · Feng Wu
NeRF in the Palm of Your Hand: Corrective Robot Augmentation via Novel-View Synthesis
Allan Zhou · Moo J Kim · Lirui Wang · Pete Florence · Chelsea Finn
PIRLNav: Pretraining with Imitation and RL Finetuning for ObjectNav
Ram Ramrakhya · Dhruv Batra · Erik Wijmans · Abhishek Das
AdamsFormer for Spatial Action Localization in the Future
Hyung-gun Chi · Kwonjoon Lee · Nakul Agarwal · Yi Xu · Karthik Ramani · Chiho Choi
Unsupervised Sampling Promoting for Stochastic Human Trajectory Prediction
Guangyi Chen · Zhenhao Chen · Shunxing Fan · Kun Zhang
Query-Centric Trajectory Prediction
Zikang Zhou · Jianping Wang · Yung-Hui Li · Yu-Kai Huang
Planning-oriented Autonomous Driving
yihan hu Jiazhi Yang Li Chen Keyu Li Chonghao Sima Xizhou Zhu Siqi Chai Senyao Du Tianwei Lin Wenhai Wang Lewei Lu Xiaosong Jia Qiang Liu Jifeng Dai Yu Qiao Honyang Li UniHCP: 人間中心の認識のための統一モデル Yuanzheng Ci · Yizhou Wang · Meil
​​in
Chen · SHIXIANG TANG · LEI BAI · Feng Zhu · Rui Zhao · Fengwei Yu · Donglian Qi · Wanli Ouyang You Only Segment Once: リアルタイム パノプティック セグメンテーションに向けて Jie Hu · Linyan
Huang
Tianhe Ren shengchuan zhang Rongrong Ji Liujuan Cao
IRLS の収束について外れ値ロバスト推定におけるその変形とその変形
Liangzu Peng Christian Kummerle Rene Vidal
画像領域からの適応型密集イベント ステレオ学習
Hoonhee Cho · Jegyeong Cho · Kuk-Jin YOON
Correspondence Transformers with Asymmetric Feature Learning and Matching Flow Super-Resolution
Yixuan Sun · Dongyang Zhao · Zhangyue Yin · Yiwen Huang · Tao Gui · Wenqiang Zhang · Weifeng Ge
DKM: Dense Kernelized Feature Matching for Geometry Estimation
Johan Edstedt · Ioannis Athanasiadis · Mårten Wadenbäck · Michael Felsberg
3D Registration with Maximal Cliques
Xiyu Zhang · Jiaqi Yang · Shikun Zhang · Yanning Zhang
Self-Supervised Learning for Multimodal Non-Rigid 3D Shape Matching
Dongliang Cao · Florian Bernard
Towards Better Gradient Consistency for Neural Signed Distance Functions via Level Set Alignment
Baorui Ma · Junsheng Zhou · Yushen Liu · Zhizhong Han
事前学習を行わない単一の疎な点群からの符号付き距離関数の教師なし推論
Chao Chen Yushen Liu Zhizhong Han
PEAL: 低重複点群登録のための事前埋め込み明示的注意学習
Junle Yu Luwei Ren Yu Zhang Wenhui Zhou Lili Lin Guojun Dai
PointListNet: Deep 3D 点リストで学ぶ
Hehe Fan Linchao Zhu Yi Yang Mohan Kankanhalli
点群解析用メタ アーキテクチャ
Haojia Lin Xiawu Zheng lijiang Li Fei Chao Shanshan Wang Yan Wang Yonghong Tian Rongrong Ji
Learnable Skeleton-Aware 3D Point Cloud Sampling
Cheng Wen Baosheng Yu Dacheng Tao
Complete-to-Partial 4D Distillation for Self-Supervised Point Cloud Sequence Representation Learning
Zhuoyang Zhang · Yuhao Dong · Yunze Liu · Li Yi
ViewNet: A Novel Projection-Based Backbone with View Pooling for Few-shot Point Cloud Classification
Jiajing Chen · Minmin Yang · Senem Velipasalar
SCPNet: Semantic Scene Completion on Point Cloud
Zhaoyang Xia · Youquan Liu · Xin Li · Xinge ZHU · Yuexin Ma · Yikang LI · Yuenan Hou · Yu Qiao
SCoDA: Domain Adaptive Shape Completion for Real Scans
Yushuang Wu · Zizheng Yan · Ce Chen · Lai Wei · Xiao Li · Guanbin Li · Yihao Li · Shuguang Cui · Xiaoguang Han
GrowSP: Unsupervised Semantic Segmentation of 3D Point Clouds
zihui zhang · Bo Yang · Bing WANG · Bo Li
MethaneMapper: メタン検出用のスペクトル吸収を認識したハイパースペクトル トランスフォーマー
Satish Kumar Ivan Arevalo ASM Iftekhar BS Manjunath
自動運転のための弱教師付きクラス非依存運動予測
Ruibo Li Hanyu Shi Ziang Fu Zhe Wang Guosheng Lin
LiDAR セマンティック セグメンテーションの単一ドメイン一般化
Hyeonseong Kim Yuonsu Kang ChangギュンOh Kuk-Jin YOON
PeakConv: レーダーセマンティックセグメンテーションのピーク受容野の学習
Liwen Zhang Xinyan Zhang Youcheng Zhang Yufei Guo Yuanpei Chen Xuhui Huang Zhe Ma
PillarNeXt : LiDAR 点群における 3D オブジェクト検出のためのネットワーク設計の再考
Jinyu Li · Chenxu Luo · Xiaodong Yang
3D 物体検出における密度に依存しない教師なしドメイン適応
Qianjiang Hu、Daizong Liu、Wei Hu
LiDAR ベースの 3D 認識用球形トランスフォーマー
Xin Lai、Yukang Chen、Fanbin Lu、Jianhui Liu、Jiaya Jia
自動運転用ニューラル マップ
Xuan Xiong Yicheng Liu · Tianyuan Yuan · Yue Wang · Yilun Wang · Hang Zhao
LoGoNet: ローカルからグローバルへのクロスモーダル融合による正確な 3D オブジェクト検出に向けて
Xin Li · Tao MA · Yuenan Hou · Botian Shi · Yuchen Yang · Youquan Liu · Xingjiao Wu · Qin Chen · Yikang LI · Yu Qiao · Liang He
Pix2map: 画像から街路地図を推測するためのクロスモーダル検索
Xindi Wu · Kwun Fung Lau · Francesco Ferroni · Aljosa Osep · Deva Ramanan
Azimuth Super-Resolution for FMCW Radar in Autonomous Driving
Yu-Jhe Li · Shawn Hunt · Jinhyung Park · Matthew O’Toole · Kris Kitani
MonoATT: Online Monocular 3D Object Detection with Adaptive Token Transformer
Yunsong Zhou · Hongzi Zhu · Quan Liu · Shan Chang · Minyi Guo
Weakly Supervised Monocular 3D Object Detection using Multi-View Projection and Direction Consistency
Runzhou Tao · Wencheng Han · Zhongying Qiu · Cheng-zhong Xu · Jianbing Shen
Semi-Supervised Stereo-based 3D Object Detection via Cross-View Consensus
Wenhao Wu · Hau-San Wong · Si Wu
BEV-SAN: Accurate BEV 3D Object Detection via Slice Attention Networks
Xiaowei Chi · Jiaming Liu · Ming Lu · Rongyu Zhang · Zhaoqing Wang · Yandong Guo · Shanghang Zhang
Anchor3DLane: Learning to Regress 3D Anchors for Monocular 3D Lane Detection
Shaofei Huang · Zhenwei Shen · Zehao Huang · Zi-han Ding · Jiao Dai · Jizhong Han · Naiyan Wang · Si Liu
Learning Transformations To Reduce the Geometric Shift in Object Detection
Vidit Vidit · Martin Engilberge · Mathieu Salzmann
Look, Radiate, and Learn: Self-Supervised Localisation via Radio-Visual Correspondence
Mo Alloulah · Maximilian Arnold
Non-line-of-sight Imaging with Signal Superresolution Network
Jianyu Wang · Xintong Liu · Leping Xiao · Zuoqiang Shi · Lingyun Qiu · Xing Fu
ESLAM: Efficient Dense SLAM System Based on Hybrid Representation of Signed Distance Fields
Seyed Mohammad Mahdi Johari · Camilla Carta · François Fleuret
OmniCity: マルチレベルおよびマルチビュー画像による全能の都市理解
Weijia Li Yawen Lai Linning Xu Yuanbo Xiangli Yu Jinhua Conghui He Gui-Song Xia Dahua Lin
Semantic Ray: Learning a Generalizable Semantic Field with Cross-Reprojection Attendant
Fangfu Liu Chubin Zhang Yu Zheng Yueqi Duan
マルチビュー ステレオ表現の改訂: 地域を意識した MVSNet
Yisu Zhang Jianke Zhu Lixiang Lin
イベント フォーカル スタックからのオールインフォーカス イメージング
Hanyue Lou Minggui Teng Yixin Yang · Boxin Shi
コンテンツアウェアなコンフォーマル マッピングによる広角補正
Qi Zhang・Hongdong Li・Qing Wang
単一画像深度予測の改善: 多変量ガウスの取得
Ce Liu · Suryansh Kumar · Shuhang Gu · Radu Timofte · Luc Van Gool
DeepLSD: Line Segment Detection and Refinement with Deep Image Gradients
Rémi Pautrat · Daniel Barath · Viktor Larsson · Martin Oswald · Marc Pollefeys
VisFusion: Visibility-aware Online 3D Scene Reconstruction from Videos
Huiyu Gao · Wei Mao · miaomiao Liu
Perspective Fields for Single Image Camera Calibration
Linyi Jin · Jianming Zhang · Yannick Hold-Geoffroy · Oliver Wang · Kevin Blackburn-Matzen · Matthew Sticha · David Fouhey
RUST: Latent Neural Scene Representations from Unposed Imagery
Mehdi S. M. Sajjadi · Aravindh Mahendran · Thomas Kipf · Etienne Pot · Daniel Duckworth · Mario Lucic · Klaus Greff
ステレオ偏光イメージングに基づく正確な 3D 形状の学習
Tianyu Huang、Haoang Li、Kejing He、Congying SUI、Bin Li、Yun-Hui Liu
ObjectFolder ベンチマーク: 神経オブジェクトと現実のオブジェクトによる多感覚学習
Ruohan Gao、Yiming Dou、Hao Li、Tanmay Agarwal · Jeannette Bohg · Yunzhu Li · Li Fei-Fei · Jiajun Wu
プライバシー保護のビジュアル ローカライゼーションを強化するためのペアポイント リフティング
Chunghwan Lee · Jaihoon Kim · Chanhyuk Yun · Je Hipped Hon
ポーズされた RGBD データからシーンレベルの暗黙的な 3D を予測する方法を学習
Nilesh Kulkarni、Linyi Jin、Justin Johnson、David Fouhey
モバイル センサーによる長期視覚ローカライゼーション
Shen Yan · Yu Liu · Long Wang · Zehong Shen · Zhen Peng · Haomin Liu · Maojun Zhang · Guofeng Zhang · Xiaowei Zhou
Learning the Distribution of Errors in Stereo Matching for Joint Disparity and Uncertainty Estimation
Liyan Chen · Weihan Wang · Philippos Mordohai
Revisiting Rotation Averaging: Uncertainties and Robust Losses
Ganlin Zhang · Viktor Larsson · Daniel Barath
Level-S
2
fM: Structure from Motion on Neural Level Set of Implicit Surfaces
Yuxi Xiao · Nan Xue · Tianfu Wu · Gui-Song Xia
Linking Garment with Person via Semantically Associated Landmarks for Virtual Try-On
Keyu Yan · Tingwei Gao · Hui Zhang · Chengjun Xie
Cross-domain 3D Hand Pose Estimation with Dual Modalities
Qiuxia Lin Linlin Yang Angela Yao
ScarceNet: 乏しい注釈による動物の姿勢推定
Chen Li Gim Lee
HS-Pose: カテゴリレベルのオブジェクト姿勢推定のためのハイブリッド スコープ特徴抽出
Linfang Zheng Chen Wang Yinghan Sun Esha Dasgupta Hua Chen · Ales Leonardis · Wei Zhang · Hyung Jin Chang
ViPLO: 人間とオブジェクトの相互作用検出のためのビジョントランスフォーマーベースのポーズ条件付き自己ループグラフ
Jeeseung Park · Jin-Woo Park · Jong-Seok Lee
エゴヘッドポーズ推定によるエゴボディポーズ推定
Jiaman Li · Karen Liu · Jiajun Wu
ビデオにおける人間の姿勢推定のための相互情報ベースの時間差学習
Runyang Feng、Yixing Gao、Xueqing Ma、Tze Ho Elden Tse、Hyung Jin Chang
複数人のポーズ予測のための軌跡を意識したボディ インタラクション トランスフォーマー
Xiaogang Peng · Siyuan Mao · Zizhao Wu
3 秒前に何が起こりましたか? 熱画像による過去の推測
Zitian Tang、Wenjie Ye、Wei-Chiu Ma、Hang Zhao
画像における人間と物体の接触の検出
Yixin Chen、Sai Kumar Dwivedi、Michael Black、Dimitrios Tzionas
RGB シーケンスからの In-Hand 3D Object Scanning
Shreyas Hampali · Tomas Hodan · LUAN TRAN · Lingni Ma · Cem Keskin · Vincent Lepetit たった
1 回のデモン​​ストレーションによる同様の変形可能なオブジェクトの自律操作学習
Yu Ren · Ronghan Chen · Yang Cong
影から再構築できるもの
Ruoshi Liu · Sachit Menon · Chengzhi Mao · Dennis Park · Simon Stent · Carl Vondrick
H2ONet: Hand-Occlusion-and-Orientation-aware Network for Real-time 3D Hand Mesh Reconstruction
Hao Xu · Tianyu Wang · Xiao Tang · Chi-Wing Fu
Learning Human Mesh Recovery in 3D Scenes
Zehong Shen · Zhi Cen · Sida Peng · Qing Shuai · Hujun Bao · Xiaowei Zhou
Bringing Inputs to Shared Domains for 3D Interacting Hands Recovery in the Wild
Gyeongsik Moon
Hi4D: 4D Instance Segmentation of Close Human Interaction
Yifei Yin · Chen Guo · Manuel Kaufmann · Juan Zarate · Jie Song · Otmar Hilliges
Deformable Mesh Transformer for 3D Human Mesh Recovery
Yusuke Yoshiyasu
Reconstructing Animatable 3D Categories from Videos
Gengshan Yang Chaoyang Wang Dinesh Reddy Nagapureddy Deva Ramanan
Learning Semantic-Aware Disentangled Representation for 3D Human Body Editing
Xiaokun Sun Qiao Feng Xiongzheng Li Jinsong Zhang Yu-Kun Lai Jingyu Yang Kun Li
物理的に実現可能な自然な L の見た目の衣服テクスチャは 3D モデリングによる人物検出器を回避
Zhanhao Hu Wenda Chu Xiaopei Zhu Hui Zhang Bo Zhang Xiaolin Hu
鳥瞰図でのマルチビュー 3D オブジェクト検出のドメイン一般化に向けて
Shuo Wang Xinhai Zhao Haiming Xu Zehui Chen Dameng Yu Jiahao Chang Zhen Yang Feng Zhao
人間の行動を聞く: 3D ヒューマン音響信号による姿勢推定
Yuto Shibata · Yutaka Kawashima · Mariko Isogawa · Go Irie · Akisato Kimura · Yoshimitsu Aoki
NLOST: Non-Line-of-Sight Imaging with Transformer
Yue Li · Jiayong Peng · Juntian Ye · Yueyi Zhang · Feihu Xu · Zhiwei Xiong
Few-shot Non-line-of-sight Imaging with Signal-surface Collaborative Regularization
Xintong Liu · Jianyu Wang · Leping Xiao · Xing Fu · Lingyun Qiu · Zuoqiang Shi
Co-SLAM: Joint Coordinate and Sparse Parametric Encodings for Neural Real-Time SLAM
Hengyi Wang · Jingwen Wang · Lourdes Agapito
OSRT: Omnidirectional Image Super-Resolution with Distortion-aware Transformer
Fanghua Yu · Xintao Wang · Mingdeng Cao · Gen Li · Ying Shan · Chao Dong
HRDFuse: Monocular 360

全体的かつ地域的な深さ分布を協調学習することによる深度推定
Hao Ai · Zidong Cao · Yan-Pai Cao · Ying Shan · Lin Wang
K3DN: デュアルピクセル焦点ぼけ除去のための視差を意識したカーネル推定
Yan Yang · Liyuan Pan · Liu Liu · miaomiao Liu
Shakes on a Plane: 不安定な写真からの教師なし深度推定
Ilya Chugunov、Yuxuan Zhang、Felix Heide
DynamicStereo: ステレオ ビデオからの一貫した動的深度
Nikita Karaev、Ignacio Rocco、Benjamin Graham、Natalia Neverova、Andrea Vedaldi、Christian Rupprecht
End-to-区分的ベジェ曲線によるベクトル化された HD マップ構築の終了
Limeng Qiao、Wenjie Ding、Xi Qiu、Chi Zhang
強化された安定したビュー合成
Nishant Jain · Suryansh Kumar · Luc Van Gool
スケーラブルで詳細なマスクフリーのユニバーサル フォトメトリック ステレオ 池端聡
PRISE
: マルチモデル画像アライメントのための強力な星凸制約によるディープ ルーカス カナデの謎を解く
Yiqing Zhang · Xinming Huang · Ziming Zhang
Imperfect を使用したビジュアル ローカリゼーションインターネットからの 3D モデル
Vojtech Panek · Zuzana Kukelova · Torsten Sattler
HelixSurf: 反復的に絡み合った正則化による屋内シーンの堅牢かつ効率的なニューラル暗黙的曲面学習
Zhihao Liang · Zhangjin Huang · Changxing Ding · Kui Jia
Omni3D: 3D のための大きなベンチマークとモデル野外での物体検出
Garrick Brazil · Abhinav Kumar · Julian Straub · Nikhila Ravi · Justin Johnson · Georgia Gkioxari
Objaverse: A Universe of Annotated 3D Objects
Matt Deitke · Dustin Schwenk · Jordi Salvador Marcos · Luca Weihs · Oscar Michel · Eli VanderBilt · Ludwig Schmidt · Kiana Ehsani · Aniruddha Kembhavi · Ali Farhadi
Privacy-Preserving Representations are not Enough: Recovering Scene Content from Camera Poses
Kunal Chelani · Torsten Sattler · Fredrik Kahl · Zuzana Kukelova
Learning a Depth Covariance Function
Eric Dexheimer · Andrew Davison
Defending Against Patch-based Backdoor Attacks on Self-Supervised Learning
Ajinkya Tejankar · Maziar Sanjabi · Qifan Wang · Sinong Wang · Hamed Firooz · Hamed Pirsiavash · Liang Tan
解読表現学習によるバックドア防御
Zaixi Zhang Qi Liu Zhicai Wang Zepu Lu Qingyong Hu
ラベルなしデータによるバックドア クレンジング
Lu Pang Tao Sun Haibin Ling Chao Chen
FEDMD 侵害: ペアロジット反転攻撃による画像回復
Hidea ki 高橋 · Jingjing Liu Yang Liu
ELASTIC AGGREGATIONフェデレーテッド最適化のために
Chen Dengsheng Jie Hu Vince Tan Xiaoming Wei Enhua Wu
DynaFed: グローバル ダイナミクスによるクライアント データの異質性への取り組み
Renjie PI WEIZHONG ZHANG Yueqi Xie Jiahui Gao Xiaoyu Wang Sunghun Kim · Qifeng Chen
パーソナライズされたフェデレーテッド ラーニングでクライアントのパフォーマンスの低下を防ぐには?
Zhe Qu · Xingyu Li · Xiao Han · Rui Duan · Chengchao Shen · Lixing Chen
Cloud-Device Collaborative Adaptation to Continual Changing Environments in the Real-world
Yulu Gan · Mingjie Pan · Rongyu Zhang · Zijian Ling · Lingran Zhao · Jiaming Liu · Shanghang Zhang
Diversity-Measurable Anomaly Detection
Wenrui Liu · Hong Chang · Bingpeng Ma · Shiguang Shan · Xilin CHEN
Look Around for Anomalies: Weakly-supervised Anomaly Detection via Context-Motion Relational Learning
MyeongAh Cho · Minjung Kim · Sangwon Hwang · Chaewon Park · Kyungjae Lee · Sangyoun Lee
Semi-supervised Hand Appearance Recovery via Structure Disentanglement and Dual Adversarial Discrimination
Zimeng Zhao · Binghui Zuo · Zhiyu Long · Yangang Wang
Adversarial Normalization: I Can Visual Everything (ICE)
Hoyoung Choi Seungwan Jin Kyungsik Han
Learning on Gradients: GAN で生成された画像検出のための一般化されたアーティファクト表現
Chuangchuang Tan Yao Zhao Shikui Wei Guanghua Gu Yunchao Wei
GLeaD: ジェネレーター主導のタスクによる GAN の改善
Qingyan Bai Ceyuan Yang Yinghao Xu Xihui Liu Yujiu Yang Yujun Shen
データフリー スケッチベースの画像検索
Abhra Chaudhuri Ayan Kumar Bhunia Yi-Zhe Song Anjan Dutta
OpenMix: 誤分類検出のための異常値サンプルの探索
Fei Zhu · Zhen Cheng · Xu-yao Zhang · Cheng -lin Liu
Genie: 量子化のデータを見せてください
チョン・ヨングォン、イ・チュンマン、キム・ホヨン
モデルトレーニングへのノイズによる継続的ダメージを防ぐ方法
Xiaotian Yu Yang Jiang Tianqi Shi Zunlei Feng Yuexuan Wang Mingli Song Li Sun
説明可能なベイズ深層学習のための勾配ベースの不確実性帰属
Hanjing Wang Dhiraj Joshi Shiqiang W ang Qiang Ji
FIANCEE: Faster Inference of条件付き早期終了による敵対的ネットワーク
Polina Karpikova Ekaterina Radionova Anastasia Yaschenko Andrei Spiridonov Leonid Kostyushko Riccardo Fabricatore Aleksei Ivakhnenko
Run, Don't Walk: Chas ing Higher FLOPS for Faster Neural Networks
Jierun Chen · Shiu-hong Kao · Hao He · Weipeng Zhuo · Song Wen · Chul-Ho Lee · S.-H. Chan
FFCV: データボトルネックの除去によるトレーニングの加速
Guillaume Leclerc · Andrew Ilyas · Logan Engstrom · Sung Min Park · Hadi Salman · Aleksander Madry
Disentangled Representation Learning for Unsupervised Neural Quantization
Haechan Noh · Sangeek Hyun · Woojin Jeong · Hanshin Lim · Jae-Pil Heo
HOTNAS: Hierarchical Optimal Transport for Neural Architecture Search
Jiechao Yang · Yong Liu · Hongteng Xu
Solving relaxations of MAP-MRF problems: Combinatorial in-face Frank-Wolfe directions
Vladimir Kolmogorov
Transformer-Based Learned Optimization
Erik Gärtner · Luke Metz · Misha Andriluka · C. Freeman · Cristian Sminchisescu
Multi-Agent Automated Machine Learning
Zhaozhi Wang · Kefan Su · Jian Zhang · Huizhu Jia · Qixiang Ye · Xiaodong Xie · Zongqing Lu
Accelerating Dataset Distillation via Model Augmentation
Lei Zhang · Jie Zhang · Bowen Lei · Subhabrata Mukherjee · Xiang Pan · Bo Zhao · Caiwen Ding · Yao Li · Dongkuan Xu
PA&DA: Jointly Sampling Path and Data for Consistent NAS
Shun Lu · Yu Hu · Longxing Yang · Zihao Sun · Jilin Mei · Jianchao Tan · Chengru Song
Achieving a Better Stability-Plasticity Trade-off via Auxiliary Networks in Continual Learning
Sanghwan Kim · Lorenzo Noci · Antonio Orvieto · Thomas Hofmann
EcoTTA: Memory-Efficient Continual Test-time Adaptation via Self-distilled Regularization
Junha Song · Jungsoo Lee · In So Kweon · Sungha Choi
CODA-Prompt: COntinual Decomposed Attention-based Prompting for Rehearsal-Free Continual Learning
James Smith · Leonid Karlinsky · Vyshnavi Gutta · Paola Cascante-Bonilla · Donghyun Kim · Assaf Arbelle · Rameswar Panda · Rogerio Feris · Zsolt Kira DisWOT: Student
Architecture Search for Distill With Out Training ·
Peijie Dong · Lujun Li · Zimian Wei
リアルタイム評価オンライン継続学習: 新たな希望
ヤシル・グナイム、アデル・ビビ、クメイル・アルハムード、モタセム・アルファラ、ハサン・ハムード・ハムード、アメヤ・プラブ、フィリップ・トール、バーナード・ガーネム オンライン継続
学習におけるクロスタスククラス差別に対処する
イードゥオ・グオ、ビン・リウ、ドンヤン・ジャオ
クラスの注意力伝達に基づく知識の蒸留
Ziyao Guo、Haonan Yan、HUI LI、Xiaodong Lin
クラスの漸進的学習のための高密度ネットワークの拡張
Zhiyuan Hu Yunsheng Li Jiancheng Lyu Dashan Gao Nuno Vasconcelos
自己教師付き視覚表現学習のためのマルチモード オンライン知識蒸留
Kaiyou Song Jin Xie Shan Zhang Zimeng Luo
クラス認識双方向蒸留による少数ショットのクラス増分学習
Linglan Zhao Jing Lu Yunlu Xu Zhanzhan Cheng Dashan Guo Yi Niu Xiangzhong Fang
Mod-Squad: モジュラー マルチタスク学習者としての専門家の混合の設計
Zitian Chen Ykang Shen Mingyu Ding Zhenfang Chen Hengshuang Zhao Erik Learned-Miller · Chuang Gan
Train-Once-for-All Personalization
Hon-Youチェン · ヤンドン・リー · イン・クイ · ミンダ・チャン · ウェイルン・チャオ · リー・チャン
Generalizable Implicit Neural Representations with Instance Pattern Composers
Chiheon Kim · Doyup Lee · Saehoon Kim · Minsu Cho · Wook-Shin Han
Deep Frequency Filtering for Domain Generalization
Shiqi Lin · Zhizheng Zhang · Zhipeng Huang · Yan Lu · Cuiling Lan · Peng Chu · Quanzeng You · Jiang Wang · Zicheng Liu · Viraj Navkal · Amey Parulkar · Zhibo Chen
Back to the Source: Diffusion-Driven Adaptation to Test-Time Corruption
Jin Gao · Jialing Zhang · Xihui Liu · Trevor Darrell · Evan Shelhamer · Dequan Wang
Decompose, Adjust, Compose: Effective Normalization by Playing with Frequency for Domain Generalization
Sangrok Lee · Jongseong Bae · Ha Kim Kim
Enhanced Multimodal Representation Learning with Cross-modal KD
Mengxi Chenyu Xing · Yu Wang · Ya ZHANG
等価基底ベクトル
Yang Shen Shen Shen · XU-Hao-Shen Wei
Dare-Gram: Unsupervised DMain Adaptation Regressi On By Aligning INVERSE GRAM MATRILES
Ismail Nejjar · qin Wang · Olga Fink
安定性と適応性の向上に向けて: セマンティック セグメンテーションにおけるモデル適応のためのオンライン自己トレーニングの改善
Dong Zhao Shuang Wang Qi Zang Dou Quan XIUTIAO YE Licheng Jiao
MIC: コンテキスト強化されたドメイン適応のためのマスクされた画像の一貫性
Lukas Hoyer Dengxin Dai Haoran Wang · Luc Van Gool
学習から現れる神経依存性大規模なカテゴリ
Ruili Feng Kecheng Zheng Kai Zhu Yujun Shen Jian Zhao Yukun Huang Deli Zhao Jingren Zhou Michael Jordan Zheng-Jun Zha 画像認識用の2 Lサブモデルの共同
トレーニングHugo Touvron Matthieu CORD Maxime Oquab Piotr Bojanowski · Jakob Verbeek · Herve Jegouオンザフライカテゴリ Discovery Ruoyi Du · Dong-liang Chang · Kongming Liang · Timothy Hospedales · Yi-Zhe Song · Zhanyu Ma堅牢なビジュアル質問に答えるための生成バイアスJe Won Cho · Dong-Jin Kim · Hunggon Ryu In So Kweon RMLVQA: A Margin Loss Approach for Visual言語バイアスによる質問への回答アビプサ・バス・スラバンティ・アデパリ・ヴェンカテシュ・バブ・ラダクリシュナン










Twin Contrastive Learning with Noisy Labels
Zhizhong Huang · Junping Zhang · Hongming Shan
Fine-Grained Classification with Noisy Labels
Qi Wei · Lei Feng · Haoliang Sun · Ren Wang · Chenhui Guo · Yilong Yin
ProtoCon: Pseudo-label Refinement via Online Clustering and Prototypical Consistency for Efficient Semi-supervised Learning
Islam Nassar · Munawar Hayat · Ehsan Abbasnejad · Hamid Rezatofighi · Gholamreza Haffari
Zero-shot Model Diagnosis
Jinqi Luo · Zhaoning Wang · Chen Henry Wu · Dong Huang · Fernando de la Torre
Mind the Label Shift of Augmentation-based Graph OOD Generalization
Junchi Yu · Jian Liang · Ran He
RONO: Robust Discriminative Learning with Noisy Labels for 2D-3D Cross-Modal Retrieval
Yanglin Feng · Hongyuan Zhu · Dezhong Peng · Xi Peng · Peng Hu
Deep Incomplete Multi-view Clustering with Cross-view Partial Sample and Prototype Alignment
Jiaqi Jin · Siwei Wang · Zhibin Dong · Xinwang Liu · En Zhu
MetaViewer: Towards A Unified Multi-View Representation
Ren Wang · Haoliang Sun · Yuling Ma · Xiaoming Xi · Yilong Yin
Rethinking Out-of-Distribution Detection: Masked Image Modeling is All You Need
Jingyao Li · Pengguang Chen · Zexin He · Shaozuo Yu · Shu Liu · Jiaya Jia
Towards Trustable Skin Cancer Diagnosis via Rewriting Model’s Decision
Siyuan Yan · zhen yu · Xuelin Zhang · Dwarikanath Mahapatra · Shekhar Chandra · Monika Janda · H. Peter Soyer · Zongyuan Ge
METransformer: 複数の学習可能なエキスパート トークンを使用した Transformer による放射線医学レポートの生成
Zhanyu Wang · Lingqiao Liu · Lei Wang · Luping Zhou
ギガピクセル画像の表現学習のための共有コンテキスト処理を備えたスパース マルチモーダル グラフ トランスフォーマー
Ramin Nakhli · Puria Azadi Moghadam · Haoyang Mi · Hossein Farahani · Alexander Baras · Blake Gilks​​ · Ali Bashashati
拡散モデルを使用した曖昧な医用画像のセグメンテーション
AIMON RAHMAN · Jeya Maria Jose Valanarasu · Ilker Hacihaliloglu · Vishal Patel
方向性接続ベースの医用画像セグメンテーション
Ziyun Yang · Sina Farsiu
双方向コピーアンドペースト半教師あり医用画像セグメンテーション用
Yunhao Bai · Duowen Chen · Qingli Li · Wei Shen · Yan Wang
AutoLabel: CLIP-based framework for Open-set Video Domain Adaptation
Giacomo Zara · Subhankar Roy · Paolo Rota · Elisa Ricci
Zero-shot Generative Model Adaptation via Image-specific Prompt Learning
Jiayi Guo · Chaofei Wang · You Wu · Eric Zhang · Kai Wang · Xingqian Xu · Shiji Song · Humphrey Shi · Gao Huang
2PCNet: Two-Phase Consistency Training for Day-to-Night Unsupervised Domain Adaptive Object Detection
Mikhail Kennerley · Jian-Gang Wang · Bharadwaj Veeravalli · Robby Tan
Bridging Precision and Confidence: A Train-Time Loss for Calibrating Object Detection
Muhammad Akhtar Munir · Muhammad Khan Khan · Salman Khan · Fahad Khan
局所的特徴の検出と記述のための学習変換予測表現
Zihao Wang · Chunxu Wu · Yifei Yang · Zhen Li
オープンワールドオブジェクト検出のためのアニーリングベースのラベル転移学習
Yuqing Ma · Hainan Li · Zhange Zhang · Jinyang Guo · Shanghang Zhang · Ruihao Gong · Xianglong Liu
PROB: オープンワールド物体検出のための確率的物体
Orr Zohar · Kuan-Chieh Wang · Serena Yeung
オープンワールド内のすべての検出: 普遍的な物体検出に向けて
Zhenyu Wang · Ya-Li Li · Xi Chen · Ser-Nam Lim · Antonio Torralba · Hengshuang Zhao · Shengjin Wang
DETR とクロスドメインの弱く監視されたオブジェクト検出のための追加のグローバル アグリゲーション
Zongheng Tang · Yifan Sun · Si Liu · Yi Yang
Self-supervised AutoFlow
Hsin-Ping Huang · Charles Herrmann · Junhwa Hur · Erika Lu · Kyle Sargent · Austin Stone · Ming-Hsuan Yang · Deqing Sun
Detection Hub: Unifying Object Detection Datasets via Query Adaptation on Language Embedding
Lingchen Meng · Xiyang Dai · Yinpeng Chen · Pengchuan Zhang · Dongdong Chen · Mengchen Liu · Jianfeng Wang · Zuxuan Wu · Lu Yuan · Yu-Gang Jiang
Learning Common Rationale to Improve Self-Supervised Representation for Fine-Grained Visual Recognition Problems
Yangyang Shu · Anton Hengel · Lingqiao Liu
Full or weak annotations? An adaptive strategy for budget-constrained annotation campaigns
Javier Gamazo Tejero · Martin Zinkernagel · Sebastian Wolf · Raphael Sznitman · Pablo Márquez Neila
Class-Incremental Exemplar Compression for Class-Incremental Learning
Zilin Luo · Yaoyao Liu · Bernt Schiele · Qianru Sun
The Devil is in the Points: Weakly Semi-Supervised Instance Segmentation via Point-Guided Mask Representation
Beomyoung Kim · Joonhyun Jeong · Dongyoon Han · Sung Ju Hwang
Augmentation Matters: A Simple-yet-Effective Approach to Semi-supervised Semantic Segmentation
Zhen Zhao · Lihe Yang · Sifan Long · Jimin Pi · Luping Zhou · Jingdong Wang
Weakly Supervised Semantic Segmentation via Adversarial Learning of Classifier and Reconstructor
Hyeokjun Kweon · Sung-Hoon Yoon · Kuk-Jin YOON
一般化された少数ショット セマンティック セグメンテーションのための直交プロトタイプの学習
Sun-Ao Liu Yiheng Zhang Zhaofan Qiu Hontao Xie Yongdong Zhang Ting Yao
mAP を超えて: インスタンス セグメンテーションのより良い評価に向けて
Rohit Kumar Jena Lukas Zhornyak Neh al Doiphode Pratik Chaudhari · Vivek Buch · James Gee · Jianbo Shi
セマンティック セグメンテーションのための動的フォーカス認識位置
クエリ Haoyu He、Jianfei Cai、Zizheng Pan、Jing Liu、Jing Zhang、Dacheng Tao、Bohan Zhuang
詳細に焦点を当てる: 多様な細粒表現によるオンライン マルチオブジェクト トラッキング
Hao Ren、Shoudong Han · Huilin Ding · Ziwen Zhang · Honwei Wang · Faquan Wang
DynaMask: インスタンス セグメンテーションのための動的マスク選択
Ruihuang Li · Chenhang HE · Shuai Li · Yabin Zhang · Lei Zhang
一般化された少数ショット セマンティック セグメンテーションのための強力なベースライン
Seyed Mohammadsina Hajimiri · Malik Boudiaf · Ismail Ayed · Jose Dolz
コンポジター: 堅牢なパーツとオブジェクト セグメントのためのボトムアップ クラスタリングと合成Ju
He · Jieneng Chen · Ming-Xian Lin · Qihang Yu · Alan Yuille
セマンティックイメージ合成を改善するためのオブジェクト形状からの部品の推測と活用
Yuxiang Wei · Zhilong Ji · Xiaohe Wu · Jinfeng Bai · Lei Zhang · Wangmeng Zuo
プリミティブ生成とセマンティック- ユニバーサルゼロショットセグメンテーションのアライメント関連
SHUTING HE Henghui Ding Wei Jiang
UniDAformer: 階層マスク キャリブレーションによる統合ドメイン適応パノプティック セグメンテーション トランスフォーマー
Jingyi Zhang Jiaxing Huang Xiaoqin Zhang Shijian Lu
StructVPR: 視覚的場所認識のための重み付けサンプルによる構造知識の蒸留
Yanqing Shen Sanping Zhou Jingwen Fu · Ruotong Wang · Shitao Chen · Nanning Zheng
Clip- S
4
: 言語ガイドによる自己監視型セグメンテーション
We · Suphanut Jamonnak · LIANG GOU · LIU RIURERINING
条件付き属性 F または構成ゼロショット学習
qingsheng Wangqiao LiU · Chenchen jing · hao Chen · Guoqiang Liang · PENG WANG Chunhua Shen
オブジェクト認識蒸留オープンボキャブラリーオブジェクト検出のためのピラミッド
Luting Wang · Yi Liu · Penghui Du · Zihan Ding · Yue Liao · Qiaosong Qi · Biaolong Chen · Si Liu
ZegCLIP: ゼロショット セマンティック セグメンテーションへの CLIP の適応に向けてZiqin
Zhou · yingjie Lei · Bowen Zhang · Lingqiao Liu · Yifan Liu
画像とテキストのペアのみからオープンワールドのセマンティック セグメンテーション用のテキストベースのマスクを生成
Junbum Cha Jonghwan Mun Byungseok Roh
適応的即時チューニングによるモバイル ユーザー インターフェイス要素検出
Weiqiang Wang Zhuoer Xu Haoxing Chen jun lan Changhua Meng Weiqi ang Wang
地域を意識した事前トレーニングビジョントランスフォーマーによるオープンボキャブラリーオブジェクト検出
Dahun Kim Anelia Angelova Weicheng Kuo
ビジュアルアラインメントによる表構造認識の向上 シーケンシャルコーディンゲリング
YONGSHUAI HUANG · NIPENG Lu. Yibo Li · ZECHEG XIE · SHEN ggao zhu · liangcai gao · weipeng
vote2cap-detr によるエンドツーエンドの 3D 高密度キャプション
sijin Chen · hongyuan Zhu Xin Chenインジエ・レイ・ガン ユウ・タオ・チェン
ビジュアルDNA: ニューロン活性化の分布を使用した画像の表現と比較 ベンジャミン
・ラムトゥーラ マシュー・ガッド ポール・ニューマン ダニエレ・デ・マルティーニ
ヒント-オーグ: ブーストされた少数のショットパラメータの効率的なチューニングに向けた財団ビジョントランスフォーマーからのヒントの描画
Zhongzhi Yu Shang Wu Shunyao Zhang Yonggan Fu Yingyan Lin
マルチモーダル モデルのゼロショット汎化と堅牢性の向上
Yunhao Ge · Jie Ren · Andrew Gallagher · Yuxiao Wang · Ming-Hsuan Yang · Hartwig Adam · Laurent Itti · Balaji Lakshminarayanan · Jiaping Zhao
Asymmetric Feature Fusion for Image Retrieval
Hui Wu · Min Wang · Wengang Zhou · Zhenbo Lu · Houqiang Li
Cross-Image-Attention for Conditional Embeddings in Deep Metric Learning
Dmytro Kotovenko · Pingchuan Ma · Timo Milbich · Björn Ommer
Learning Instance-Level Representation for Large-Scale Multi-Modal Pretraining in E-commerce
Yang Jin · Yongzhi Li · Zehuan Yuan · Yadong MU
Learning Attribute and Class Specific Representation Duet for Fine-grained Fashion Analysis
Yang Jiao · Yan Gao · Jingjing Meng · Jin Shang · Yi Sun
HAAV: Hierarchical Aggregation of Augmented Views for Image Captioning
Chia-Wen Kuo · Zsolt Kira
Non-Contrastive Learning Meets Language-Image Pre-Training
Jinghao Zhou · Li Dong · Zhe Gan · Lijuan Wang · Furu Wei
ViLEM: Visual-Language Error Modeling for Image-Text Retrieval
Yuxin Chen · Zongyang Ma · ziqi zhang · Zhongang Qi · Chunfeng Yuan · Ying Shan · Bing Li · Weiming Hu · Xiaohu Qie · Jianping WU
CLIPPO: Image-and-Language Understanding from Pixels Only
Michael Tschannen · Basil Mustafa · Neil Houlsby
MaskCLIP: Masked Self-Distillation Advances Contrastive Language-Image Pretraining
Xiaoyi Dong Jianmin Bao Yinglin Zheng Ting Zhang Dongdong Chen Hao Yang Ming Zeng Weiming Zhang Lu Yuan Dong Chen Fang Wen Nenghai Yu 3D 言語事前トレーニングのためのコンテキスト認識型アライメントと相互マスキング Zhao Jin Munawar Hayat Yuwei Yang Yulan Guo yingjie Lei
シーン
トリロジー
:人間のシーンのスケッチと写真とテキストによるその補完性について
ピナキ・ナス・チョードリー アヤン・クマール ブニア・アニーシャン サイン・サブハディープ コリー・タオ・シャン・イージェ・ソン
画像分類におけるボット・レネックの概念の学習
ボーウェン・ワン・良志 リー・ユウタ 中島永原 元
GIVL: 視覚の地理的包括性の向上事前トレーニング方法を備えた言語モデル
Da ying · Feng Gao · Govind Thattai · Michael Johnston · Kai-Wei Chang
画像分類子のテキスト概念への反事実的な説明をグラウンディングする
Siwon Kim · Jinoh Oh · SUNGJIN LEE · Seunghak Yu · Jaeyoung Do · Tara Taghavi
概念ベースの説明における見落とされた要素: データセットの選択、概念の学習可能性、人間の能力
Vikram V. Ramaswamy · Sunnie SY Kim · Ruth Fong · Olga Russakovsky
LOCATE: 弱教師付きアフォーダンスグラウンディングのためのオブジェクト部品のローカライズと転送
Gen Li · Varun Jampani · Deqing Sun · Laura Sevilla-Lara
タスク視覚言語モデルを調整するための残差
Tao Yu、Zhihe Lu、Xin Jin、Zhibo Chen、Xinchao Wang
マルチタスク学習のための階層プロンプト学習
Yajing Liu · Yuning Lu · Hao Liu · Yaozu An · Zhuoran Xu · Yao Zhuokun · Zhang Baofeng · Zhiwei Xiong · Chenguang Gui
Diversity-Aware Meta Visual Prompting
Qidong Huang · Xiaoyi Dong · Dongdong Chen · Weiming Zhang · Feifei Wang · Gang Hua · Nenghai Yu
From Images to Textual Prompts: Zero-shot Visual Question Answering with Frozen Large Language Models
Jiaxian Guo · Junnan Li · Dongxu Li · Anthony Tiong · Boyang Li · Dacheng Tao · Steven Hoi
Language Adaptive Weight Generation for Multi-task Visual Grounding
Wei Su · Peihan Miao · Huanzhang Dou · Gaoang Wang · Liang Qiao · Zheyang Li · Xi Li
Fusing Pre-trained Language Models with Multimodal Prompts through Reinforcement Learning
Youngjae Yu、Jiwan Chung、Heeseung Yun、Jack Hessel、JaeSung Park、Ximing Lu、Rowan Zellers、Prithviraj Ammanabrolu、Ronan Le Bras、Gunhee Kim、Yejin Choi ディープ ニューラル ネットワークは 2 年生よりも賢いですか
?
Anoop Cherian · Kuan-Chuan Peng · Suhas Lohit · Kevin Smith · Joshua Tenenbaum
A-CAP: 常識的な知識による予測キャプション
MINH DUC VO · An Luong · 杉本昭博 · 中山英樹
新しい道: 合成による視覚と言語のナビゲーションの拡張指示と模倣学習
アイシュワリヤー・カマス、ピーター・アンダーソン、スー・ワン、ジン・ユー・コー、アレクサンダー・クー、オースティン・ウォーターズ、インフェイ・ヤン、ジェイソン・ボールドリッジ、ザラナ・パレク 未来視点の画像セマンティクスの生成による視覚と言語のナビゲーションの
改善
Jialu Li · Mohit Bansal
Layout-based Causal Inference for Object Navigation
Sixian Zhang · Xinhang Song · Weijie Li · Yubing Bai · Xinyao Yu · Shuqiang Jiang
You Need Multiple Exiting: Dynamic Early Exiting for Accelerating Unified Vision Language Model
Shengkun Tang · Yaqing Wang · Zhenglun Kong · Tianchi Zhang · Yao Li · Caiwen Ding · Yanzhi Wang · Yi Liang · Dongkuan Xu
Distilling Cross-Temporal Contexts for Continuous Sign Language Recognition
Leming Guo · Wanli Xue · Qing Guo · Bo Liu · Kaihua Zhang · Tiantian Yuan · Shengyong Chen
Multivariate, Multi-frequency and Multimodal: Rethinking Graph Neural Networks for Emotion Recognition in Conversation
Feiyu Chen · Jie Shao · Shuyuan Zhu · Heng Tao Shen
モジュール式記憶力: ビデオ記憶力予測のための段階的表現
Théo Dumont、Juan Hevia、Camilo Fosco
VindLU: 効果的なビデオと言語の事前トレーニングのためのレシピ
Feng Cheng、Xizi Wang、Jie Lei、David Crandall、Mohit Bansal、Gediminas Bertasius
Procedure-Aware Pretraining教育ビデオを理解するための
Honglu Zhou、Roberto Martín-Martín、Mubbasir Kapadia、Silvio Savarese、Juan Carlos Niebles
Vid2Seq: 濃密なビデオキャプション用の視覚言語モデルの大規模事前トレーニング
Antoine Yang、Arsha Nagrani、Paul Honsuck Seo、Antoine Mitoch、Jordi Pont-Tuset · Ivan Laptev · Josef Sivic · Cordelia Schmid
Cap4Video: 補助キャプションはテキストビデオの検索に何ができますか?
Wenhao Wu Haipen Luo Bo Fang Jingdong Wang Wanli Ouyang
低表現力レジームにおける時間的コンテキストの活用
Camilo Fosco SouYoung Jin Emilie Josephs Aude Oliva
Tell Me What Happened: マルチモーダルマスクビデオ生成によるテキストガイド付きビデオ完成の統合
Tsu -Jui Fu Licheng Yu Ning Zhang Cheng-Yang Fu Jong-Chyi Su William Yang Wang Sean Bell
NewsNet: 階層的時間セグメンテーションのための新しいデータセット
Haoqian Wu Keyu Chen Haozhe Liu Mingchen Zhuge Bing Li Ruizhi Qiao · Xiujun Shu · Bei Gan · Liangsheng Xu · Bo Ren · Mengmeng Xu · Wentian Zhang · Raghavendra Ramachandra · Chia-Wen Lin · Bernard Ghanem
逐次信頼性キャリブレーションのための知覚とセマンティックを意識した正則化
Zhenghua Peng Yu Luo Tianshui Chen Keke Xu Shuangping Huang
テキスト情報による弱い教師付き時間アクション ローカリゼーションの強化
Guozhang Li De Cheng Xinpeng Ding Nannan Wang Xiaoyu Wang Xinbo Gao
Re2TAL: 可逆的な時間アクション ローカリゼーションのための事前トレーニング済みビデオ バックボーンの再配線
Chen Zhao · Shuming Liu · Karttikeya Mangalam · Bernard Ghanem
Search-Map-Search: アクション認識のためのフレーム選択パラダイム
Mingjun Zhao · Yakun Yu · Xiaoli Wang · Lei Yang · Di Niu
Therbligs In Action: Video Understanding through Motion Primitive s
Eadom Dessalene · Michael Maynord · Cornelia Fermuller · Yiannis Aloimonos の
スケルトンベースの行動認識のための識別表現の学習
Huanyu Zhou · Qingjie Liu · Yunhong Wang
MOSO: Decomposing MOtion, Scene and Object for Video Prediction
Mingzhen Sun · Weining Wang · Xinxin Zhu · Jing Liu
EVAL: Explainable Video Anomaly Localization
Ashish Singh · Michael Jones · Erik Learned-Miller
Unified Mask Embedding and Correspondence Learning for Self-Supervised Video Segmentation
Liulei Li · Wenguan Wang · Tianfei Zhou · Jianwu Li · Yi Yang
Representation Learning for Visual Object Tracking by Masked Appearance Transfer
Haojie Zhao · Dong Wang · Huchuan Lu
Generalized Relation Modeling for Transformer Tracking
Shenyuan Gao · Chunluan Zhou · Jun Zhang
Panoptic Video Scene Graph Generation
Jingkang Yang · Wenxuan Peng · Xiangtai Li · ZUJIN GUO · Liangyu Chen · Bo Li · Zheng Ma · Wayne Zhang · Kaiyang Zhou · CHEN CHANGE LOY · Ziwei Liu
Devil’s on the Edges: Selective Quad Attention for Scene Graph Generation
Deunsol Jung · Sanghyun Kim · Won Hwa Kim · Minsu Cho
Focused and Collaborative Feedback Integration for Interactive Image Segmentation
Qiaoqiao Wei · Hui Zhang · Jun-Hai Yong
Knowledge Distillation for 6D Pose Estimation by Aligning Distributions of Local Predictions
Shuxuan Guo · Yinlin Hu · Jose Alvarez · Mathieu Salzmann
PartMix: Regularization Strategy to Learn Part Discovery for Visible-Infrared Person Re-identification
Minsu Kim · Seungryong Kim · Jungin Park · Seongheon Park · Kwanghoon Sohn
Integrally Pre-Trained Transformer Pyramid Networks
Yunjie Tian · Lingxi Xie · Zhaozhi Wang · Longhui Wei · XIAOPENG ZHANG · Jianbin Jiao · Yaowei Wang · Qi Tian · Qixiang Ye
Explaining Image Classifiers with Multiscale Directional Image Representation
Stefan Kolek · Robert Windesheim · Hector Andrade Loarca · Gitta Kutyniok · Ron Levie
Neuron Structure Modeling for Generalized Remote Physiological Measurement
Hao LU · Zitong Yu · Xuesong Niu · Ying-Cong Chen
Visual Atoms: Pre-training Vision Transformers with Sinusoidal Waves
Sora Takashima · Ryo Hayamizu · Nakamasa Inoue · Hirokatsu Kataoka · Rio Yokota
Model-Agnostic Gender Debiased Image Captioning
Yusuke Hirota · Yuta Nakashima · Noa Garcia
ImageBind: 1 つの埋め込みスペースですべてをバインドする
Rohit Girdhar Alaaeldin El-Nouby Zhuang Liu Mannat Singh Kalyan Vasudev Alwala Armand Joulin Ishan Misra
I2MVFormer: 大規模言語モデル生成されたゼロショット イメージのマルチビュー ドキュメントの監督クラス アファメーション
Muhammad Naeem Naeem Gul Zain Khan Yongqin Xian Muhammad Zeshan Afzal Didier Stricker Luc Van Gool Federico Tombari
画像とテキストのマッチングのためのインスタンス間の意味関係の学習
Zheren Fu Zhendong Mao Yan Song Yongdong Zhang
検索によるカスタマイズされたビジュアル モデルの学習 - 知識の拡張
Haotian Liu · Kilho Son · Jianwei Yang · Ceリウ・ジャンフェン・ガオ・ヨン・ジェ・リー・チュンユアン・リー
M
6
ドキュメント: 最新のドキュメント レイアウト分析用の大規模マルチフォーマット、マルチタイプ、マルチレイアウト、マルチ言語、マルチアノテーション カテゴリ データセット Hiuyi Cheng · Peirong Zhang · Sihang Wu · Jiaxin Zhang · Qiyuan · Zecheng Xie
· Jing Li Kai Ding Lianwen Jin
記述クエリによるモダリティに依存しない人物の再識別に向けて
Cuiqun Chen Mang Ye Ding Jiang
ピクセル、画像、および言語の一般化された解読
Xueyan Zou Zi-Yi Dou Jianwei Yang Zhe Gan Linjie Li · Chunyuan Li · Xiyang Dai · Harkirat Behl · Jianfeng Wang · Lu Yuan · Nanyun Peng · Lijuan Wang · Yong Jae Lee · Jianfeng Gao
自己教師付きビジュアル事前トレーニングのための相関画像モデリング
Wei Li · Jiahao Xie · CHEN CHANGE LOY
対照学習におけるマルチモーダル表現の再考: パッチとトークンの埋め込みから有限離散トークンまでYuxiao Chen、 Jianbo
Yuan、Yu Tian、Shijie Geng、Xinyu Li、Ding Zhou、Dimitris Metaxas、Hongxia Yang ローカルガイドによるグローバル:視覚強化学習のためのペア類似性表現Hyesong Choi · Hunsang Lee · Wonil Song · Sangryul Jeon · Gwanghoon Sohn · Dongbo Min OCTET: オブジェクトを意識した反事実説明Mehdi Zemni · Michael Chen · Eloi Zablocki · Hedi Ben Younes · Patrickペレス・マシュー・コード






外観を超えて: 人間中心の視覚タスクのためのセマンティック制御可能な自己教師あり学習フレームワーク
Weihua Chen、Xianzhe Xu、Jian Jia、Hao Luo、Yaohua Wang、Fan Wang、Rong Jin、Xiuyu Sun
シーン知識による視覚的グラウンディングの促進: ベンチマークと方法
Zhihong Chen Ruifei Zhang Yibing Song Xiang Wan Guanbin Li
FashionSAP: きめ細かなファッション視覚言語の事前トレーニングを促すシンボルと属性
Yunpeng Han Lisai Zhang Qingcai Chen chen zhijian Zhonghua Li Jianxin Yang Zhao Cao
生物医学的視覚のための時間構造の活用法を学ぶ –言語処理
Shruthi Bannur · Stephanie Hyland · Qianchu Liu · Fernando Pérez-García · Maximilian Ilse · Daniel Castro · Benedikt Boecking · Harshita Sharma · Kenza Bouzid · Anja Thieme · Anton Schwaighofer · Maria Teodora Wetscherek · Matthew Lungren · Aditya Nori · Javier Alvarez Valle · Ozan Oktay
Neural Koopman Pooling: Control-Inspired Temporal Dynamics Encoding for Skeleton-Based Action Recognition
Xinghan Wang · Xin Xu · Yadong MU
Fine-grained Audible Video Description
Xuyang Shen · Dong Li · Jinxing Zhou · Zhen Qin · Bowen He · Xiaodong Han · Aixuan Li · Yuchao Dai · Lingpeng Kong · Meng Wang · Yu Qiao · Yiran Zhong
Language-Guided Audio-Visual Source Separation via Trimodal Consistency
Reuben Tan · Arijit Ray · Andrea Burns · Bryan Plummer · Justin Salamon · Oriol Nieto · Bryan Russell · Kate Saenko
Audio-Visual Grouping Network for Sound Localization from Mixtures
Shentong Mo · Yapeng Tian
Chat2Map: Efficient Scene Mapping from Multi-Ego Conversations
Sagnik Majumder · Hao Jiang · Pierre Moulon · Ethan Henderson · Paul Calamia · Kristen Grauman · Vamsi Krishna Ithapu
Taming Diffusion Models for Audio-Driven Co-Speech Gesture Generation
Lingting Zhu · Xian Liu · Xuanyu Liu · Rui Qian · Ziwei Liu · Lequan Yu
Spatio-Temporal Pixel-Level Contrastive Learning-based Source-Free Domain Adaptation for Video Semantic Segmentation
Shao-Yuan Lo · Poojan Oza · Sumanth Chennupati · Patricio Galindo · Vishal Patel
MDQE: Mining Discriminative Query Embeddings to Segment Occluded Instances on Challenging Videos
Minghan Li · Shuai Li · Wangmeng Xiang · Lei Zhang
System-status-aware Adaptive Network for Online Streaming Video Understanding
Lin Geng Foo · GONG JIA · Zhipeng Fan · Jun Liu
Frame Flexible Network
Yitian Zhang · Yue Bai · Chang Liu · Huan Wang · Sheng Li · Yun Fu
Self-Supervised Video Forensics by Audio-Visual Anomaly Detection
Chao Feng · Ziyang Chen · Andrew Owens
MobileVOS: Real-Time Video Object Segmentation Contrastive Learning meets Knowledge Distillation
ROY MILES · Mehmet Kerim Yucel · Bruno Manganelli · Albert Saa-Garriga
クラス中心の拡張を使用したモーションブラーに対するセマンティック セグメンテーションの堅牢性の向上
Aakanksha Aakanksha Rajagopalan Ambasamduram
MAGVIT: Masked Generative Video Transformer
Lijun Yu Yong Cheng Kihyuk Sohn Jose Lezama Han Zhang Huiwen Chang Alexander Hauptmann Ming-Hsuan Yang · Yuan Hao · Irfan Essa · Lu Jiang
SCOTCH and SODA: Transformer Video Shadow Detection Framework
Lihao Liu、Jean Prost、Lei Zhu、Nicolas Papadakis、Pietro Lio、Carola-Bibiane Schönlieb、Angelica Aviles-Rivero
欠陥アトラスを使用したニューラル フィルターによるブラインド ビデオ ディフリッカリング
Chenyang Lei、Xuanchi Ren · Zhaoxiang Zhang · Qifeng Chen
シーン グラフの確率的偏り解消
Bashirul Biswas Biswas · Qiang Ji
SITS 用 ViT: 衛星画像時系列用のビジョン トランスフォーマー
Michail Tarasiou、Erik Chavez、Stefanos Zafeiriou
OmniMAE: 画像とビデオに対する単一モデルのマスクされた事前トレーニング
Rohit Girdhar、Alaaeldin El-Nouby、Mannat Singh、Kalyan Vasudev Alwala、Armand Joulin、Ishan Misra
BASiS : バッチ アラインメント スペクトル埋め込みスペース
または Streicher · Ido Cohen · Guy Gilboa
自己教師あり学習のための進化部分マスキング
Zhanzhou FENG · Shiliang Shiliang
マスクされたイメージ モデリングのためのハード パッチ マイニング
Haochen Wang · Kaiyou Song · Junsong Fan · Yuxi Wang · Jin Xie · Zhaoxiang自己教師ありの顔表現のためのZhang
ポーズ解きほぐし対照学習
Yuanyuan Liu Wenbin Wang Yibing Zhan Shaoze Feng Kejun Liu Zhe Chen
OpenGait: 実用性の向上に向けて歩行認識の再検討
Chao Fan Junhao Liang Chuanfu Shen Saihui Hou Yongzhen Huang Shiqi Yu 自己
回帰視覚追跡
Xing Wei Yif an Bai · Yongchao Zheng · Dahu Shi · Yihong Gong
観察-Centric SORT: 堅牢なマルチオブジェクト追跡のための SORT の再考
Jinkun Cao、Jiangmiao Pang、Xinshuo Weng、Rawal Khirodkar、Kris Kiradkar
GazeNeRF: Neural Radiance Fields による 3D 認識の視線リダイレクト
Alessandro Ruzzi、Xiangwei Shi、Xi Wang、Gengyan Li、Shalini De Mello、Hyung Jin Chang、Xucong Zhang、Otmar Hilliges
Phone2Proc: 混沌とした世界に堅牢なロボットを導入
Matt Deitke · Rose Hendrix · Ali Farhadi · Kiana Ehsani · Aniruddha Kembhavi
Learning Human-to-Robot Handovers from Point Clouds
Sammy Christen · Wei Yang · Claudia Pérez-D’Arpino · Otmar Hilliges · Dieter Fox · Yu-Wei Chao
MotionDiffuser: Controllable Multi-Agent Motion Prediction using Diffusion
Chiyu Jiang · Andre Cornman · Cheolho Park · Benjamin Sapp · Yin Zhou · Dragomir Anguelov
Uncovering the Missing Pattern: Unified Framework Towards Trajectory Imputation and Prediction
Yi Xu · Armin Bazarjani · Hyung-gun Chi · Chiho Choi · Yun Fu
MixSim: A Hierarchical Framework for Mixed Reality Traffic Simulation
Simon Suo · Kelvin Wong · Justin Xu · James Tu · Alexander Cui · Sergio Casas · Raquel Urtasun
自動運転における統合知覚を促すビジュアル模範駆動タスク
Xiwen Liang Minzhe Niu Jianhua Han Hang Xu Chunjing Xu Xiaodan Liang
Are We Ready for Vision-Centric Driving Streaming Perception? ASAP ベンチマーク
Xiaofeng Wang Zh eng Zhu Yunpeng Zhang Guan Huang Yun Ye Wenbo Xu Ziwei Chen Xingang Wang
BAEFormer: 鳥瞰図セマンティック セグメンテーション用の双方向および初期インタラクション トランスフォーマー
Cong Pan Yonghao He Junran Peng Qian Zhang Wei Sou Zhaoxiang Zhang
PVO: Panoptic Visual Odometry
Weicai Ye Xinyue Lan SHUO CHEN Yuhang Ming Xingyuan Yu Hujun Bao Zhaopeng Cui Guofeng Zhang
霧のシーンのオプティカル フローに対する教師なし累積ドメイン適応
Zhou Hanyu · Yi Chang · YAN WENDING · Luxin Yan
ドメイン 階層的視覚変換による一般化ステレオマッチング
Tianyu Chang · Xun Yang · Tianzhu Zhang · Meng Wang
漸進的グラフマッチングと代替学習による教師なし可視赤外線人物再識別
Wu Zes en Mang Ye
幾何学的視覚的類似性 3D 医療画像での学習 自己教師あり事前トレーニング
Yuting He Guanyu Yang Rongjun Ge Yang Chen Jean-louis Coatrieux Boyu Wang Shuo Li
Progressive Neighbor Consistency Mining for Correspondence Pruning
Xin Liu Jufeng Yang
Visual Prompt マルチモーダル トラッキング
Jiawen Zhuシミアオ・ライ・シン・チェン・ドンワン・フーチュアン・ルー
Robust Multiview Point Cloud Registration with Reliable Pose Graph Initialization and History Reweighting
Haiping Wang · Yuan Liu · Zhen Dong · Yulan Guo · Yushen Liu · Wenping Wang · Bisheng Yang
PointCert: Point Cloud Classification with Deterministic Certified Robustness Guarantees
Jinghuai Zhang · Jinyuan Jia · Hongbin Liu · Neil Gong
Rethinking the Approximation Error in 3D Surface Fitting for Point Cloud Normal Estimation
Hang Du · Xuejun Yan · Jingjing Wang · Di Xie · Shiliang Pu
FAC: 3D Representation Learning via Foreground Aware Feature Contrast
Kangcheng Liu · Aoran Xiao · Xiaoqin Zhang · Shijian Lu · Ling Shao
ProxyFormer: Proxy Alignment Assisted Point Cloud Completion with Missing Part Sensitive Transformer
Shanshan Li Pan Gao Xiaoyang Tan Mingqiang Wei
PointVector: 点群解析におけるベクトル表現
Xin Deng wenyu Zhang Qing Ding Xinming Zhang
直線流による高速点群生成
Lemeng Wu Dilin Wang Chengyue Gong Xingchao Liu Yunyang Xiong · Rakesh Ranjan · Raguraman Krishnamoorthi · Vikas Chandra · qiang liu
ACL-SPC: 自己教師あり点群完成のための適応閉ループ システム
Sangmin Hon · Mohsen Yavartanoo · Reyhaneh Neshatavar Hahighi Sriz · Kyoung Mu Lee
Adversarial Prototype Framework による点群のオープンセット Se Mantic Segmentation
Jianan Li · Qiulei Dong
GD-MAE: LiDAR 点群での MAE 事前トレーニング用の生成デコーダー
Honhui Yang · Tong He · Jiaheng Liu · Hua Chen · Boxi Wu · Binbin Lin · Xiaofei He · Wanli Ouyang
3D 点群セマンティック セグメンテーションのための Novel Class Discovery
Luigi Riz · Cristiano Saltori · Elisa Ricci · Fabio Poiesi
野生の 3D セマンティック セグメンテーション:逆境点群の一般化モデルの学習
Aoran Xiao Jiaxing Huang Weihao Xuan Ruijie Ren Kangcheng Liu Dayan Guan Abdulmotaleb El Saddik Shijian Lu Eric Xing
Less is More: 3D 点群セマンティック セグメンテーションのタスクとモデルの複雑さの軽減
Li Li · Hubert PH Shum · Toby Breckon
LiDAR セマンティック セグメンテーションのためのインスタント ドメイン拡張
Kwonyoung Ryu、Soonmin Hwang、Jaesik Park
Hidden Gems: 4D Radar Scene Flow Learning Using Cross-Modal Supervision
Fangqiang Ding · Andras Palffy · Dariu Gavrila · Xiaoxuan Lu
MoDAR: Using Motion Forecasting for 3D Object Detection in Point Cloud Sequences
Yingwei Li · Charles R. Qi · Yin Zhou · Chenxi Liu · Dragomir Anguelov
Towards Unsupervised Object Detection from LiDAR Point Clouds
Lunjun Zhang · Anqi Joyce Yang · Yuwen Xiong · Sergio Casas · Bin Yang · Mengye Ren · Raquel Urtasun
DeepMapping2: Self-supervised Large-scale LiDAR Map Optimization
Chao Chen · Xinhao Liu · Yiming Li · Li Ding · Chen Feng
ConQueR: Query Contrast Voxel-DETR for 3D Object Detection
Benjin ZHU · Zhe Wang · Shaoshuai Shi · Hang Xu · Lanqing HONG · Hongsheng Li
SGLoc: 屋外 LiDAR 位置特定のためのシーン ジオメトリ エンコーディング
Wen Li、Shangshu Yu、Cheng Wang、Guosheng Hu、Siqi Shen、Chenglu Wen
カメラ画像とミリ波レーダー点群からの深度推定
Akash Deep Singh、Yunhao Ba、Ankur Sarker、Howard Zhang、Achuta Kadambi · Stefano Soatto · Mani Srivastava · Alex Wong
信頼性の高い不確実性の定量化とキャリブレーションによる自己認識物体検出器の構築に向けて
Kemal Oksuz · Tom Joy · Puneet Dokania
Uni3D: マルチデータセット 3D 物体検出のための統一ベースライン
Bo Zhang · Jiakang Yuan · Botian Shi Tao Chen Yikang LI Yu Qiao との
コラボレーションにより、3D 検出でカメラが LiDAR を追い越す
Yue Hu Yifan Lu Runsheng Xu Weidi Xie Siheng Chen Yanfeng Wang
BEV@DC: Bird’s-Eye View Assisted Training for Depth Completion
Wending Zhou · Xu Yan · Yinghong Liao · Yuankai Lin · Jin Huang · Gangming Zhao · Shuguang Cui · Zhen Li
Tri-Perspective View for Vision-Based 3D Semantic Occupancy Prediction
Yuanhui Huang · Wenzhao Zheng · Yunpeng Zhang · Jie Zhou · Jiwen Lu
Viewpoint Equivariance for Multi-View 3D Object Detection
Dian Chen · Jie Li · Vitor Guizilini · Rareș Ambruș · Adrien Gaidon
3D Concept Learning and Reasoning from Multi-View Images
Yining Hong · Chunru Lin · Yilun Du · Zhenfang Chen · Joshua Tenenbaum · Chuang Gan
Role of Transients in Two-Bounce Non-Line-of-Sight Imaging
Siddharth Somasundaram · Akshat Dave · Connor Henley · Ashok Veeraraghavan · Ramesh Raskar
点群でのシーングラフ予測のための 3D 空間マルチモーダル知識の蓄積
Mingtao Fng · Haran Hou · LIANG ZIANG · Zijie Wu · Yulan Ajmal Mian Re ·
VISITING The Stack-Based Inverse Tone Mapping
Ning ZHANG · YUYAO Ye · Yang Zhao · Ronggang
Mvimgnet: Aマルチビュー画像の大規模データセットXianggang Yu Mutian Xu Yidan Zhang Haolin Liu Chongjie Ye Yushuang Wu Zizheng Yan Chenming Zhu Zhangyang Xiong Tianyou Liang Guanying Chen Shuguang Cui Xiaoguang Han焦点ぼけからの
完全自己監視深度推定 手がかり Haozhe Si Bin Zhao Dong Wang Yunpeng Gao Mulin Chen Zhigang Wang Xuelong Li Zero-Shot デュアルレンズ超解像Ruikang Xu Mingde Yao Zhiwei Xiong




ポイントベースフュージョンを使用した時間的に一貫したオンライン深度推定
Numair Khan · Eric Penner · Douglas Lanman · Lei Xiao
二重対応によるビデオからのミラー検出の学習
Jiaying Lin · Xin Tan · Lynson Lau
ビジュアルナビゲーションのためのレンダリング可能なニューラルラディアンスマップ
obin kwon · Jeongho Park · Songhwai Oh
VoxFormer: カメラベースの 3D セマンティック シーン完成のためのスパース ボクセル トランスフォーマー
Yiming Li · Zhiding Yu · Chris Choy · Chaowei Xiao · Jose Alvarez · Sanja Fidler · Chen Feng · Anima Anandkumar
舞台裏: シングル ビュー再構築のための密度フィールド
Felix Wimbauer、Nan Yang、Christian Rupprecht、Daniel Cremers
3D 再構成のためのマルチビュー圧縮コーディング
Chao-Yuan Wu、Justin Johnson、Jitendra Malik、Christoph Feichtenhofer、Georgia Gkioxari
暗黙的な深さによる仮想オクルージョン
Jamie Watson、Mohamed Sayed、Zawar Imam Qureshi、Gabriel Brostow、Sara Vicente、Oisin Aodha、Michael Firman ニューラルを使用した
3D シーン理解のためのパノプティック リフティング分野
Yawar Siddiqui · Lorenzo Porzi · Samuel Rota Bulò · Norman Müller · Matthias Niessner · Angela Dai · Peter Kontschieder
Neural Part Priors: Learning to Optimize Part-Based Object Completion in RGB-D Scans
Alexey Bokhovkin · Angela Dai
BAAM: 単眼 3D ポーズとバイコンテキスト注意モジュールと注意誘導モデリングによる形状再構築
Hyo-Jun Lee、Hanul Kim、Su-Min Choi、Seong-Gyun Jeong、Yeon Jun Koh
BKinD-3D: Self-Supervised 3D Keypoint Discovery from Multi-View Videos
Jennifer J. Sun · Lili Karashchuk · Amil Dravid · Serim Ryou · Sonia Fereidooni · John Tuthill · Aggelos Katsaggelos · Bingni Brunton · Georgia Gkioxari · Ann Kennedy · Yisong Yue · Pietro Perona
Four-view geometry with unknown radial distortion
Petr Hrubý · Viktor Korotynskiy · Timothy Duff · Luke Oeding · Marc Pollefeys · Tomas Pajdla · Viktor Larsson
Two-view Geometry Scoring Without Correspondences
Axel Barroso-Laguna · Eric Brachmann · Victor Prisacariu · Gabriel Brostow · Daniyar Turmukhambetov
Neural Voting Field for Camera-Space 3D Hand Pose Estimation
Lin Huang · Chung-Ching Lin · Kevin Lin · Lin Liang · Lijuan Wang · Junsong Yuan · Zicheng Liu
expOSE: Accurate Initialization-Free Projective Factorization using Exponential Regularization
José Iglesias Iglesias · Amanda Nilsson · Carl Olsson
Object Pose Estimation with Statistical Guarantees: Conformal Keypoint Detection and Geometric Uncertainty Propagation
Heng Yang · Marco Pavone
Crowd3D: Towards Hundreds of People Reconstruction from a Single Image
Hao Wen · Jing Huang · Huili Cui · Haozhe Lin · Yu-Kun Lai · LU FANG · Kun Li
Rigidity-Aware Detection for 6D Object Pose Estimation
Hai Yang · Rui Song · Jiaojiao Li · Mathieu Salzmann · Yinlin Hu
Robot Structure Prior Guided Temporal Attention for Camera-to-Robot Pose Estimation from Image Sequence
Yang Tian · Jiyao Zhang · Zekai Yin · Hao Dong
GFIE: A Dataset and Baseline for Gaze-Following from 2D to 3D in Indoor Environments
Zhengxi Hu · Yuxue Yang · Xiaolin Zhai · Dingye Yang · Bohan Zhou · Jingtai Liu
TokenHPE: Learning Orientation Tokens for Efficient Head Pose Estimation via Transformers
Cheng Zhang · Hai Liu · Yongjian Deng · Bochen Xie · Youfu Li
Global-to-Local Modeling for Video-based 3D Human Pose and Shape Estimation
Xiaolong Shen · Zongxin Yang · Xiaohan Wang · Jianxin Ma · Chang Zhou · Yi Yang
PoseFormerV2: Exploring Frequency Domain for Efficient and Robust 3D Human Pose Estimation
Qitao Zhao · Ce Zheng · Mengyuan Liu · Pichao WANG · Chen Chen
BITE: Beyond Priors for Improved Three-D Dog Pose Estimation
Nadine Rueegg · Shashank Tripathi · Konrad Schindler · Michael Black · Silvia Zuffi
TRACE: 3D 環境におけるダイナミック カメラによるアバターの 5D 時間回帰
Yu Sun · Qian Bao · Wu Liu · Tao Mei · Michael Black
NeuralDome: A Neural Modeling Pipeline on Mult i - ヒューマンオブジェクトインタラクションを見る
Juze Zhang Haimin Luo Hondi Yang Xinru Xu Qianyang Wu Ye Shi Jingyi Yu Lan Xu Jingya Wang
動的オブジェクトのターゲット参照リアクティブ把握
Jiron Liu Ruo Zhang Hao-Shu Fang Minghao Gou Honjie Fang Chenxi Wang Sheng Xu Hengxu Yan Cewu Lu
コマンド駆動の多関節オブジェクトの理解と操作
Ruihang Chu Zhengzhe Liu Xiaoqing Ye Xiao Tan XIAOJUAN QI Chi-Wing Fu Jiaya Jia
手持ちオブジェクト再構築のための視覚触覚センシング
Wenqiang Xu · Zhenjun Yu · Han Xue · Ruolin Ye · Siqiong Yao · Cewu Lu
MagicPony: Learning Articulated 3D Animals in the Wild
Shangzhe Wu · Ruining Li · Tomas Jakab · Christian Rupprecht · Andrea Vedaldi
ヒューマン メッシュ回復のための分析的事後確率の学習
Qi Fang Kang Chen Yinghui Fan Qing Shuai Jiefeng Li Weidong Zhang
Marching-Primitives: Shape Abstraction from Signed Distance Function
Weixiao Liu Yuwei Wu Sipu Ruan Gregory Chirikzian Le听数
分での動的人間のニューラル容積表現
Chen Gengシダ・ペンジェン・シュー・フジュン・バオ・シャオウェイ・ジョウ
Complete 3D Human Reconstruction from a Single Incomplete Image
Junying Wang · Jae Shin Yoon · Tuanfeng Wang · Krishna Kumar Singh · Ulrich Neumann
DIFu: Depth-guided Implicit Function for Clothed Human Reconstruction
Dae-Young Song · HeeKyung Lee · Jeongil Seo · Donghyeon Cho
BEDLAM: A Synthetic Dataset of Bodies Exhibiting Detailed Lifelike Animated Motion
Michael Black · Priyanka Patel · Joachim Tesch · Jinlong Yang
Invertible Neural Skinning
Yash Kant · Aliaksandr Siarohin · Riza Alp Guler · Menglei Chai · Jian Ren · Sergey Tulyakov · Igor Gilitschenski
Zero-shot Pose Transfer for Unrigged Stylized 3D Characters
Jiashun Wang · Xueting Li · Sifei Liu · Shalini De Mello · Orazio Gallo · Xiaolong Wang · Jan Kautz
力のモデリングによるバイオメカニクスに基づく顔の動作単位の検出
Zijun Cui Chenyi Kuang Tian Gao Kartik Talamadupula Qiang Ji
手のアバター: 単眼ビデオからの自由ポーズの手のアニメーションとレンダリング
Xingyu Chen Baoyuan Wang Heung-Yeung Shum
ハイファイ都市の服を着たアバターの再構築単一の画像
Tingting Liao Xiaomei Zhang Yuliang Xiu Honwei Yi Xudong Liu Guo-Jun Qi Yong Zhang Xuan Wang Xiangyu Zhu Zhen Lei NeuWigs :
ボリュームヘアキャプチャとアニメーション用のニューラルダイナミックモデル
Ziyan Wang Giljoo Nam Tuur Stuyck Stephen Lombardi Chen Cao Jason Saragih Michael Zollhöfer ジェシカ・ホッジンズ Christoph Lassner
FitMe: ディープ フォトリアリスティック 3D モーフィング モデル アバター
Alexandros Lattas · Stylianos Moschoglou · Stylianos Ploumpis · Baris Gecer · Jiankang Deng · Stefanos Zafeiriou
FaceLit: Neural 3D Relightable Faces
Anurag Ranjan · Kwang Moo Yi · Jen-Hao Chang · Oncel Tuzel
低コスト データからの変形可能な顔反射モデルの学習
Yuxuan Han · Zhibo Wang · Feng Xu
地域 GAN 反転によるきめ細かいフェイス スワッピング
Zhian Liu · Maomao Li · Yong Zhang · Cairong Wang · Qi Zhang · Jue Wang · Yongwei Nie
DiffSwap: 3D による高忠実度で制御可能なフェイス スワッピング - Aware Masked Diffusion
Wenliang Zhao、Yongming Rao、Weikang Shi、Zuyan Liu、Jie Zhou、Jiwen Lu
部品取得とアセンブリによる教師なし 3D 形状再構築
Xianghao Xu Paul Guerrero Matthew Fisher Siddhartha Chaudhuri Daniel Ritchie
PREIM3D: 単一画像からの 3D 一貫性のある正確な画像属性編集
Jianhui Li Jianmin Li Haoji Zhang Shilong Liu Zhengyi Wang Zihao Xiao Kaiwen Zheng Jun Zhu NeRF
インバータ : シングル用の高忠実度 NeRF-GAN インバージョンショット リアル イメージ アニメーション
Yu ying Kamran Ghasedi HsiangTao Wu Jiaolong Yang Xin Tong Yun Fu
3D 対応画像合成におけるカスタム属性の定量的操作
Hoseok Do EunKyung Yu Taehyang Kim · Chul Lee · Jin Choi
SinGRAF: Learning a 3D Generative Radiance Field for a Singleシーン
ソン・ミンジョン、パク・ジョンジュン、レオニダス・ギバス、ゴードン・ウェッツスタイン
NeuralField-LDM: Scene Generation with Hierarchical Latent Diffusion Models
Seung Wook Kim · Bradley Brown · Kangxue Yin · Karsten Kreis · Katja Schwarz · Daiqing Li · Robin Rombach · Antonio Torralba · Sanja Fidler
NEF: Neural Edge Fields for 3D Parametric Curve Reconstruction from Multi-view Images
Yunfan Ye · Renjiao Yi · Zhirui Gao · Chenyang Zhu · Zhiping Cai · Kai Xu
NeuDA: Neural Deformable Anchor for High-Fidelity Implicit Surface Reconstruction
Bowen Cai · Jinchi Huang · Rongfei Jia · chengfei lv · Huan Fu
PermutoSDF: Fast Multi-View Reconstruction with Implicit Surfaces using Permutohedral Lattices
Radu Alexandru Rosu · Sven Behnke
Neuralangelo: High-Fidelity Neural Surface Reconstruction
Zhaoshuo Li · Thomas Müller · Alex Evans · Russ Taylor · Mathias Unberath · Ming-Yu Liu · Chen-Hsuan Lin
RealFusion: 360

Reconstruction of Any Object from a Single Image
Luke Melas-Kyriazi · Iro Laina · Christian Rupprecht · Andrea Vedaldi
Neural Lens Modeling
Wenqi Xian · Aljaz Bozic · Noah Snavely · Christoph Lassner
RGBD2: Generative Scene Synthesis via Incremental View Inpainting using RGBD Diffusion Models
Jiabao Lei · Jiapeng Tang · Kui Jia
Controllable Light Diffusion for Portraits
David Futschik · Kelvin Ritland · James Vecore · Sean Fanello · Sergio Orts-Escolano · Brian Curless · Daniel Sýkora · Rohit Pandey
Weakly-supervised Single-view Image Relighting
Renjiao Yi · Chenyang Zhu · Kai Xu
MAIR: 3D 空間的に変化する照明推定によるマルチビュー アテンション インバース レンダリング
JunYong Choi · SeokYeong Lee · Haesol Park · Seung-Won Jung · Ig-Jae Kim · Junghyun Cho
DANI-Net: 未校正測光微分可能なシャドウ処理、異方性反射モデリング、およびニューラル逆レンダリングによるステレオ
Zongrui Li Qian Zheng Boxin Shi Gang Pan Xudong Jiang
ニューラル フィールドと都市シーンの逆レンダリングのための明示的な幾何学的表現の出会い
Zian Wang Tianchang Shen Jun Gao · SHENGYU HUANG · Jacob Munkberg · Jon Hasselgren、Zan Gojcic、Wenzheng Chen、Sanja Fidler
ポインターセクト: クラウドとレイの交差によるニューラル レンダリング
Jen-Hao Chang · Wei-Yu Chen · Anurag Ranjan · Kwang Moo Yi · Oncel Tuzel
Point2Pix: Neural Radiance Fields によるフォトリアリスティックな点群レンダリング
Tao Hu · Xiaogang Xu · Shu Liu · Jiaya Jia
StyleRF: ゼロショット 3D スタイル転送神経放射フィールドの研究
Kunhao Liu Fangneng Zhan Yiwen Chen Jiahui Zhang Yingchen Yu Abdulmotaleb El Saddik Shijian Lu Eric Xing EditableNeRF:
キー ポイントによるトポロジカルに変化する神経放射フィールドの編集
Chengwei Zheng Wenbin Lin Feng Xu
リアルタイム ビュー合成のための神経二重放射フィールドの学習
Ziyuワン・クリスチャン・リチャード・アルジャズ・ボジック・チャオ・リー・ヴィジェイ・レンガラジャン・ソンヒョン・ナム・シャオユー・シャン・トゥオトゥオ・リー・ボー・ズー・ラケシュ・ランジャン・ジン・リャオ
大規模な都市シーンのためのグリッド ガイド ニューラル ラディアンス フィールド
LINING xu · Yuanbo xiangli · Sida Peng · Xingang Pan · Nanxuan Zhao · Christian Thebalt · Bo Dai · DAHUA Lin Nerf-
DS: 動的鏡面オブジェクトのためのニューラル ラディアンス フィールド
zhiwen yan · Chen Li · Gim Lee
Nerflets: 2D 監督による効率的な構造認識型 3D シーン表現のためのローカル ラジエンス フィールド
Xiaoshuai Zhang Abhijit Kundu Thomas Funkhouser Leonidas Guibas Hao Su Kyle Genova
バンドル調整ニューラル ラジエンス フィールドのローカルからグローバルへの登録
Yue Chen · Xingyu Chen · Xuan Wang · Qi Zhang · Yu Guo · Ying Shan · Fei Wang
FreeNeRF: 自由周波数正則化による少数ショット ニューラル レンダリングの改善
Jiawei Yang · Marco Pavone · Yue Wang
RefSR-NeRF: 高忠実度および超解像度のビュー合成に向けて
Xudong Huang Wei Li Jie Hu Hanting Chen Yunhe Wang
掃引角合成波長干渉計
Alankar Kotwal Anat Levin Ioannis Gkioulekas
画像偽造ローカライゼーションのためのエッジ認識地域メッセージ パッシング コントローラー
Dong Li Jiaying Zhu Menglu Wang Jiawei Liu Xueyang Fu Zheng-Jun Zha
敵対的堅牢性のための残留ネットワークの再考
Shihua Huang Zhichao Lu Kalyanmoy Deb Vishnu Naresh Boddeti
CFA: クラスごとに調整された公正な敵対的トレーニング
Zem ing wei · Yifei Wang · Yiwen Guo · Yisen Wang
機能の分離と再調整敵対的な堅牢性のために
Woo Jae Kim、Yoonki Cho、Junsik Jung、Sung-eui Yuon
パス拡張法による敵対的サンプルの転送可能性の向上
Jianping Zhang、Jen-tse Huang、Wenxuan Wang、Yichen LI、Weibin Wu、Xiaosen Wang、Yuxin Su、Michael Lyu
StyLess: 敵対的な例の転送可能性の向上
Kaisheng Liang Bin Xiao
Minimizing Maximum Model Discripancy for Transferable Black-box Targeted Attack
Anqi Zhao Tong Chu Yahao Liu Wen Li Jingjing Li Lixin Duan
Adversarily Robust Neural Architecture S search for Graph Neural Networks
Beini Xie · Heng Chang · Ziwei Zhang · Xin Wang · Daixin Wang · Zhiqiang Zhang · Rex Ying · Wenwu Zhu
カラーバックドア: カラー空間における強力なポイズニング攻撃
Wenbo Jiang · Hongwei Li · Guowen Xu · Tianwei Zhang
Effective Ambiguity Attack Against Passport-based DNN Intellectual Property Protection Schemes through Fully Connected Layer Substitution
Yiming Chen · Jinyu Tian · Xiangyu Chen · Jiantao Zhou
Single Image Backdoor Inversion via Robust Smoothed Classifiers
Mingjie Sun · J Kolter
Multi-view Adversarial Discriminator: Mine the Non-causal Factors for Object Detection in Unseen Domains
Mingjun Xu · Lingyun Qin · Weijie Chen · Shiliang Pu · Lei Zhang
RiDDLE: Reversible and Diversified De-identification with Latent Encryptor
Dongze Li · Wei Wang · Kang Zhao · Jing Dong · Tieniu Tan
CaPriDe Learning: Confidential and Private Decentralized Learning based on Encryption-friendly Distillation Loss
Nurbek Tastan · Karthik Nandakumar
Federated Learning with Data-Agnostic Distribution Fusion
Jian-hui Duan · Wenzhong Li · Derun Zou · Ruichen Li · Sanglu Lu
Learning Federated Visual Prompt in Null Space for MRI Reconstruction
Chun-Mei Feng · Bangjun Li · Xinxing Xu · Yong Liu · Huazhu Fu · Wangmeng Zuo
Decentralized Learning with Multi-Headed Distillation
Andrey Zhmoginov · Mark Sandler · Nolan Miller · Gus Kristiansen · Max Vladymyrov
Efficient Second-Order Plane Adjustment
Lipu Zhou
Learning Correspondence Uncertainty via Differentiable Nonlinear Least Squares
Dominik Muhle · Lukas Koestler · Krishna Murthy Jatavallabhula · Daniel Cremers
Learning Articulated Shape with Keypoint Pseudo-labels from Web Images
Anastasis Stathopoulos · Georgios Pavlakos · Ligong Han · Dimitris Metaxas
ObjectMatch: Robust Registration using Canonical Object Correspondences
Can Gümeli · Angela Dai · Matthias Niessner
Pose Synchronization under Multiple Pair-wise Relative Poses
Yifan Sun · Qixing Huang
MammalNet: A Large-scale Video Benchmark for Mammal Recognition and Behavior Understanding
Jun Chen · Ming Hu · Darren Coker · Michael L. Berumen · Blair Costelloe · Sara Beery · Anna Rohrbach · Mohamed Elhoseiny
DiffPose: Toward More Reliable 3D Pose Estimation
GONG JIA、Lin Geng Foo、Zhipeng Fan、Qiuhong Ke、Hossein Rahmani、Jun Liu
シーンを意識した自己中心的な 3D 人間のポーズ推定
Jian Wang、Diogo Luvizon、Weipeng Xu、Lingjie Liu、Kripasindhu Sarkar、Christian Thebalt
統一ポーズ シーケンス モデリング
Lin Geng Foo · Tianjiao Li · Hossein Rahmani · Qiuhong Ke · Jun Liu
ボトムアップ人間姿勢推定のための特性関数ベースの手法
Haoxuan Qu · Yujun Cai · Lin Geng Foo · Ajay Kumar · Jun Liu
AssemblyHands: Towards Egocentric activity Understanding via 3D H and姿勢推定
大川武彦 · Kun He · Fadime Sener · Tomas Hodan · LUAN TRAN · Cem Keskin
インタラクティブな手と物体の姿勢推定のための調和特徴学習
Zhifeng Lin · Changxing Ding · Huan Yao · Zengsheng Kuang · Shaoli Huang
CIMI4D: ヒューマンシーンインタラクション下の大規模マルチモーダルクライミングモーションデータセット
Ming Yan · Xin Wang · Yudi Dai · Siqi Shen · Chenglu Wen · Lan Xu · Yuexin Ma · Cheng Wang
MIME: 人間を意識した 3D シーン生成
Honwei Yi Chun-Hao Huang Shashank Tripathi Lea Hering Justus Thies Michael Black
ACR: Attendance Collaboration-based Regressor for Arbitrary Two-Hand Reconstruction
Zhengdi Yu Shaoli Huang Chen Fang Toby Breckon Jue Wang
ARCTIC: A Dataset for器用な両手によるハンドオブジェクト操作
ジコン・ファン オミッド・タヘリ ディミトリオス・ツィオナス ムハメド・コカバス マヌエル・カウフマン マイケル・ブラック オトマール・ヒリゲス
NIKI: 3D 人間の姿勢と形状推定のための可逆ニューラル ネットワークを使用したニューラル インバース キネマティクス
Jiefeng Li · Siyuan Bian · Qi Liu · Jiasheng Tang · Fan Wang · Cewu Lu
P
C
2
: 単一画像 3D 再構成のための投影条件付き点群拡散
Luke Melas-Kyriazi · Christian Rupprecht · Andrea Vedaldi
ShapeClipper: 幾何学的および CLIP ベースの一貫性を介してシングルビュー画像から学習するスケーラブルな 3D 形状
Zixuan Huang · Varun Jampani · Ngoc Anh Thai · Yuanzhen Li · Stefan Stojanov · James Rehg による
人体形状の完成暗黙的な形状とフローの学習
Boyao Zhou、Di Meng、Jean-Sébastien Franco、Edmond Boyer
gSDF: 3D ハンドオブジェクト再構成のためのジオメトリ駆動の符号付き距離関数
Zerui Chen、Shizhe Chen、Cordelia Schmid、Ivan Laptev
サンプリングは重要です: ポイントガイドによる 3D ヒューマン メッシュ再構成
Jeong Hwan Kim、Mi-Gung Gwon、Hyukmin Kwon · Gi-Mun Um · Wonjun Kim
単一の 2K 解像度画像からの高忠実度 3D 人間デジタル化
Sang-Hun Han · Min-Gyu Park · Ju Yuon · Ju-Mi Kang · YOUNG-JAE PARK · Hae-Gon Jeon
Vid2Avatar: 3D アバター自己教師付きシーン分解による野生のビデオからの再構成
Chen Guo · Tianjian Jiang · Xu Chen · Jie Song · Otmar Hilliges
CLOTH4D: 着衣人間再構成用データセット
XINGXING ZOU · Xintong Han · Waikeung Wong
RaBit: トポロジー的に一貫したデータセットを使用した 3D 二足歩行漫画キャラクターのパラメトリック モデリング
Zhongjin Luo Shengcai Cai Jinguo Dong Ruibo Ming Liangdong Qiu Xiaohang Zhan Xiaoguang Han
OmniAvatar: Geometry-Guided Controlable 3D Head Synthesis
Honyi Xu · Guoxian Song · Zihang Jiang Jianfeng Zhang Ychun Shi Jing Liu Wanchun Ma Jiashi Feng Linjie Luo
HARP: 単眼 RGB ビデオからのパーソナライズされた手の再構成
Korrawe Karunratanakul Sergey Prokudin Otmar Hilliges Siyu Tang
言語事前予測を使用してビデオから署名アバターを再構成
Maria-Paola Forte · Peter Kulits · Chun-Hao Huang · Vasileios Choutas ·ディミトリオス・ツィオナス · キャサリン・J・クーヘンベッカー · マイケル・ブラック
CodeTalker: Speech-Driven 3D Facial Animation with Discrete Motion Prior
Jinbo Xing · Menghan Xia · Yuechen ZHANG · Xiaodong Cun · Jue Wang · Tien-Tsin Wong
MEGANE: Morphable Eyeglass and Avatar Network
Junxuan Li · Shunsuke Saito · Tomas Simon · Stephen Lombardi · Hongdong Li · Jason Saragih
Parametric Implicit Face Representation for Audio-Driven Facial Reenactment
Ricong Huang · Peiwen Lai · Yipeng Qin · Guanbin Li
3D-aware Facial Landmark Detection via Multi-view Consistent Training on Synthetic Data
Libing Zeng · Lele Chen · Wentao Bao · Zhong Li · Yi Xu · Junsong Yuan · Nima Kalantari
DiffusionRig: Learning Personalized Priors for Facial Appearance Editing
Zheng Ding、Cecilia Zhang、Zhihao Xia、Lars Jebe、Zhuowen Tu、Xiuming Zhang
HairStep: シングルビュー 3D ヘア モデリングのためのストランド マップとデプス マップを使用した合成からリアルへの転送
Yujian Zheng、Zi-Rong Jin、Moran Li、Haibin Huang、Chongyang Ma Shuguang Cui Xiaoguang Han
DCFace: デュアル条件拡散モデルを使用した合成顔の生成
Minchul Kim Feng Liu Anil Jain Xiaoming Liu
3D 認識フェイス スワッピング
Yixuan Li Chao Ma Ychao Yan Wenhan Zhu Xiaokang Yang
CoralStyleCLIP: 画像編集のための共同最適化された領域とレイヤーの選択
Ambareesh Revanur Debraj Basu Shradha Agrawal Dhwanit Agarwal Deepak Pai
CLIP 知識の 3D 蒸留によるローカル 3D 編集
Junha Hyung · Sungwon Hwang · Daejin Kim · Hyunji Lee · Jaegul Choo
Latent-NeRF for Shape-Guided Generation of 3D Shapes and Textures
Gal Metzer · Elad Richardson · Or Patashnik · Raja Giryes · Daniel Cohen-Or
3D-aware multi-class image-to-image translation with NeRFs
Senmao Li · Joost van de Weijer · Yaxing Wang · Fahad Khan · Meiqin Liu · jian Yang
Diffusion-SDF: Text-to-Shape via Voxelized Diffusion
Muheng Li · Yueqi Duan · Jie Zhou · Jiwen Lu
Infinite Photorealistic Worlds using Procedural Generation
Alexander Raistrick · Lahav Lipson · Zeyu Ma · Lingjie Mei · Mingzhe Wang · Yiming Zuo · Karhan Kayan · Hongyu Wen · Beining Han · Yihan Wang · Alejandro Newell · Hei Law · Ankit Goyal · Kaiyu Yang · Jia Deng
スコア ヤコビアン チェーン: 3D 生成のための事前トレーニング済み 2D 拡散モデルのリフティング
Haochen Wang、Xiaodan Du、Jiahao Li、Raymond A. Yeh、Greg Shakhnarovich
RenderDiffusion: 3D 再構築、修復、生成のための画像拡散
Titas Anciukevicius、Zexiang Xu、Matthew Fisher、Paul Henderson · Hakan Bilen · Niloy Mitra · Paul Guerrero
PET-NeuS: 神経表面の位置エンコーディング トライプレーン
Yiqun Wang · Ivan Skurokhodov · Peter Wonka
SparseFusion: 3D 再構成のための視野条件付き拡散の蒸留
Zhizhuo Zhou · Shubham Tulsiani
Dionysus: Recovering Scene Structuresセマンティックピースへの分割
Likang Wang・Lei Chen
半透明のワームの 3D 形状再構成
Thomas Ilett · Omer Yuval · Thomas Ranner · Netta Cohen · David Hogg
Seeing Through the Glass: Neural 3D Reconstruction of Object Inside a Transparent Container
Jimangang Tong · Sundaram Muthu · Fahira Afzal Maken · Chuong Nguyen · Hondong Li
HumanGen: Generating Human Radiance Fields with with明示的な先駆者
Suyi Jiang、Haoran Jiang、Ziyu Wang、Haaimin Luo、Wenzheng Chen、Lan Xu
電球としての人間: 熱反射からの 3D 人間の再構成
Ruoshi Liu、Carl Vondrick
偶然の光プローブ
、Hong-Xing Yu、Samir Agarwala、Charles Herrmann、Richard Szeliski · Noah Snavely · Jiajun Wu · Deqing Sun
物理レンダラーとニューラル レンダラーを使用した半透明オブジェクトの逆レンダリング
Chenhao Li、Trung Ngo、永原一
大規模な現実世界の屋内シーンのためのマルチビュー逆レンダリング
Zhen Li、Lingli Wang、Mofang Cheng、Cihui Pan、Jiaqi Yang
K-Planes: Explicit Radiance Fields in Space, Time, and Appearance
Sara Fridovich-Keil · Giacomo Meanti · Frederik Warburg · Benjamin Recht · Angjoo金沢
2D および 3D 離散化グリッドに基づく効率的な地図のスパース化
Xiaoyu Zhang · Yun-Hui Liu
写実的なスタイル転送による複数の参照を使用した古い写真の近代化
Agus Gunawan · Soo Ye Kim ·ヒョンジュン シム · ジェホ イ · ムンチャール キム
DINER: 深度認識画像ベースの NEural Radiance フィールド
Malte Prinzler · Otmar Hilliges · Justus Thies
Cross-Guided Optimization of Radiance Fields with Multi-View Image Super-Resolution for High-Resolution Novel View Synthesis
Youngho Yoon · Kuk-Jin YOON
NeRFLight: Fast and Light Neural Radiance Fields using a Shared Feature Grid
Fernando Rivas-Manzaneque · Jorge Sierra-Acosta · Adrian Penate-Sanchez · Francesc Moreno-Noguer · Angela Ribeiro
Multi-Space Neural Radiance Fields
Ze-Xin Yin · Jiaxiong Qiu · Ming-Ming Cheng · Bo Ren
DyLiN: Making Light Field Networks Dynamic
Heng Yu · Joel Julin · Zoltan Milacski · Koichiro Niinuma · Laszlo Jeni
DP-NeRF: Deblurred Neural Radiance Field with Physical Scene Priors
Do-Gyoon Lee · Minhyeok Lee · Chajin Shin · Sangyoun Lee
SUDS: Scalable Urban Dynamic Scenes
Haithem Turki · Jason Zhang · Francesco Ferroni · Deva Ramanan
NeRFLix: 劣化駆動型視点間学習による高品質ニューラル ビュー合成 MiXer
Kun Zhou · Wenbo Li · Yi Wang · Tao Hu · Nianjuan Jiang · Xiaoguang Han · Jiangbo Lu
Polarimetric iToF: 散乱メディアによる高忠実度深度の測定
Daniel Jeon · Andreas Meuleman · Seung-Hwan Baek · Min Kim Kim
MaLP: プロアクティブ スキームを使用した操作位置特定
Vishal Asnani · Xi ying · Tal Hassner · Xiaoming Liu
学習可能な形状を備えた物理的敵対的赤外線パッチ
Xingxing Wei、Jie Yu、Yao Huang
PhysicalWorld の敵対的攻撃の視覚的な自然さのベンチマークと評価に向け
Simin Li · Shuning Zhang · Gujun Chen · dong wang · Pu Feng · Jiakai Wang · Aishan Liu · Xin Yi · Xianglong Liu
Seasoning Model Soups for Robustness to Adversarial and Natural Distribution Shifts
Francesco Croce · Sylvestre-Alvise Rebuffi · Evan Shelhamer · Sven Gowal
Demystifying Causal Features on Adversarial Examples and Causal Inoculation for Robust Network by Adversarial Instrumental Variable Regression
Junho Kim · Byung-Kwan Lee · Yong Man Ro
Black-Box Sparse Adversarial Attack via Multi-Objective Optimisation
Phoenix Williams · Ke Li
Enhancing the Self-Universality for Transferable Targeted Attacks
Zhipeng Wei · Jingjing Chen · Zuxuan Wu · Yu-Gang Jiang
Evading DeepFake Detectors via Adversarial Statistical Consistency
Hou Yang · Qing Guo · Yihao Huang · Xiaofei Xie · Lei Ma · Jianjun Zhao
CAP: Robust Point Cloud Classification via Semantic and Structural Modeling
Daizong Ding · Erling Jiang · Yuanmin Huang · Mi Zhang · Wenxuan Li · Min Yang
Backdoor Attacks Against Deep Image Compression via Adaptive Frequency Trigger
Yi Yu · Yufei Wang · Wenhan Yang · Shijian Lu · Yap-peng Tan · Alex Kot
FedSeg: Class-Heterogeneous Federated Learning for Semantic Segmentation
Jiaxu Miao · Zongxin Yang · Leilei Fan · Yi Yang
Multimodal Industrial Anomaly Detection via Hybrid Fusion
Yue Wang · Jinlong Peng · Jiangning Zhang · Ran Yi · Yabiao Wang · Chengjie Wang
弱教師付きビデオ異常検出のための不偏マルチインスタンス学習
HUI LYU · Zhongqi Yue · Qianru Sun · Bin Luo · Zhen Cui · Hanwang Zhang
潜在コード最適化による属性保持顔データセット匿名化
Simone Barattin · Christos Tzelepis · Ioannis Patras · Nicu Sebe
HandsOff:追加の人間による注釈を使用しないラベル付きデータセットの生成
Austin Xu · Mariya Vasileva · Achal Dave · Arjun Seshadri
クロス GAN 監査: 事前トレーニングされた生成モデル間の属性レベルの類似点と相違点の教師なし識別
Matthew Olson · Shusen Liu · Rushil Anirudh · Jayaraman J. Thiagarajan · Peer-timo Bremer · Weng-Keen Wong
ユーザーレベルの差分プライバシーを備えた画像埋め込みを生成する方法を学習
Zheng Xu · Maxwell Collins · Yuxiao Wang · Liviu Panait · Sewoong Oh · Sean Augenstein · Ting Liu · Florian Schroff · Hugh McMahan
適応型データフリー量子化
Biao Qian · Yang Wang · Richang Hon · Meng Wang
ポストトレーニング量子化における発振問題の解決Through a Theoretical Perspective
Yuexiao Ma Huixia Li Xiawu Zheng Xuefeng Xiao Rui Wang Shilei Wen Xin Pan Fei Chao Rongrong Ji
One-Shot Model for Mixed-Precision Quantization
Ivan Koryakovskiy Alexandra Yakovleva Valentin Buchnev Temur Isa ev · Gleb Odinokikh
Training debiased subnetworks with contrastive weight pruning
パク・ゴンヨン、イ・サンミン、イ・サンワン、ジョンイェ
Understanding Masked Autoencoders via Hierarchical Latent Variable Models
Lingjing Kong · Martin Q. Ma · Guangyi Chen · Eric Xing · Yuejie Chi · Louis-Philippe Morency · Kun Zhang
MobileOne: An Improved One Millisecond Mobile Backbone
Pavan Kumar Anasosalu Vasu · James Gabriel · Jeff Zhu · Oncel Tuzel · Anurag Ranjan
Rate Gradient Approximation Attack Threats Deep Spiking Neural Networks
Tong Bu · Jianhao Ding · Zecheng Hao · Zhaofei Yu
Constructing Deep Spiking Neural Networks from Artificial Neural Networks with Knowledge Distillation
Qi Xu · Yaxin Li · Jiangrong Shen · Jian Liu · Huajin Tang · Gang Pan
From Node Interaction to Hop Interaction: New Effective and Scalable Graph Learning Paradigm
Jie Chen · Zilong Li · Zhu ying · Junping Zhang · Jian Pu
DNN トレーニングのための事前条件付き勾配法の一般的なリグレット境界
Honwei Yong · Ying Sun · Lei Zhang
データセット圧縮のための分布マッチングの改善
Ganlong Zhao · Guanbin Li · Yipeng Qin · Yizhou Yu
微分可能な物理学による状態マッチングとしての模倣学習
Siwei Chen Xiao Ma Zhongwen Xu
ロバストな微調整のための訓練可能な投影勾配法
Junjiao Tian Xiaoliang Dai Chih-Yao Ma Zecheng Heyen-Cheng Liu Zsolt Kira
内部の逆正則化によるメタ学習の一般化の改善レベル
Lianzhe Wang Shiji Zhou Shanghang Zhang Xu Chu Heng Chang Wenwu Zhu
SIM: ボックス監視インスタンス セグメンテーションのためのセマンティックを意識したインスタンス マスク生成
Ruihuang Li Chenhang HE Yabin Zhang Shuai Li Liyi Chen Lei Zhang
少数ショット セグメンテーションの相関関係の再考: ブイビュー
Yuan Wang Rui Sun Tianzhu Zhang
セマンティック セグメンテーションの信頼性: Are私たちは正しい軌道に乗っていますか?
Pau de Jorge Aranda Riccardo Volpi Philip Torr Grégory Rogez
ACSeg: 教師なしセマンティック セグメンテーションのための適応的概念化
Kehan Li Zhennan Wang Zesen Cheng Runyi Yu Yian Zhao Guoli Song Chang Liu Li Yuan Jie Chen
Part Distillation: Learning Parts fromインスタンスのセグメンテーション
チャン・ヒョン・チョー フィリップ・クレヘンビュール ヴィグネーシュ・ラマナタン
PACO: Parts and Attributes of Common Objects
Vignesh Ramanathan · Anmol Kalia · Vladan Petrovic · Yi Wen · Baixue Zheng · Baishan Guo · Rui Wang · Aaron Marquez · Rama Kovvuri · Abhishek Kadian · Amir Mousavi · Yiwen Song · Abhimanyu Dubey · Dhruv Mahajan
MIANet: Aggregating Unbiased Instance and General Information for Few-Shot Semantic Segmentation
Yong Yang · Qiong Chen · Yuan Feng · Tianlin Huang
Generative Semantic Segmentation
Jiaqi Chen · Jiachen Lu · Xiatian Zhu · Li Zhang
GeoLayoutLM: Geometric Pre-training for Visual Information Extraction
Chuwei Luo · Changxu Cheng · Qi Zheng · Cong Yao
GAPartNet: Cross-Category Domain-Generalizable Object Perception and Manipulation via Generalizable and Actionable Parts
Haoran Geng · Helin Xu · Chengyang Zhao · Chao Xu · Li Yi · Siyuan Huang · He Wang
A Simple Framework for Text-Supervised Semantic Segmentation
Muyang Yi · Quan Cui · Hao Wu · Cheng Yang · Osamu Yoshie · Hongtao Lu
Learning to Detect and Segment for Open Vocabulary Object Detection
tao wang
Open-vocabulary Attribute Detection
Maria Bravo · Sudhanshu Mittal · Simon Ging · Thomas Brox
CORA: Adapting CLIP for Open-Vocabulary Detection with Region Prompting and Anchor Pre-Matching
Xiaoshi Wu · Feng Zhu · Rui Zhao · Hongsheng Li
CLIP2Scene: Towards Label-efficient 3D Scene Understanding by CLIP
Runnan Chen · Youquan Liu · Lingdong Kong · Xinge ZHU · Yuexin Ma · Yikang LI · Yuenan Hou · Yu Qiao · Wenping Wang
PLA: Language-Driven Open-Vocabulary 3D Scene Understanding
Runyu Ding · Jihan Yang · Chuhui Xue · Wenqing Zhang · Song Bai · XIAOJUAN QI
CrOC: Cross-View Online Clustering for Dense Visual Representation Learning
Thomas Stegmüller · Tim Lebailly · Behzad Bozorgtabar · Tinne Tuytelaars · Jean-Philippe Thiran
ScanDMM: A Deep Markov Model of Scanpath Prediction for 360° Images
Xiangjie Sui · Yuming Fang · Hanwei Zhu · Shiqi Wang · Zhou Wang
Turning a CLIP Model into a Scene Text Detector
Wenwen Yu · Yuliang Liu · Wei Hua · Deqiang Jiang · Bo Ren · Xiang Bai
Filtering, Distillation, and Hard Negatives for Vision-Language Pre-Training
フィリップ・ラデノヴィッチ、アビマニュ・デュベイ、アビシェク・カディアン、トドール・ミハイロフ、サイモン・ヴァンデンヘンデ、ヤシュ・パテル、イー・ウェン、ヴィグネシュ・ラマナタン、ドゥルヴ・マハジャン 未キュレート画像テキストデータセット: 人口バイアスに光を当てる ノア・ガルシア、広田裕介、ヤンクン・ウー、中島
裕太
EXIF
として言語: 画像とカメラのメタデータ間のクロスモーダル関連の学習
Chenhao Zheng、Ayush Shrivastava、Andrew Owens
識別微調整によるクロスドメイン画像キャプション
Roberto Dessi、Michele Bevilacqua、Eleonora Gualdoni、Nathanaël Rakotonirina、Francesca Franzon、Marco Baroni
自己類似性マップトレーニングの弱い教師付きフレーズ グラウンディング
タル シャハラバニー · リオール ウルフ
Positive-Augmented Constrastive Learning for Image and Video Captioning Evaluation
Sara Sarto · Manuele Barraco · Marcella Cornia · Lorenzo Baraldi · Rita Cucchiara
Detecting and Grounding Multi-Modal Media Manipulation
Rui Shao · Tianxing Wu · Ziwei Liu
DeltaEdit: Exploring Text-free Training for Text-Driven Image Manipulation
Yueming Lyu · Tianwei Lin · Fu Li · Dongliang He · Jing Dong · Tieniu Tan
Parts2Words: Learning Joint Embedding of Point Clouds and Texts by Bidirectional Matching between Parts and Words
Chuan Tang · Xi Yang · Bojian Wu · Zhizhong Han · Yi Chang
Exploiting Unlabelled Photos for Stronger Fine-Grained SBIR
Aneeshan Sain · Ayan Kumar Bhunia · Subhadeep Koley · Pinaki Nath Chowdhury · Soumitri Chattopadhyay · Tao Xiang · Yi-Zhe Song
GeneCIS: A Benchmark for General Conditional Image Similarity
Sagar Vaze · Nicolas Carion · Ishan Misra
Picture that Sketch: Photorealistic Image Generation from Abstract Sketches
Subhadeep Koley · Ayan Kumar Bhunia · Aneeshan Sain · Pinaki Nath Chowdhury · Tao Xiang · Yi-Zhe Song
Hyperbolic Contrastive Learning for Visual Representations beyond Objects
Songwei Ge · Shlok Mishra · Simon Kornblith · Chun-Liang Li · David Jacobs
Images Speak in Images: A Generalist Painter for In-Context Visual Learning
Xinlong Wang · Wen Wang · Yue Cao · Chunhua Shen · Tiejun Huang
DeAR: 加法残差による視覚言語モデルのバイアス除去
Ashish Seth Mayur Hemani Chirag Agarwal
アフォーダンス学習のためのインタラクティブ アフィニティの活用
Honchen Luo Wei Zhai Jing Zhang Yang Cao Dacheng Tao
デモンストレーション ビデオからターゲット画像へのアフォーダンス グラウンディング
Joya Chen Difei Gao · Kevin Qinghong Lin · Mike Zheng Shou
見逃しているものを見る: 意味完成学習による視覚言語の事前トレーニング
Yatai Ji · Rong-Cheng Tu · jie jiang · Weijie Kong · Chengfei Cai · Wenzhe Zhao · WANG HonFa · Yujiu Yang · Wei Liu Is
BERT Blind? Exploring視覚言語理解に対する視覚と言語の事前訓練の効果
モリス・アルパー · マイケル・フィマン · ハダール・アヴェルブッフ・エロール
密な予測のための確率論的即時学習
H Hyunjun Kwon · Taeyong Song · Somi Jeong · Jin Kim · Jinhyun Jang · Kwanghoon Sohn
知識に基づくコンテキスト最適化による視覚言語の即時チューニング
Hantao Yao · Rui Zhang · Changsheng Xu
The Dialog Must Go On: Improving Visual生成的自己トレーニングによる対話
Gi-Cheon Kang · Sungdong Kim · Jinhwa Kim · Donghyun Kwak · Byoung-Tak Zhang
分割統治: オブジェクト因数分解と構成推論による質問への回答
Shi Chen · Qi Zhao
視覚的な質問応答の一貫性に対する論理的意味
Sergio Tasconモラレス、パブロ・マルケス・ネイラ、ラファエル・シュニトマン
Abstract Visual Reasoning: An Algebraic Approach for Solving Raven’s Progressive Matrices
Jingyi Xu · Tushar Vaidya · Yufei Wu · Saket Chandra · Zhangsheng Lai · Kai Fong Ernest Chong
NaQ: Leveraging Narrations as Queries to Supervise Episodic Memory
Santhosh Kumar Ramakrishnan · Ziad Al-Halah · Kristen Grauman
Meta-Explore: Exploratory Hierarchical Vision-and-Language Navigation Using Scene Object Spectrum Grounding
Minyoung Hwang · Jaeyeon Jeong · Minsoo Kim · Yoonseon Oh · Songhwai Oh
3D-Aware Object Goal Navigation via Simultaneous Exploration and Identification
Jiazhao Zhang · Liu Dai · Fanpeng Meng · Qingnan Fan · Xuelin Chen · Kai Xu · He Wang
VLPD: 視覚言語セマンティック自己監視によるコンテキスト認識歩行者検出
Mengyin Liu · jie jiang · Chao Zhu · Xu-Cheng ying
グループ活動における非同期時間推論のためのアクター中心の因果関係グラフ
Zhao Xie · Tian Gao · Kewei Wu · Jiao Chang
Affection: Learning Affective Preparations for Real-World Visual Data
Panos Achlioptas · Maks Ovsjanikov · Leonidas Guibas · Sergey Tulyakov
感情認識のための分離マルチモーダル蒸留
Yong Li · Yuanzhi Wang · Zhen Cui
事前ビデオ認識のための双方向クロスモーダル知識探索訓練を受けた視覚言語モデル
Wenhao Wu Xiaohan Wang Haipen Luo Jingdong Wang Yi Yang Wanli Ouyang
大規模言語モデルからのビデオ表現の学習
Yue Zhao、Ishan Misra、Philipp Kraehenbuehl、Rohit Girdhar
ProTéGé: ビデオ時間的グラウンディングによるビデオ時間的グラウンディングのためのトリミングされていない事前トレーニング
Lan Wang、Gaurav Mittal、Sandra Sajeev、Ye Yu、Matthew Hall、Vishnu Naresh Boddeti、Mei Chen の
微調整された CLIP モデルは効率的なビデオ学習者です
Hanona Bangalat 氏、Muhammad Uzair Khattak 氏、Muhammad Maaz 氏、Salman Khan 氏、Fahad Khan 氏
Movies2Scenes: 映画メタデータを使用してシーン表現を学習
Shixing Chen 氏、Chun-Hao Liu 氏、Xiang Hao 氏、Xiaohan Nie 氏、Maxim Arap 氏·
時間的アクションのローカリゼーション タスクにおけるタスクの不一致問題を軽減するための Raffay Hamid のソフトランディング戦略
Hyolim Kang · Hanjung Kim · Joungbin An · Minsu Cho · Seon Joo Kim
タイムスタンプ監視付き時間アクションセグメンテーションのラベルバイアスの低減
Kaiyuan Liu · Yunheng Li · Shenglan Liu · Tan · Zihang Shao
少数ショットアクション認識のためのマルチモーダル補完性の積極的な探求
Yuyang Wanyan · Xiaoshan Yang · Chaofan Chen · Changsheng Xu
MMG-Ego4D: 自己中心的行動認識におけるマルチモーダル一般化
Xinyu Gong · Sreyas Mohan · Naina Dhingra · Jean-Charles Bazin · YILEI LI · Zhangyang Wang · Rakesh Ranjan
プロンプトガイド付きゼロショット異常アクション事前学習済みディープスケルトン特徴を使用した認識
佐藤文昭・八馬良・関井大樹
TempSAL - 深層顕著性予測のための時間情報の解明
Bahar Aydemir · Ludo Hoffstetter · Tong Zhang · Mathieu Salzmann · Sabine Süsstrunk
もっと分解し、より良く集約する: 人間の動作予測のための周波数表現学習を詳しく見る
Xuehao Gao · Shaoyi Du · Yang Wu · Yang Yang
CASP-Net: ビデオ顕著性予測の再考オーディオビジュアルの一貫性知覚の観点から
Junwen Xiong · Ganglai Wang · Peng Zhang · Wei Huang · Yufei Zha · Guangtao Zhai
オーディオとビジュアルの潜在的整合性によるサウンドからビジュアルシーンの生成
Sungbin Kim · Arda Senocak · Hyunwoo Ha · Andrew Owens · Tae-Hyun Oh
偽陰性認識対比学習による視聴覚ソース位置特定の学習
Weixuan Sun Jiayi Zhang Jianyuan Wang Zheyuan Liu Yiran Zhong Tianpeng Feng Yandong Guo Yanhao Zhang Nick Barnes
Novel-view Acoustic Synthesis
Changan Chen Alexander Richard Roman Shapovalov Vamsi Krishna Ithapu Natalia Neverova Kristen Grauman · Andrea Vedaldi
長編ビデオにおける関係時空クエリ
Xitongヤン · フージェン・チュウ · ラーガフ・ゴヤル · マット・ファイズリ · ロレンツォ・トレサーニ · デュ・トラン・
セレク

おすすめ

転載: blog.csdn.net/weixin_62501745/article/details/130088602