生成系列论文：文本控制的3d点云生成 TextCraft（一）：论文概览 - 代码天地

生成系列论文：文本控制的3d点云生成 TextCraft（一）：论文概览

企业开发 2023-07-11 20:44:34 阅读次数: 0

TextCraft: Zero-Shot Generation of High-Fidelity and Diverse Shapes from Text
论文原文： https://arxiv.org/abs/2211.01427

论文的研究动机

DALL2已经在文本控制的图像生成上取得很好的效果，但是基于文本控制的3d点云生成的研究还不太成熟，于是本文作者想要研究这个方向内容；
但是这时候作者发现了新的问题：没有成熟的数据集；
因此作者想要利用clip的预训练模型来解决这个问题。

论文的具体思路

其实这个思路不困难，就是整理本身有的东西，本身有的东西包括：

3d点云数据和视图对
利用视图控制生成3d点云的网络

现在想要获得：

利用文字控制生成3d点云的网络

想到clip：

提供了一个提取出文字和图片的共用特征

所以只需要利用这个共用特征控制生成3d点云，就可以在训练的阶段用“视图和3d模型对”训练，在预测阶段用文字输入生成3d点云。

论文网络结构

总体网络图
在这里插入图片描述
第一部分训练，这部分主要是找出来两个东西：隐层表达、读入隐层表达输出3d模型的网络，这样在之后，只需要获得这个隐层表达就可以获得相对应的3d点云。

第二部分训练，主要是用“视图和3d点云对”训练由视图生成隐层特征，
在这里插入图片描述
第三部分，增强隐层特征，感觉这里就是丰富一下隐层特征，增加生成的多样性，生成网络类型的东西，一般在低维度生成大方向，高维度则是小细节，这里应该就是在大方向确定的情况下丰富小细节。

接下来是预测阶段，主要是把控制信息换成由文字产生的共有特征。
在这里插入图片描述

猜你喜欢

转载自blog.csdn.net/qq_43210957/article/details/129014687

生成系列论文：文本控制的3d点云生成 TextCraft（一）：论文概览

生成系列论文：基于diffusion的3d图像的生成：Novel View Synthesis with Diffusion Models（一）

《A Point Set Generation Network for 3D Object Reconstruction from a Single Image》论文笔记_2D图像生成3D点云

【论文阅读】 3D点云论文汇总

场景生成及编辑&3D定位论文阅读

3D点云分割论文总结

【论文笔记】3D点云分割-PointNet

【从3D点云生成平面图：一种空间划分方法】

【3D点云】弱监督点云分割（论文解读 CVPR2020）

文本控制3D打印模型，麻省理工最新产品并公布论文

论文解读 | 点对照：3D点云理解无监督式预训练

3D点云数据分析：pointNet++论文分析及阅读笔记

CVPR2020 3D点云相关论文思想和方法总结

论文阅读|基于点云的端到端的3D目标检测——VoxelNet

论文阅读|可直接处理无序3D点云的神经网络PointNet

【论文阅读】【点云处理】Point-Voxel CNN for Efficient 3D Deep Learning

基于激光雷达点云的3D目标检测算法论文总结

Patchwork++论文阅读——基于3D点云的快速鲁棒地面分割算法

论文解读｜VoxelNet:基于点云的3D物体检测的端到端学习

【3D点云】PointCNN：论文翻译及Pytorch代码实现

3D地球的生成（一）——生成全球的3D图

3D目标检测（一）—— 基于Point-Based方法的PointNet点云处理系列

【机器学习】两分钟论文导读：基于深度学习的3D地形生成器

ICCV2019论文点评：3D Object Detect疏密度点云三维目标检测

3D视觉前沿论文整理-2020年7月第4周-点云配准与对应

3D CV 论文调研

3D CV 论文调研

论文ai生成-一键生成论文的软件

[论文总结] 智慧农业论文摘要阅读概览

#读源码+论文# 三维点云分割Deep Learning Based Semantic Labelling of 3D Point Cloud in Visual SLAM

今日推荐

面壁智能发布 Eurux-8x22B 开源大模型 —— 堪称「理科状元」

开源日报 | 谷歌扶持鸿蒙上位；开源Rabbit R1；Docker加持的安卓手机；微软的焦虑和野心；海尔电器把开放平台关了

中国码农的“35岁魔咒”

蘭雅 CorelDRAW 插件 2024.5.1 国际劳动节版，免费下载

Arc Browser for Windows 1.0 正式 GA

90后程序员开发视频搬运软件、不到一年获利超 700 万，结局很刑！

周排行

【转】spring中对控制反转和依赖注入的理解

tms webcore 安装和使用

java程序员进阶相关书籍

SpringMVC接受请求参数、

如何保存训练好的机器学习模型

MyEclipse、Eclipse设置项目JDK的三个地方

商超行业微信小程序开发定制一般多少钱（行业技术人员解读）

Markdown编辑器语言——30分钟入门到到精通

Linux系统下MongoDB的简单安装与基本操作

Power Strings

每日归档

更多

2024-05-07(14)

2024-05-06(40)

2024-05-05(0)

2024-05-04(7)

2024-05-03(19)

2024-05-02(0)

2024-05-01(4)

2024-04-30(1)

2024-04-29(40)

2024-04-28(0)