公式ます。https://github.com/MhLiao/DB
周6月グレート神を実現します。https://github.com/WenmuZhou/DBNet.pytorch
1.公式
公式のインストールプロセスによると、ちょうど私の環境では、それはの使用pytorch1.0.1(py3.7)となっている、ubuntu16.04 + cuda8で、非常に簡単にインストールすることです。また、空ああ、TXTはすべて空であるまで実行されますが、訓練されたモデルは完全な推論を予測することができ、視覚化フォルダには灰色のボックスを描くません。損失が収束しません
[INFO] [2020-01-18 16:24:09,584] step: 1340, epoch: 0, loss: 4.332346, lr: 0.007000
[INFO] [2020-01-18 16:24:09,585] bce_loss: 0.568492
[INFO] [2020-01-18 16:24:09,585] thresh_loss: 0.563487
[INFO] [2020-01-18 16:24:09,586] l1_loss: 0.092640
[INFO] [2020-01-18 16:24:19,117] step: 1360, epoch: 0, loss: 4.255758, lr: 0.007000
[INFO] [2020-01-18 16:24:19,120] bce_loss: 0.544069
[INFO] [2020-01-18 16:24:19,122] thresh_loss: 0.539020
[INFO] [2020-01-18 16:24:19,124] l1_loss: 0.099640
[INFO] [2020-01-18 16:24:28,766] step: 1380, epoch: 0, loss: 4.507674, lr: 0.007000
[INFO] [2020-01-18 16:24:28,767] bce_loss: 0.560643
[INFO] [2020-01-18 16:24:28,768] thresh_loss: 0.652172
[INFO] [2020-01-18 16:24:28,768] l1_loss: 0.105229
IC15トレーニングデータセットでは、あまりにも、私はどこに問題があるか分かりません。背中を見てください
2.非公式
インストールプロセスは、インストールは落ちるだろう、本当に実行されますが、最初に表示することができ、DBNet.pytorch INFO:デバイスのCPUを搭載した電車とpytorch 1.3.0
私のコンピュータは1.3 cuda10必要性を持っていないので、そのCPUが走りました。非常に遅いです。
後でそれはpytorch1.1.0コンパイルされたバージョンを持つグループで見られたが、彼はcuda10でました。私も1.1.0バージョンをインストールし、その後、トレーニングのすべての種類は、ああ与えられ、無力。。。彼は後に放棄され、後で再フィドルをされました。
このプロセスでは、私がインストールされている各ライブラリのバージョンを表示することができますcondaリストをノック、仮想環境では、より多くのancondaうまく感じます。
_libgcc_mutex 0.1 main
absl-py 0.9.0 <pip>
anyconfig 0.9.10 <pip>
backcall 0.1.0 py36_0
blas 1.0 mkl
ca-certificates 2019.11.27 0
cachetools 4.0.0 <pip>
certifi 2019.11.28 py36_0
cffi 1.13.2 py36h2e261b9_0
chardet 3.0.4 <pip>
cudatoolkit 8.0 3
cycler 0.10.0 <pip>
decorator 4.4.1 py_0
freetype 2.9.1 h8a8886c_1
future 0.18.2 <pip>
google-auth 1.10.1 <pip>
google-auth-oauthlib 0.4.1 <pip>
grpcio 1.26.0 <pip>
idna 2.8 <pip>
imageio 2.6.1 <pip>
imgaug 0.3.0 <pip>
intel-openmp 2019.4 243
ipython 7.11.1 py36h39e3cac_0
ipython_genutils 0.2.0 py36_0
jedi 0.15.2 py36_0
jpeg 9b h024ee3a_2
kiwisolver 1.1.0 <pip>
ld_impl_linux-64 2.33.1 h53a641e_7
libedit 3.1.20181209 hc058e9b_0
libffi 3.2.1 hd88cf55_4
libgcc-ng 9.1.0 hdf63c60_0
libgfortran-ng 7.3.0 hdf63c60_0
libpng 1.6.37 hbc83047_0
libstdcxx-ng 9.1.0 hdf63c60_0
libtiff 4.1.0 h2733197_0
Markdown 3.1.1 <pip>
matplotlib 3.1.2 <pip>
mkl 2019.4 243
mkl-service 2.3.0 py36he904b0f_0
mkl_fft 1.0.15 py36ha843d7b_0
mkl_random 1.1.0 py36hd6b4f25_0
natsort 7.0.0 <pip>
ncurses 6.1 he6710b0_1
networkx 2.4 <pip>
ninja 1.9.0 py36hfd86e86_0
numpy 1.18.1 py36h4f9e942_0
numpy 1.17.4 <pip>
numpy-base 1.18.1 py36hde5b4d6_0
oauthlib 3.1.0 <pip>
olefile 0.46 py_0
opencv-python 4.1.2.30 <pip>
opencv-python-headless 4.1.2.30 <pip>
openssl 1.1.1d h7b6447c_3
parso 0.5.2 py_0
pexpect 4.7.0 py36_0
pickleshare 0.7.5 py36_0
Pillow 6.2.2 <pip>
pillow 7.0.0 py36hb39fc2d_0
pip 19.3.1 py36_0
Polygon3 3.0.8 <pip>
prompt_toolkit 3.0.2 py_0
protobuf 3.11.2 <pip>
ptyprocess 0.6.0 py36_0
pyasn1 0.4.8 <pip>
pyasn1-modules 0.2.8 <pip>
pyclipper 1.1.0.post3 <pip>
pycparser 2.19 py_0
pygments 2.5.2 py_0
pyparsing 2.4.6 <pip>
python 3.6.10 h0371630_0
python-dateutil 2.8.1 <pip>
pytorch 1.0.1 py3.6_cuda8.0.61_cudnn7.1.2_2 pytorch
PyWavelets 1.1.1 <pip>
PyYAML 5.2 <pip>
readline 7.0 h7b6447c_5
requests 2.22.0 <pip>
requests-oauthlib 1.3.0 <pip>
rsa 4.0 <pip>
scikit-image 0.16.2 <pip>
scipy 1.4.1 <pip>
setuptools 44.0.0 py36_0
Shapely 1.6.4.post2 <pip>
six 1.13.0 py36_0
sqlite 3.30.1 h7b6447c_0
tensorboard 2.1.0 <pip>
tensorboardX 1.8 <pip>
tk 8.6.8 hbc83047_0
torch 1.1.0 <pip>
torchvision 0.2.1 <pip>
torchvision 0.2.2 py_3 pytorch
tqdm 4.40.1 <pip>
traitlets 4.3.3 py36_0
urllib3 1.25.7 <pip>
wcwidth 0.1.7 py36_0
Werkzeug 0.16.0 <pip>
wheel 0.33.6 py36_0
xz 5.2.4 h14c3975_4
zlib 1.2.11 h7b6447c_3
zstd 1.3.7 h0b5b093_0
直接ソフトウェアのインストール:ピップはtensorboardX == 1.8をインストールする
デフォルトのインストールの最新バージョンなし。
また、ピップ少ないインストールバージョンよりも「tensorboardX <1.9」。1.9をインストールすることができます。
2個のエラーがあります。
2020-01-18 16:23:24,753 DBNet.pytorch ERROR: Traceback (most recent call last):
File "/data_1/Yang/project/2019/project/DBNet.pytorch/DBNet.pytorch-master/base/base_trainer.py", line 77, in __init__
self.writer.add_graph(self.model, dummy_input)
File "/data_1/Yang/software_install/Anaconda1105/envs/dbnet/lib/python3.6/site-packages/tensorboardX/writer.py", line 774, in add_graph
self._get_file_writer().add_graph(graph(model, input_to_model, verbose, **kwargs))
File "/data_1/Yang/software_install/Anaconda1105/envs/dbnet/lib/python3.6/site-packages/tensorboardX/pytorch_graph.py", line 292, in graph
list_of_nodes, node_stats = parse(graph, args)
File "/data_1/Yang/software_install/Anaconda1105/envs/dbnet/lib/python3.6/site-packages/tensorboardX/pytorch_graph.py", line 227, in parse
if node.debugName() == 'self':
AttributeError: 'torch._C.Value' object has no attribute 'debugName'
2020-01-18 16:23:24,753 DBNet.pytorch WARNING: add graph to tensorboard failed
2020-01-18 16:23:24,756 DBNet.pytorch INFO: train dataset has 889 samples,297 in dataloader, validate dataset has 111 samples,111 in dataloader
Traceback (most recent call last):
File "tools/train.py", line 74, in <module>
main(config)
File "tools/train.py", line 58, in main
trainer.train()
File "/data_1/Yang/project/2019/project/DBNet.pytorch/DBNet.pytorch-master/base/base_trainer.py", line 103, in train
self.epoch_result = self._train_epoch(epoch)
File "/data_1/Yang/project/2019/project/DBNet.pytorch/DBNet.pytorch-master/trainer/trainer.py", line 46, in _train_epoch
for i, batch in enumerate(self.train_loader):
File "/data_1/Yang/software_install/Anaconda1105/envs/dbnet/lib/python3.6/site-packages/torch/utils/data/dataloader.py", line 582, in __next__
return self._process_next_batch(batch)
File "/data_1/Yang/software_install/Anaconda1105/envs/dbnet/lib/python3.6/site-packages/torch/utils/data/dataloader.py", line 608, in _process_next_batch
raise batch.exc_type(batch.exc_msg)
TypeError: Traceback (most recent call last):
File "/data_1/Yang/software_install/Anaconda1105/envs/dbnet/lib/python3.6/site-packages/torch/utils/data/_utils/worker.py", line 99, in _worker_loop
samples = collate_fn([dataset[i] for i in batch_indices])
TypeError: 'NoneType' object is not callable
首先这个、ファイル"/data_1/Yang/software_install/Anaconda1105/envs/dbnet/lib/python3.6/site-packages/tensorboardX/pytorch_graph.py"、ライン227、パースで
node.debugName()==「セルフ場合「:
はAttributeErrorは: 'torch._C.Value 'debugName'オブジェクトには属性がありません'
それは私たちが、私は1.9だっ表示するために全体1.8.condaリストを解放した後、ノックすべきであると言って、本当にtensorboardX間違ったバージョン、Baiduは、次のようになります
:PIPはtensorboardX == 1.8をインストールし、下に示す
/ [データ1 /ヤンで6:既に満たし要件(1.13.0)(1.8 == tensorboardXから)/software_install/Anaconda1105/envs/dbnet/lib/python3.6/site-packages
要件が既に満たさ:いるProtobuf> = 3.2.0 / [データ1 /ヤンに/ software_install / Anaconda1105 / ENVS / dbnet / libに/ python3.6 /(3.11.2)(1.8 == tensorboardXから)のsite-packages
すでに満足要件:/data_1/Yang/software_install/Anaconda1105/envs/dbnet/lib/python3.6/でnumpyの(tensorboardX == 1.8から)パッケージ・サイト(1.17.4)
要件すでに満足:いるProtobuf> = 3.2から/data_1/Yang/software_install/Anaconda1105/envs/dbnet/lib/python3.6/site-packagesでsetuptoolsの(。 0-> tensorboardX == 1.8)(44.0.0.post20200106 )
収集したパッケージをインストールする:tensorboardXは
tensorboardX 1.9:既存のインストールが見つかり
アンtensorboardX-1.9:
正常にアンインストールtensorboardX-1.9
は正常にインストールされましtensorboardX-1.8を
直接、自動的に機器1.8 1.9をアンロード
その後、再訓練、実際にはその間違いの最後です。
トレースバック(最新の呼び出しの最後):
内のファイル「ツール/ train.py」、ライン74、
メイン(設定)
メインのFile "ツール/ train.py"、58行、
trainer.train()
ファイル「/data_1/Yang/project/2019/project/DBNet.pytorch/DBNet.pytorch-master/base/base_trainer。 PY」、行103、電車の中で
self.epoch_result = self._train_epoch(エポック)
ファイル"/data_1/Yang/project/2019/project/DBNet.pytorch/DBNet.pytorch-master/trainer/trainer.py"、ライン46 、_train_epochで
私のために、列挙におけるバッチ(self.train_loader):
ファイル"/data_1/Yang/software_install/Anaconda1105/envs/dbnet/lib/python3.6/site-packages/torch/utils/data/dataloader.py" 、中線582、
次
リターンself._process_next_batch(バッチ)
_process_next_batchでファイル"/data_1/Yang/software_install/Anaconda1105/envs/dbnet/lib/python3.6/site-packages/torch/utils/data/dataloader.py"、ライン608、
昇給のbatch.exc_type(batch.exc_msg)
TypeError例外:トレースバック(最新の呼び出しの最後):
ファイル"/data_1/Yang/software_install/Anaconda1105/envs/dbnet/lib/python3.6/site-packages/torch/utils/data/_utils/worker.py"、ライン99 、_worker_loopの中に
サンプル= collate_fn([データセット[i]はiに対するbatch_indicesで])
はTypeError: 'NoneType'オブジェクトを呼び出すことはできません
githubの中に誰かの答えこの質問、HTTPS://github.com/WenmuZhou/DBNet.pytorch/issues/4
でマスターDBNet.pytorch / data_loader / 初期化の.py、ライン74
IF「collate_fn」ではない設定で[ 'ローダ']またはCONFIG ['ローダ'] [' collate_fn '】なしまたはlenのIS(コンフィグ['ローダ'] [' collate_fn '])== 0:
#config ['ローダ'] [' collate_fn「] =なし#ここでは、以下を変更するには、ここ=========、長楽にあり、または割り当てなし====に直接渡すことができ
コンフィグ[「ローダ」] [「collate_fn」] = torch.utils。 data.dataloader.default_collate
他:
設定[ 'ローダ'] [ 'collate_fn'] =のeval(設定[ 'ローダ'] [ 'collate_fn'])()
_dataset = get_dataset(DATA_PATH = DATA_PATH、モジュール名= dataset_name、変換= img_transfroms、dataset_args = dataset_args)
サンプラー=なし
分散場合:
torch.utils.data.distributedインポートからDistributedSampler
#3)使用DistributedSampler
サンプラー= DistributedSampler(_dataset)
設定[」ローダー'] ['シャッフル'] = Falseの
設定['ローダー'] [' pin_memory '] = Trueの
ローダー=データローダー(データセット= _dataset、サンプラー=サンプラー、**設定['ローダー'])
戻り@loader
だから、[OK]を、再訓練!!!
自分のデータですばやくトレーニング、およびトレーニングと参照してください!