データローダーを設定しpytorchデータセットの反復データセットとデータ

インポートトーチ
torch.utils.dataインポートデータセット、データローダから

クラスSmsDataset(データセット):

    デフ__init __(自己):
        self.file_path = "./SMSSpamCollection" 
        self.lines =オープン(self.file_path、コード= "UTF-8" ).readlines()

    デフ__getitem __(自己、インデックス):
        ライン= self.lines [インデックス] .strip()
        ラベル= line.split( "\ T")[0] "\ T")= line.splitを送りました[1] 
        リターン・ラベル、送信され

    ます。def __len __(自己)
        リターンでlen(self.lines)

sms_dataset = SmsDataset()
データローダー=データローダー(sms_dataset、BATCH_SIZE = 2、シャッフル= true)を


__name__ == '__main__'の場合: 
    IDXのために、 (ラベル、列挙で送信された)(データローダー):
        印刷(IDX)
        印刷(ラベル)
        印刷(送られた)
        ブレーク
    プリント(LEN(sms_dataset))
    プリント(LEN(データローダー))

  

0は
(「ハム」、「スパム」)
(「とポッピング<#> ibuprofens何の助けませんでした。」、「これは、我々は2接触のuを試してみましたが、2回目です。Uは、750ポンドの賞金を獲得している。2請求が簡単で、コール08712101358分あたりNOW!のみ10P。BT-国家-率')
5574 
2787

  

おすすめ

転載: www.cnblogs.com/LiuXinyu12378/p/12307949.html