インポートトーチ torch.utils.dataインポートデータセット、データローダから クラスSmsDataset(データセット): デフ__init __(自己): self.file_path = "./SMSSpamCollection" self.lines =オープン(self.file_path、コード= "UTF-8" ).readlines() デフ__getitem __(自己、インデックス): ライン= self.lines [インデックス] .strip() ラベル= line.split( "\ T")[0] ("\ T")= line.splitを送りました[1] リターン・ラベル、送信され ます。def __len __(自己) リターンでlen(self.lines) sms_dataset = SmsDataset() データローダー=データローダー(sms_dataset、BATCH_SIZE = 2、シャッフル= true)を __name__ == '__main__'の場合: IDXのために、 (ラベル、列挙で送信された)(データローダー): 印刷(IDX) 印刷(ラベル) 印刷(送られた) ブレーク プリント(LEN(sms_dataset)) プリント(LEN(データローダー))
0は (「ハム」、「スパム」) (「とポッピング<#> ibuprofens何の助けませんでした。」、「これは、我々は2接触のuを試してみましたが、2回目です。Uは、750ポンドの賞金を獲得している。2請求が簡単で、コール08712101358分あたりNOW!のみ10P。BT-国家-率') 5574 2787