add gru

0aqz0 · 0aqz0 · commit a1fc68b0ab4f · 2020-05-10T21:58:20.000+08:00
diff --git a/CSL_Skeleton_RNN.py b/CSL_Skeleton_RNN.py
@@ -8,7 +8,7 @@
 import torch.optim as optim
 from torch.utils.data import DataLoader, random_split
 from torch.utils.tensorboard import SummaryWriter
-from models.LSTM import LSTM
+from models.RNN import LSTM, GRU
 from dataset import CSL_Skeleton
 from train import train_epoch
 from validation import val_epoch
@@ -39,13 +39,13 @@
 num_classes = 100
 sample_duration = 16
 selected_joints = ['HANDLEFT', 'HANDRIGHT', 'ELBOWLEFT', 'ELBOWRIGHT']
-lstm_input_size = len(selected_joints)*2
-lstm_hidden_size = 512
-lstm_num_layers = 1
+input_size = len(selected_joints)*2
+hidden_size = 512
+num_layers = 1
 hidden1 = 512
 drop_p = 0.0
 
-# Train with Skeleton+LSTM
+# Train with Skeleton+RNN
 if __name__ == '__main__':
     # Load data
     transform = None # TODO
@@ -57,7 +57,9 @@
     train_loader = DataLoader(train_set, batch_size=batch_size, shuffle=True, num_workers=4, pin_memory=True)
     val_loader = DataLoader(val_set, batch_size=batch_size, shuffle=True, num_workers=4, pin_memory=True)
     # Create model
-    model = LSTM(lstm_input_size=lstm_input_size, lstm_hidden_size=lstm_hidden_size, lstm_num_layers=lstm_num_layers,
+    # model = LSTM(lstm_input_size=input_size, lstm_hidden_size=hidden_size, lstm_num_layers=num_layers,
+    #     num_classes=num_classes, hidden1=hidden1, drop_p=drop_p).to(device)
+    model = GRU(gru_input_size=input_size, gru_hidden_size=hidden_size, gru_num_layers=num_layers,
         num_classes=num_classes, hidden1=hidden1, drop_p=drop_p).to(device)
     # Run the model parallelly
     if torch.cuda.device_count() > 1:
diff --git a/models/LSTM.py b/models/LSTM.py
diff --git a/models/RNN.py b/models/RNN.py
@@ -0,0 +1,104 @@
+import torch
+import torch.nn as nn
+import torch.nn.functional as F
+
+"""
+Implementation of LSTM
+Reference: SIGN LANGUAGE RECOGNITION WITH LONG SHORT-TERM MEMORY
+"""
+class LSTM(nn.Module):
+    def __init__(self, lstm_input_size=512, lstm_hidden_size=512, lstm_num_layers=3,
+                num_classes=100, hidden1=256, drop_p=0.0):
+        super(LSTM, self).__init__()
+        # network params
+        self.lstm_input_size = lstm_input_size
+        self.lstm_hidden_size = lstm_hidden_size
+        self.lstm_num_layers = lstm_num_layers
+        self.num_classes = num_classes
+        self.hidden1 = hidden1
+        self.drop_p = drop_p
+
+        # network architecture
+        self.lstm = nn.LSTM(
+            input_size=self.lstm_input_size,
+            hidden_size=self.lstm_hidden_size,
+            num_layers=self.lstm_num_layers,
+            batch_first=True,
+        )
+        self.drop = nn.Dropout2d(p=self.drop_p)
+        self.fc1 = nn.Linear(self.lstm_hidden_size, self.hidden1)
+        self.fc2 = nn.Linear(self.hidden1, self.num_classes)
+
+    def forward(self, x):
+        # LSTM
+        # use faster code paths
+        self.lstm.flatten_parameters()
+        # print(x.shape)
+        # batch first: (batch, seq, feature)
+        out, (h_n, c_n) = self.lstm(x, None)
+        # MLP
+        # out: (batch, seq, feature), choose the last time step
+        out = F.relu(self.fc1(out[:, -1, :]))
+        out = F.dropout(out, p=self.drop_p, training=self.training)
+        out = self.fc2(out)
+
+        return out
+
+
+"""
+Implementation of GRU
+"""
+class GRU(nn.Module):
+    def __init__(self, gru_input_size=512, gru_hidden_size=512, gru_num_layers=3,
+                num_classes=100, hidden1=256, drop_p=0.0):
+        super(GRU, self).__init__()
+        # network params
+        self.gru_input_size = gru_input_size
+        self.gru_hidden_size = gru_hidden_size
+        self.gru_num_layers = gru_num_layers
+        self.num_classes = num_classes
+        self.hidden1 = hidden1
+        self.drop_p = drop_p
+
+        # network architecture
+        self.gru = nn.GRU(
+            input_size=self.gru_input_size,
+            hidden_size=self.gru_hidden_size,
+            num_layers=self.gru_num_layers,
+            batch_first=True,
+        )
+        self.drop = nn.Dropout2d(p=self.drop_p)
+        self.fc1 = nn.Linear(self.gru_hidden_size, self.hidden1)
+        self.fc2 = nn.Linear(self.hidden1, self.num_classes)
+
+    def forward(self, x):
+        # GRU
+        # use faster code paths
+        self.gru.flatten_parameters()
+        # print(x.shape)
+        # batch first: (batch, seq, feature)
+        out, hidden = self.gru(x, None)
+        # MLP
+        # out: (batch, seq, feature), choose the last time step
+        out = F.relu(self.fc1(out[:, -1, :]))
+        out = F.dropout(out, p=self.drop_p, training=self.training)
+        out = self.fc2(out)
+
+        return out
+
+# Test
+if __name__ == '__main__':
+    import sys
+    sys.path.append("..")
+    from dataset import CSL_Skeleton
+    selected_joints = ['HANDLEFT', 'HANDRIGHT', 'ELBOWLEFT', 'ELBOWRIGHT']
+    dataset = CSL_Skeleton(data_path="/home/haodong/Data/CSL_Isolated/xf500_body_depth_txt",
+        label_path="/home/haodong/Data/CSL_Isolated/dictionary.txt", selected_joints=selected_joints)
+    input_size = len(selected_joints)*2
+    # test LSTM
+    lstm = LSTM(lstm_input_size=input_size)
+    print(lstm(dataset[0]['data'].unsqueeze(0)))
+
+    # test GRU
+    gru = GRU(gru_input_size=input_size)
+    print(gru(dataset[0]['data'].unsqueeze(0)))