mattilyra
diff --git a/‎Part01_prerequisites.ipynb
Lines changed: 615 additions & 48 deletions b/‎Part01_prerequisites.ipynb
Lines changed: 615 additions & 48 deletions
diff --git a/‎Part02_recurrent_neural_networks.ipynb
Lines changed: 1321 additions & 12 deletions b/‎Part02_recurrent_neural_networks.ipynb
Lines changed: 1321 additions & 12 deletions
diff --git a/‎Part03_transformer.ipynb
Lines changed: 12 additions & 3 deletions b/‎Part03_transformer.ipynb
Lines changed: 12 additions & 3 deletions
diff --git a/‎Pipfile
Lines changed: 4 additions & 1 deletion b/‎Pipfile
Lines changed: 4 additions & 1 deletion
diff --git a/‎Pipfile.lock
Lines changed: 259 additions & 115 deletions b/‎Pipfile.lock
Lines changed: 259 additions & 115 deletions
diff --git a/‎RNN-unrolled.png
-92 KB b/‎RNN-unrolled.png
-92 KB
diff --git a/‎clever_bert.jpg
-86.1 KB b/‎clever_bert.jpg
-86.1 KB
diff --git a/‎ferrari-miniature-red-35964.jpg
-128 KB b/‎ferrari-miniature-red-35964.jpg
-128 KB
diff --git a/‎finnish.jpg
-153 KB b/‎finnish.jpg
-153 KB
diff --git a/‎homer_cooking.gif
-687 KB b/‎homer_cooking.gif
-687 KB
diff --git a/‎homer_life_hard.gif
-493 KB b/‎homer_life_hard.gif
-493 KB
diff --git a/‎homer_reading.gif
-445 KB b/‎homer_reading.gif
-445 KB
diff --git a/‎kuusi_palaa.jpg
-56.9 KB b/‎kuusi_palaa.jpg
-56.9 KB
diff --git a/‎self-attention-matrix-calculation-2.png
-26.9 KB b/‎self-attention-matrix-calculation-2.png
-26.9 KB
diff --git a/‎transformer_input.png
-64.1 KB b/‎transformer_input.png
-64.1 KB
diff --git a/‎transformer_overview.png
-133 KB b/‎transformer_overview.png
-133 KB
diff --git a/‎utils.py
Lines changed: 2 additions & 2 deletions b/‎utils.py
Lines changed: 2 additions & 2 deletions
@@ -1830,7 +1830,7 @@
   },
   {
    "cell_type": "code",
-   "execution_count": 125,
+   "execution_count": 126,
    "metadata": {
     "slideshow": {
      "slide_type": "skip"
@@ -1845,7 +1845,14 @@
   },
   {
    "cell_type": "code",
-   "execution_count": 64,
+   "execution_count": null,
+   "metadata": {},
+   "outputs": [],
+   "source": []
+  },
+  {
+   "cell_type": "code",
+   "execution_count": 127,
    "metadata": {
     "slideshow": {
      "slide_type": "skip"
@@ -1875,13 +1882,15 @@
    },
    "outputs": [],
    "source": [
-    "from transformers import AdamW\n",
+    "from transformers import AdamW, BertForSequenceClassification\n",
     "from transformers.optimization import WarmupLinearSchedule\n",
     "\n",
     "num_epochs = 5\n",
+    "bert = BertForSequenceClassification.from_pretrained('bert-base-multilingual-cased', num_labels=len(torch.unique(y_train)))\n",
     "params = [p for n, p in bert.named_parameters()]\n",
     "optimizer = AdamW(params, lr=3e-5, correct_bias=False)\n",
     "\n",
+    "\n",
     "num_total_steps = num_epochs * (len(train_dataloader.sampler) // batch_size)\n",
     "num_warmup_steps = int(num_total_steps * 0.15)\n",
     "scheduler = WarmupLinearSchedule(optimizer, warmup_steps=num_warmup_steps, t_total=num_total_steps)"
 
@@ -16,12 +16,15 @@ future = "*"
 graphviz = "*"
 matplotlib = "*"
 seaborn = "*"
-spacy = "*"
 rise = "*"
 jupyter-contrib-nbextensions = "*"
 transformers = "*"
 ipdb = "*"
 networkx = "*"
+torchtext = "*"
+spacy = "*"
+h5py = "*"
+fastai = "*"
 
 [requires]
 python_version = "3.7"
@@ -1,11 +1,11 @@
 import pandas as pd
 
 def load_gnad():
-    with open('./data/10kgnad/train.csv', 'r') as fh:
+    with open('./train.csv', 'r') as fh:
         data = (line.split(';', 1) for line in fh)
         gnad_train = pd.DataFrame.from_records(data, columns=['category', 'text'])
 
-    with open('./data/10kgnad/test.csv', 'r') as fh:
+    with open('./test.csv', 'r') as fh:
         data = (line.split(';', 1) for line in fh)
         gnad_test = pd.DataFrame.from_records(data, columns=['category', 'text'])