.. DO NOT EDIT.
.. THIS FILE WAS AUTOMATICALLY GENERATED BY SPHINX-GALLERY.
.. TO MAKE CHANGES, EDIT THE SOURCE PYTHON FILE:
.. "examples/Custom/neural_net.py"
.. LINE NUMBERS ARE GIVEN BELOW.

.. only:: html

    .. note::
        :class: sphx-glr-download-link-note

        :ref:`Go to the end <sphx_glr_download_examples_Custom_neural_net.py>`
        to download the full example code.

.. rst-class:: sphx-glr-example-title

.. _sphx_glr_examples_Custom_neural_net.py:


Simple Neural Network
=====================

This example solves a simple binary classification problem using a basic
neural network with 2 layers.

The classification problem is generated by the make_moons dataset generator
from scikit--learn.

.. GENERATED FROM PYTHON SOURCE LINES 13-25

.. code-block:: Python

    import matplotlib.pyplot as plt
    from utils.plotting import plot_decision_boundary
    from tqdm import tqdm
    import torch as pt
    import torch.nn as nn
    from torch.utils.data import TensorDataset, DataLoader

    from sklearn.model_selection import train_test_split

    from skwdro.torch import robustify


.. GENERATED FROM PYTHON SOURCE LINES 26-28

Problem setup
~~~~~~~~~~~~~

.. GENERATED FROM PYTHON SOURCE LINES 28-38

.. code-block:: Python


    from sklearn.datasets import make_moons

    n = 512 + 64

    X, y = make_moons(n_samples=n,
                      noise=0.05,
                      random_state=42)


.. GENERATED FROM PYTHON SOURCE LINES 39-41

Visualize the data
~~~~~~~~~~~~~~~~~~

.. GENERATED FROM PYTHON SOURCE LINES 41-45

.. code-block:: Python


    plt.scatter(X[:, 0], X[:, 1], c=y, cmap=plt.cm.RdYlBu)  # type: ignore
    plt.show()


.. image-sg:: /examples/Custom/images/sphx_glr_neural_net_001.png
   :alt: neural net
   :srcset: /examples/Custom/images/sphx_glr_neural_net_001.png
   :class: sphx-glr-single-img


.. GENERATED FROM PYTHON SOURCE LINES 46-48

Preprocessing
~~~~~~~~~~~~~

.. GENERATED FROM PYTHON SOURCE LINES 48-75

.. code-block:: Python


    # Split the data into train and test sets
    X_train, X_test, y_train, y_test = train_test_split(
        X,
        y,
        train_size=512,
        test_size=64,
        random_state=42
    )

    device = "cuda" if pt.cuda.is_available() else "cpu"

    # Turn data into tensors
    full_batch_x = pt.from_numpy(X_train).to(device)
    full_batch_y = pt.from_numpy(y_train).unsqueeze(-1).to(full_batch_x)
    dataset = DataLoader(
        TensorDataset(
            full_batch_x,
            full_batch_y
        ),
        batch_size=64
    )

    batch_x_test = pt.from_numpy(X_train).to(device)
    batch_y_test = pt.from_numpy(y_train).unsqueeze(-1).to(batch_x_test)


.. GENERATED FROM PYTHON SOURCE LINES 76-78

Two-layers model
~~~~~~~~~~~~~~~~

.. GENERATED FROM PYTHON SOURCE LINES 78-96

.. code-block:: Python


    class SimpleNN(nn.Module):
        def __init__(self, in_features, out_features, hidden_units):
            super().__init__()
            # Two hidden layers and logit output
            self.linear_relu_stack = nn.Sequential(
                nn.Linear(in_features, hidden_units),
                nn.ReLU(),
                nn.Linear(hidden_units, hidden_units),
                nn.ReLU(),
                nn.Linear(hidden_units, out_features),
            )

        def forward(self, x):
            logits = self.linear_relu_stack(x)
            return logits


.. GENERATED FROM PYTHON SOURCE LINES 97-99

Set the model up
~~~~~~~~~~~~~~~~

.. GENERATED FROM PYTHON SOURCE LINES 99-126

.. code-block:: Python


    model = SimpleNN(
        in_features=2,
        out_features=1,
        hidden_units=5
    ).to(full_batch_x)


    print(model)


    loss_fn = nn.BCEWithLogitsLoss(reduction='none')

    # Define a sample batch for initialization
    sample_batch_x, sample_batch_y = next(iter(dataset))


    # Robust loss
    robust_loss = robustify(
        loss_fn,
        model,
        pt.tensor(1e-4),
        sample_batch_x, sample_batch_y,
        cost_spec="t-NC-2-2",
        n_samples=16
    )  # Replaces the loss of the model by the dual WDRO loss


.. rst-class:: sphx-glr-script-out

 .. code-block:: none

    SimpleNN(
      (linear_relu_stack): Sequential(
        (0): Linear(in_features=2, out_features=5, bias=True)
        (1): ReLU()
        (2): Linear(in_features=5, out_features=5, bias=True)
        (3): ReLU()
        (4): Linear(in_features=5, out_features=1, bias=True)
      )
    )


.. GENERATED FROM PYTHON SOURCE LINES 127-129

Training loop
~~~~~~~~~~~~~

.. GENERATED FROM PYTHON SOURCE LINES 129-171

.. code-block:: Python


    pt.manual_seed(42)
    epochs = 250

    # optimizer = pt.optim.AdamW(params=model.parameters(),lr=1e-2)
    optimizer = pt.optim.AdamW(params=robust_loss.parameters())


    # Training loop
    iterator = tqdm(range(epochs), position=0, desc='Epochs', leave=False)
    losses = []
    for epoch in iterator:

        avg_testloss = 0.
        for batch_x, batch_y in tqdm(dataset, position=1, desc='Sample', leave=False):

            # ## Training
            model.train()

            optimizer.zero_grad()
            # loss = loss_fn(model(batch_x.squeeze()), batch_y)
            loss = robust_loss(batch_x, batch_y, reset_sampler=True)
            loss.backward()
            optimizer.step()

            # ## Testing
            model.eval()
            with pt.no_grad():
                # Forward pass
                test_logits = model(batch_x_test)
                test_pred = pt.round(pt.sigmoid(test_logits))
                # Compute the loss
                avg_testloss += loss_fn(test_logits, batch_y_test).mean().item()
            iterator.set_postfix(
                {'acc': f"{(test_pred == batch_y_test).float().mean().item()*100}%"}
            )
            losses.append(loss.item())

        # Print
        iterator.set_postfix({'loss': avg_testloss / len(dataset)})


.. rst-class:: sphx-glr-script-out

 .. code-block:: none

    Epochs:   0%|          | 0/250 [00:00<?, ?it/s]
    Sample:   0%|          | 0/8 [00:00<?, ?it/s]    Epochs:   0%|          | 0/250 [00:00<?, ?it/s, acc=50.5859375%]    Epochs:   0%|          | 0/250 [00:00<?, ?it/s, acc=50.5859375%]    Epochs:   0%|          | 0/250 [00:00<?, ?it/s, acc=50.5859375%]    Epochs:   0%|          | 0/250 [00:00<?, ?it/s, acc=50.5859375%]    Epochs:   0%|          | 0/250 [00:00<?, ?it/s, acc=50.5859375%]    Epochs:   0%|          | 0/250 [00:00<?, ?it/s, acc=50.5859375%]    Epochs:   0%|          | 0/250 [00:00<?, ?it/s, acc=50.5859375%]    Epochs:   0%|          | 0/250 [00:00<?, ?it/s, acc=50.5859375%]
                                                     Epochs:   0%|          | 0/250 [00:00<?, ?it/s, loss=0.719]     
    Sample:   0%|          | 0/8 [00:00<?, ?it/s]    Epochs:   0%|          | 0/250 [00:00<?, ?it/s, acc=50.5859375%]    Epochs:   0%|          | 0/250 [00:00<?, ?it/s, acc=50.5859375%]    Epochs:   0%|          | 0/250 [00:00<?, ?it/s, acc=50.5859375%]    Epochs:   0%|          | 0/250 [00:00<?, ?it/s, acc=50.5859375%]    Epochs:   0%|          | 0/250 [00:00<?, ?it/s, acc=50.5859375%]    Epochs:   0%|          | 0/250 [00:00<?, ?it/s, acc=50.5859375%]    Epochs:   0%|          | 0/250 [00:00<?, ?it/s, acc=50.5859375%]    Epochs:   0%|          | 0/250 [00:00<?, ?it/s, acc=50.5859375%]
                                                     Epochs:   0%|          | 0/250 [00:00<?, ?it/s, loss=0.715]         Epochs:   1%|          | 2/250 [00:00<00:12, 19.34it/s, loss=0.715]
    Sample:   0%|          | 0/8 [00:00<?, ?it/s]    Epochs:   1%|          | 2/250 [00:00<00:12, 19.34it/s, acc=50.5859375%]    Epochs:   1%|          | 2/250 [00:00<00:12, 19.34it/s, acc=50.5859375%]    Epochs:   1%|          | 2/250 [00:00<00:12, 19.34it/s, acc=50.5859375%]    Epochs:   1%|          | 2/250 [00:00<00:12, 19.34it/s, acc=50.5859375%]    Epochs:   1%|          | 2/250 [00:00<00:12, 19.34it/s, acc=50.5859375%]    Epochs:   1%|          | 2/250 [00:00<00:12, 19.34it/s, acc=50.5859375%]    Epochs:   1%|          | 2/250 [00:00<00:12, 19.34it/s, acc=50.5859375%]    Epochs:   1%|          | 2/250 [00:00<00:12, 19.34it/s, acc=50.5859375%]
                                                     Epochs:   1%|          | 2/250 [00:00<00:12, 19.34it/s, loss=0.712]     
    Sample:   0%|          | 0/8 [00:00<?, ?it/s]    Epochs:   1%|          | 2/250 [00:00<00:12, 19.34it/s, acc=50.5859375%]    Epochs:   1%|          | 2/250 [00:00<00:12, 19.34it/s, acc=50.5859375%]    Epochs:   1%|          | 2/250 [00:00<00:12, 19.34it/s, acc=50.5859375%]    Epochs:   1%|          | 2/250 [00:00<00:12, 19.34it/s, acc=50.5859375%]    Epochs:   1%|          | 2/250 [00:00<00:12, 19.34it/s, acc=50.5859375%]    Epochs:   1%|          | 2/250 [00:00<00:12, 19.34it/s, acc=50.5859375%]    Epochs:   1%|          | 2/250 [00:00<00:12, 19.34it/s, acc=50.5859375%]    Epochs:   1%|          | 2/250 [00:00<00:12, 19.34it/s, acc=50.5859375%]
                                                     Epochs:   1%|          | 2/250 [00:00<00:12, 19.34it/s, loss=0.709]         Epochs:   2%|▏         | 4/250 [00:00<00:12, 19.49it/s, loss=0.709]
    Sample:   0%|          | 0/8 [00:00<?, ?it/s]    Epochs:   2%|▏         | 4/250 [00:00<00:12, 19.49it/s, acc=50.5859375%]    Epochs:   2%|▏         | 4/250 [00:00<00:12, 19.49it/s, acc=50.5859375%]    Epochs:   2%|▏         | 4/250 [00:00<00:12, 19.49it/s, acc=50.5859375%]    Epochs:   2%|▏         | 4/250 [00:00<00:12, 19.49it/s, acc=50.5859375%]    Epochs:   2%|▏         | 4/250 [00:00<00:12, 19.49it/s, acc=50.5859375%]    Epochs:   2%|▏         | 4/250 [00:00<00:12, 19.49it/s, acc=50.5859375%]    Epochs:   2%|▏         | 4/250 [00:00<00:12, 19.49it/s, acc=50.5859375%]    Epochs:   2%|▏         | 4/250 [00:00<00:12, 19.49it/s, acc=50.5859375%]
                                                     Epochs:   2%|▏         | 4/250 [00:00<00:12, 19.49it/s, loss=0.706]     
    Sample:   0%|          | 0/8 [00:00<?, ?it/s]    Epochs:   2%|▏         | 4/250 [00:00<00:12, 19.49it/s, acc=50.5859375%]    Epochs:   2%|▏         | 4/250 [00:00<00:12, 19.49it/s, acc=50.5859375%]    Epochs:   2%|▏         | 4/250 [00:00<00:12, 19.49it/s, acc=50.5859375%]    Epochs:   2%|▏         | 4/250 [00:00<00:12, 19.49it/s, acc=50.5859375%]    Epochs:   2%|▏         | 4/250 [00:00<00:12, 19.49it/s, acc=50.5859375%]    Epochs:   2%|▏         | 4/250 [00:00<00:12, 19.49it/s, acc=50.5859375%]    Epochs:   2%|▏         | 4/250 [00:00<00:12, 19.49it/s, acc=50.5859375%]    Epochs:   2%|▏         | 4/250 [00:00<00:12, 19.49it/s, acc=50.5859375%]
                                                     Epochs:   2%|▏         | 4/250 [00:00<00:12, 19.49it/s, loss=0.703]         Epochs:   2%|▏         | 6/250 [00:00<00:12, 19.59it/s, loss=0.703]
    Sample:   0%|          | 0/8 [00:00<?, ?it/s]    Epochs:   2%|▏         | 6/250 [00:00<00:12, 19.59it/s, acc=50.5859375%]    Epochs:   2%|▏         | 6/250 [00:00<00:12, 19.59it/s, acc=50.5859375%]    Epochs:   2%|▏         | 6/250 [00:00<00:12, 19.59it/s, acc=50.5859375%]    Epochs:   2%|▏         | 6/250 [00:00<00:12, 19.59it/s, acc=50.5859375%]    Epochs:   2%|▏         | 6/250 [00:00<00:12, 19.59it/s, acc=50.5859375%]    Epochs:   2%|▏         | 6/250 [00:00<00:12, 19.59it/s, acc=50.5859375%]    Epochs:   2%|▏         | 6/250 [00:00<00:12, 19.59it/s, acc=50.5859375%]    Epochs:   2%|▏         | 6/250 [00:00<00:12, 19.59it/s, acc=50.5859375%]
                                                     Epochs:   2%|▏         | 6/250 [00:00<00:12, 19.59it/s, loss=0.701]     
    Sample:   0%|          | 0/8 [00:00<?, ?it/s]    Epochs:   2%|▏         | 6/250 [00:00<00:12, 19.59it/s, acc=50.5859375%]    Epochs:   2%|▏         | 6/250 [00:00<00:12, 19.59it/s, acc=50.5859375%]    Epochs:   2%|▏         | 6/250 [00:00<00:12, 19.59it/s, acc=50.5859375%]    Epochs:   2%|▏         | 6/250 [00:00<00:12, 19.59it/s, acc=50.5859375%]    Epochs:   2%|▏         | 6/250 [00:00<00:12, 19.59it/s, acc=50.5859375%]    Epochs:   2%|▏         | 6/250 [00:00<00:12, 19.59it/s, acc=50.5859375%]    Epochs:   2%|▏         | 6/250 [00:00<00:12, 19.59it/s, acc=50.5859375%]    Epochs:   2%|▏         | 6/250 [00:00<00:12, 19.59it/s, acc=50.5859375%]
                                                     Epochs:   2%|▏         | 6/250 [00:00<00:12, 19.59it/s, loss=0.699]         Epochs:   3%|▎         | 8/250 [00:00<00:12, 19.48it/s, loss=0.699]
    Sample:   0%|          | 0/8 [00:00<?, ?it/s]    Epochs:   3%|▎         | 8/250 [00:00<00:12, 19.48it/s, acc=50.5859375%]    Epochs:   3%|▎         | 8/250 [00:00<00:12, 19.48it/s, acc=50.5859375%]    Epochs:   3%|▎         | 8/250 [00:00<00:12, 19.48it/s, acc=50.5859375%]    Epochs:   3%|▎         | 8/250 [00:00<00:12, 19.48it/s, acc=50.5859375%]    Epochs:   3%|▎         | 8/250 [00:00<00:12, 19.48it/s, acc=50.5859375%]    Epochs:   3%|▎         | 8/250 [00:00<00:12, 19.48it/s, acc=50.5859375%]    Epochs:   3%|▎         | 8/250 [00:00<00:12, 19.48it/s, acc=50.5859375%]    Epochs:   3%|▎         | 8/250 [00:00<00:12, 19.48it/s, acc=50.5859375%]
                                                     Epochs:   3%|▎         | 8/250 [00:00<00:12, 19.48it/s, loss=0.698]     
    Sample:   0%|          | 0/8 [00:00<?, ?it/s]    Epochs:   3%|▎         | 8/250 [00:00<00:12, 19.48it/s, acc=50.5859375%]    Epochs:   3%|▎         | 8/250 [00:00<00:12, 19.48it/s, acc=50.5859375%]    Epochs:   3%|▎         | 8/250 [00:00<00:12, 19.48it/s, acc=50.5859375%]    Epochs:   3%|▎         | 8/250 [00:00<00:12, 19.48it/s, acc=50.5859375%]    Epochs:   3%|▎         | 8/250 [00:00<00:12, 19.48it/s, acc=50.5859375%]    Epochs:   3%|▎         | 8/250 [00:00<00:12, 19.48it/s, acc=50.5859375%]    Epochs:   3%|▎         | 8/250 [00:00<00:12, 19.48it/s, acc=50.5859375%]    Epochs:   3%|▎         | 8/250 [00:00<00:12, 19.48it/s, acc=50.5859375%]
                                                     Epochs:   3%|▎         | 8/250 [00:00<00:12, 19.48it/s, loss=0.696]         Epochs:   4%|▍         | 10/250 [00:00<00:12, 19.51it/s, loss=0.696]
    Sample:   0%|          | 0/8 [00:00<?, ?it/s]    Epochs:   4%|▍         | 10/250 [00:00<00:12, 19.51it/s, acc=50.5859375%]    Epochs:   4%|▍         | 10/250 [00:00<00:12, 19.51it/s, acc=50.5859375%]    Epochs:   4%|▍         | 10/250 [00:00<00:12, 19.51it/s, acc=50.5859375%]    Epochs:   4%|▍         | 10/250 [00:00<00:12, 19.51it/s, acc=50.5859375%]    Epochs:   4%|▍         | 10/250 [00:00<00:12, 19.51it/s, acc=50.5859375%]    Epochs:   4%|▍         | 10/250 [00:00<00:12, 19.51it/s, acc=50.5859375%]    Epochs:   4%|▍         | 10/250 [00:00<00:12, 19.51it/s, acc=50.5859375%]    Epochs:   4%|▍         | 10/250 [00:00<00:12, 19.51it/s, acc=50.5859375%]
                                                     Epochs:   4%|▍         | 10/250 [00:00<00:12, 19.51it/s, loss=0.695]     
    Sample:   0%|          | 0/8 [00:00<?, ?it/s]    Epochs:   4%|▍         | 10/250 [00:00<00:12, 19.51it/s, acc=50.5859375%]    Epochs:   4%|▍         | 10/250 [00:00<00:12, 19.51it/s, acc=50.5859375%]    Epochs:   4%|▍         | 10/250 [00:00<00:12, 19.51it/s, acc=50.5859375%]    Epochs:   4%|▍         | 10/250 [00:00<00:12, 19.51it/s, acc=50.5859375%]    Epochs:   4%|▍         | 10/250 [00:00<00:12, 19.51it/s, acc=50.5859375%]    Epochs:   4%|▍         | 10/250 [00:00<00:12, 19.51it/s, acc=50.5859375%]    Epochs:   4%|▍         | 10/250 [00:00<00:12, 19.51it/s, acc=50.5859375%]    Epochs:   4%|▍         | 10/250 [00:00<00:12, 19.51it/s, acc=50.5859375%]
                                                     Epochs:   4%|▍         | 10/250 [00:00<00:12, 19.51it/s, loss=0.693]         Epochs:   5%|▍         | 12/250 [00:00<00:12, 19.61it/s, loss=0.693]
    Sample:   0%|          | 0/8 [00:00<?, ?it/s]    Epochs:   5%|▍         | 12/250 [00:00<00:12, 19.61it/s, acc=50.5859375%]    Epochs:   5%|▍         | 12/250 [00:00<00:12, 19.61it/s, acc=50.5859375%]    Epochs:   5%|▍         | 12/250 [00:00<00:12, 19.61it/s, acc=50.5859375%]    Epochs:   5%|▍         | 12/250 [00:00<00:12, 19.61it/s, acc=50.5859375%]    Epochs:   5%|▍         | 12/250 [00:00<00:12, 19.61it/s, acc=50.5859375%]    Epochs:   5%|▍         | 12/250 [00:00<00:12, 19.61it/s, acc=50.5859375%]    Epochs:   5%|▍         | 12/250 [00:00<00:12, 19.61it/s, acc=50.5859375%]    Epochs:   5%|▍         | 12/250 [00:00<00:12, 19.61it/s, acc=50.5859375%]
                                                     Epochs:   5%|▍         | 12/250 [00:00<00:12, 19.61it/s, loss=0.692]     
    Sample:   0%|          | 0/8 [00:00<?, ?it/s]    Epochs:   5%|▍         | 12/250 [00:00<00:12, 19.61it/s, acc=50.5859375%]    Epochs:   5%|▍         | 12/250 [00:00<00:12, 19.61it/s, acc=50.5859375%]    Epochs:   5%|▍         | 12/250 [00:00<00:12, 19.61it/s, acc=50.5859375%]    Epochs:   5%|▍         | 12/250 [00:00<00:12, 19.61it/s, acc=50.5859375%]    Epochs:   5%|▍         | 12/250 [00:00<00:12, 19.61it/s, acc=50.5859375%]    Epochs:   5%|▍         | 12/250 [00:00<00:12, 19.61it/s, acc=50.5859375%]    Epochs:   5%|▍         | 12/250 [00:00<00:12, 19.61it/s, acc=50.5859375%]    Epochs:   5%|▍         | 12/250 [00:00<00:12, 19.61it/s, acc=50.5859375%]
                                                     Epochs:   5%|▍         | 12/250 [00:00<00:12, 19.61it/s, loss=0.69]          Epochs:   6%|▌         | 14/250 [00:00<00:11, 19.67it/s, loss=0.69]
    Sample:   0%|          | 0/8 [00:00<?, ?it/s]    Epochs:   6%|▌         | 14/250 [00:00<00:11, 19.67it/s, acc=50.5859375%]    Epochs:   6%|▌         | 14/250 [00:00<00:11, 19.67it/s, acc=50.5859375%]    Epochs:   6%|▌         | 14/250 [00:00<00:11, 19.67it/s, acc=50.5859375%]    Epochs:   6%|▌         | 14/250 [00:00<00:11, 19.67it/s, acc=50.5859375%]    Epochs:   6%|▌         | 14/250 [00:00<00:11, 19.67it/s, acc=50.5859375%]    Epochs:   6%|▌         | 14/250 [00:00<00:11, 19.67it/s, acc=50.5859375%]    Epochs:   6%|▌         | 14/250 [00:00<00:11, 19.67it/s, acc=50.5859375%]    Epochs:   6%|▌         | 14/250 [00:00<00:11, 19.67it/s, acc=50.5859375%]
                                                     Epochs:   6%|▌         | 14/250 [00:00<00:11, 19.67it/s, loss=0.688]     
    Sample:   0%|          | 0/8 [00:00<?, ?it/s]    Epochs:   6%|▌         | 14/250 [00:00<00:11, 19.67it/s, acc=50.5859375%]    Epochs:   6%|▌         | 14/250 [00:00<00:11, 19.67it/s, acc=50.5859375%]    Epochs:   6%|▌         | 14/250 [00:00<00:11, 19.67it/s, acc=50.5859375%]    Epochs:   6%|▌         | 14/250 [00:00<00:11, 19.67it/s, acc=50.5859375%]    Epochs:   6%|▌         | 14/250 [00:00<00:11, 19.67it/s, acc=50.5859375%]    Epochs:   6%|▌         | 14/250 [00:00<00:11, 19.67it/s, acc=50.5859375%]    Epochs:   6%|▌         | 14/250 [00:00<00:11, 19.67it/s, acc=50.5859375%]    Epochs:   6%|▌         | 14/250 [00:00<00:11, 19.67it/s, acc=50.5859375%]
                                                     Epochs:   6%|▌         | 14/250 [00:00<00:11, 19.67it/s, loss=0.687]         Epochs:   6%|▋         | 16/250 [00:00<00:11, 19.66it/s, loss=0.687]
    Sample:   0%|          | 0/8 [00:00<?, ?it/s]    Epochs:   6%|▋         | 16/250 [00:00<00:11, 19.66it/s, acc=50.5859375%]    Epochs:   6%|▋         | 16/250 [00:00<00:11, 19.66it/s, acc=50.5859375%]    Epochs:   6%|▋         | 16/250 [00:00<00:11, 19.66it/s, acc=50.5859375%]    Epochs:   6%|▋         | 16/250 [00:00<00:11, 19.66it/s, acc=50.5859375%]    Epochs:   6%|▋         | 16/250 [00:00<00:11, 19.66it/s, acc=50.5859375%]    Epochs:   6%|▋         | 16/250 [00:00<00:11, 19.66it/s, acc=50.5859375%]    Epochs:   6%|▋         | 16/250 [00:00<00:11, 19.66it/s, acc=50.5859375%]    Epochs:   6%|▋         | 16/250 [00:00<00:11, 19.66it/s, acc=50.5859375%]
                                                     Epochs:   6%|▋         | 16/250 [00:00<00:11, 19.66it/s, loss=0.685]     
    Sample:   0%|          | 0/8 [00:00<?, ?it/s]    Epochs:   6%|▋         | 16/250 [00:00<00:11, 19.66it/s, acc=50.5859375%]    Epochs:   6%|▋         | 16/250 [00:00<00:11, 19.66it/s, acc=50.5859375%]    Epochs:   6%|▋         | 16/250 [00:00<00:11, 19.66it/s, acc=50.5859375%]    Epochs:   6%|▋         | 16/250 [00:00<00:11, 19.66it/s, acc=50.5859375%]    Epochs:   6%|▋         | 16/250 [00:00<00:11, 19.66it/s, acc=50.5859375%]    Epochs:   6%|▋         | 16/250 [00:00<00:11, 19.66it/s, acc=50.5859375%]    Epochs:   6%|▋         | 16/250 [00:00<00:11, 19.66it/s, acc=50.5859375%]    Epochs:   6%|▋         | 16/250 [00:00<00:11, 19.66it/s, acc=50.5859375%]
                                                     Epochs:   6%|▋         | 16/250 [00:00<00:11, 19.66it/s, loss=0.683]         Epochs:   7%|▋         | 18/250 [00:00<00:11, 19.68it/s, loss=0.683]
    Sample:   0%|          | 0/8 [00:00<?, ?it/s]    Epochs:   7%|▋         | 18/250 [00:00<00:11, 19.68it/s, acc=50.5859375%]    Epochs:   7%|▋         | 18/250 [00:00<00:11, 19.68it/s, acc=50.5859375%]    Epochs:   7%|▋         | 18/250 [00:00<00:11, 19.68it/s, acc=50.5859375%]    Epochs:   7%|▋         | 18/250 [00:00<00:11, 19.68it/s, acc=50.5859375%]    Epochs:   7%|▋         | 18/250 [00:00<00:11, 19.68it/s, acc=50.5859375%]    Epochs:   7%|▋         | 18/250 [00:00<00:11, 19.68it/s, acc=50.5859375%]    Epochs:   7%|▋         | 18/250 [00:00<00:11, 19.68it/s, acc=50.5859375%]    Epochs:   7%|▋         | 18/250 [00:00<00:11, 19.68it/s, acc=50.5859375%]
                                                     Epochs:   7%|▋         | 18/250 [00:00<00:11, 19.68it/s, loss=0.681]     
    Sample:   0%|          | 0/8 [00:00<?, ?it/s]    Epochs:   7%|▋         | 18/250 [00:00<00:11, 19.68it/s, acc=50.5859375%]    Epochs:   7%|▋         | 18/250 [00:00<00:11, 19.68it/s, acc=50.5859375%]    Epochs:   7%|▋         | 18/250 [00:00<00:11, 19.68it/s, acc=50.5859375%]    Epochs:   7%|▋         | 18/250 [00:00<00:11, 19.68it/s, acc=50.5859375%]    Epochs:   7%|▋         | 18/250 [00:00<00:11, 19.68it/s, acc=50.5859375%]    Epochs:   7%|▋         | 18/250 [00:01<00:11, 19.68it/s, acc=50.5859375%]    Epochs:   7%|▋         | 18/250 [00:01<00:11, 19.68it/s, acc=50.5859375%]    Epochs:   7%|▋         | 18/250 [00:01<00:11, 19.68it/s, acc=50.5859375%]
                                                     Epochs:   7%|▋         | 18/250 [00:01<00:11, 19.68it/s, loss=0.679]         Epochs:   8%|▊         | 20/250 [00:01<00:11, 19.71it/s, loss=0.679]
    Sample:   0%|          | 0/8 [00:00<?, ?it/s]    Epochs:   8%|▊         | 20/250 [00:01<00:11, 19.71it/s, acc=50.5859375%]    Epochs:   8%|▊         | 20/250 [00:01<00:11, 19.71it/s, acc=50.5859375%]    Epochs:   8%|▊         | 20/250 [00:01<00:11, 19.71it/s, acc=50.5859375%]    Epochs:   8%|▊         | 20/250 [00:01<00:11, 19.71it/s, acc=50.5859375%]    Epochs:   8%|▊         | 20/250 [00:01<00:11, 19.71it/s, acc=50.5859375%]    Epochs:   8%|▊         | 20/250 [00:01<00:11, 19.71it/s, acc=50.5859375%]    Epochs:   8%|▊         | 20/250 [00:01<00:11, 19.71it/s, acc=50.5859375%]    Epochs:   8%|▊         | 20/250 [00:01<00:11, 19.71it/s, acc=50.5859375%]
                                                     Epochs:   8%|▊         | 20/250 [00:01<00:11, 19.71it/s, loss=0.677]     
    Sample:   0%|          | 0/8 [00:00<?, ?it/s]    Epochs:   8%|▊         | 20/250 [00:01<00:11, 19.71it/s, acc=50.5859375%]    Epochs:   8%|▊         | 20/250 [00:01<00:11, 19.71it/s, acc=50.5859375%]    Epochs:   8%|▊         | 20/250 [00:01<00:11, 19.71it/s, acc=50.5859375%]    Epochs:   8%|▊         | 20/250 [00:01<00:11, 19.71it/s, acc=50.5859375%]    Epochs:   8%|▊         | 20/250 [00:01<00:11, 19.71it/s, acc=50.5859375%]    Epochs:   8%|▊         | 20/250 [00:01<00:11, 19.71it/s, acc=50.5859375%]    Epochs:   8%|▊         | 20/250 [00:01<00:11, 19.71it/s, acc=50.5859375%]    Epochs:   8%|▊         | 20/250 [00:01<00:11, 19.71it/s, acc=50.5859375%]
                                                     Epochs:   8%|▊         | 20/250 [00:01<00:11, 19.71it/s, loss=0.675]         Epochs:   9%|▉         | 22/250 [00:01<00:11, 19.74it/s, loss=0.675]
    Sample:   0%|          | 0/8 [00:00<?, ?it/s]    Epochs:   9%|▉         | 22/250 [00:01<00:11, 19.74it/s, acc=50.5859375%]    Epochs:   9%|▉         | 22/250 [00:01<00:11, 19.74it/s, acc=50.5859375%]    Epochs:   9%|▉         | 22/250 [00:01<00:11, 19.74it/s, acc=50.5859375%]    Epochs:   9%|▉         | 22/250 [00:01<00:11, 19.74it/s, acc=50.5859375%]    Epochs:   9%|▉         | 22/250 [00:01<00:11, 19.74it/s, acc=50.5859375%]    Epochs:   9%|▉         | 22/250 [00:01<00:11, 19.74it/s, acc=50.5859375%]    Epochs:   9%|▉         | 22/250 [00:01<00:11, 19.74it/s, acc=50.5859375%]    Epochs:   9%|▉         | 22/250 [00:01<00:11, 19.74it/s, acc=50.5859375%]
                                                     Epochs:   9%|▉         | 22/250 [00:01<00:11, 19.74it/s, loss=0.673]     
    Sample:   0%|          | 0/8 [00:00<?, ?it/s]    Epochs:   9%|▉         | 22/250 [00:01<00:11, 19.74it/s, acc=50.5859375%]    Epochs:   9%|▉         | 22/250 [00:01<00:11, 19.74it/s, acc=50.5859375%]    Epochs:   9%|▉         | 22/250 [00:01<00:11, 19.74it/s, acc=50.5859375%]    Epochs:   9%|▉         | 22/250 [00:01<00:11, 19.74it/s, acc=50.5859375%]    Epochs:   9%|▉         | 22/250 [00:01<00:11, 19.74it/s, acc=50.5859375%]    Epochs:   9%|▉         | 22/250 [00:01<00:11, 19.74it/s, acc=50.5859375%]    Epochs:   9%|▉         | 22/250 [00:01<00:11, 19.74it/s, acc=50.5859375%]    Epochs:   9%|▉         | 22/250 [00:01<00:11, 19.74it/s, acc=50.5859375%]
                                                     Epochs:   9%|▉         | 22/250 [00:01<00:11, 19.74it/s, loss=0.671]         Epochs:  10%|▉         | 24/250 [00:01<00:11, 19.71it/s, loss=0.671]
    Sample:   0%|          | 0/8 [00:00<?, ?it/s]    Epochs:  10%|▉         | 24/250 [00:01<00:11, 19.71it/s, acc=50.5859375%]    Epochs:  10%|▉         | 24/250 [00:01<00:11, 19.71it/s, acc=50.5859375%]    Epochs:  10%|▉         | 24/250 [00:01<00:11, 19.71it/s, acc=50.5859375%]    Epochs:  10%|▉         | 24/250 [00:01<00:11, 19.71it/s, acc=50.5859375%]    Epochs:  10%|▉         | 24/250 [00:01<00:11, 19.71it/s, acc=50.5859375%]    Epochs:  10%|▉         | 24/250 [00:01<00:11, 19.71it/s, acc=50.5859375%]    Epochs:  10%|▉         | 24/250 [00:01<00:11, 19.71it/s, acc=50.5859375%]    Epochs:  10%|▉         | 24/250 [00:01<00:11, 19.71it/s, acc=50.5859375%]
                                                     Epochs:  10%|▉         | 24/250 [00:01<00:11, 19.71it/s, loss=0.669]     
    Sample:   0%|          | 0/8 [00:00<?, ?it/s]    Epochs:  10%|▉         | 24/250 [00:01<00:11, 19.71it/s, acc=50.5859375%]    Epochs:  10%|▉         | 24/250 [00:01<00:11, 19.71it/s, acc=50.5859375%]    Epochs:  10%|▉         | 24/250 [00:01<00:11, 19.71it/s, acc=50.5859375%]    Epochs:  10%|▉         | 24/250 [00:01<00:11, 19.71it/s, acc=50.5859375%]    Epochs:  10%|▉         | 24/250 [00:01<00:11, 19.71it/s, acc=50.5859375%]    Epochs:  10%|▉         | 24/250 [00:01<00:11, 19.71it/s, acc=50.5859375%]    Epochs:  10%|▉         | 24/250 [00:01<00:11, 19.71it/s, acc=50.5859375%]    Epochs:  10%|▉         | 24/250 [00:01<00:11, 19.71it/s, acc=50.5859375%]
                                                     Epochs:  10%|▉         | 24/250 [00:01<00:11, 19.71it/s, loss=0.667]         Epochs:  10%|█         | 26/250 [00:01<00:11, 19.73it/s, loss=0.667]
    Sample:   0%|          | 0/8 [00:00<?, ?it/s]    Epochs:  10%|█         | 26/250 [00:01<00:11, 19.73it/s, acc=50.5859375%]    Epochs:  10%|█         | 26/250 [00:01<00:11, 19.73it/s, acc=50.5859375%]    Epochs:  10%|█         | 26/250 [00:01<00:11, 19.73it/s, acc=50.5859375%]    Epochs:  10%|█         | 26/250 [00:01<00:11, 19.73it/s, acc=50.5859375%]    Epochs:  10%|█         | 26/250 [00:01<00:11, 19.73it/s, acc=50.5859375%]    Epochs:  10%|█         | 26/250 [00:01<00:11, 19.73it/s, acc=50.5859375%]    Epochs:  10%|█         | 26/250 [00:01<00:11, 19.73it/s, acc=50.5859375%]    Epochs:  10%|█         | 26/250 [00:01<00:11, 19.73it/s, acc=50.5859375%]
                                                     Epochs:  10%|█         | 26/250 [00:01<00:11, 19.73it/s, loss=0.664]     
    Sample:   0%|          | 0/8 [00:00<?, ?it/s]    Epochs:  10%|█         | 26/250 [00:01<00:11, 19.73it/s, acc=50.5859375%]    Epochs:  10%|█         | 26/250 [00:01<00:11, 19.73it/s, acc=50.5859375%]    Epochs:  10%|█         | 26/250 [00:01<00:11, 19.73it/s, acc=50.5859375%]    Epochs:  10%|█         | 26/250 [00:01<00:11, 19.73it/s, acc=50.5859375%]    Epochs:  10%|█         | 26/250 [00:01<00:11, 19.73it/s, acc=50.5859375%]    Epochs:  10%|█         | 26/250 [00:01<00:11, 19.73it/s, acc=50.5859375%]    Epochs:  10%|█         | 26/250 [00:01<00:11, 19.73it/s, acc=50.5859375%]    Epochs:  10%|█         | 26/250 [00:01<00:11, 19.73it/s, acc=50.5859375%]
                                                     Epochs:  10%|█         | 26/250 [00:01<00:11, 19.73it/s, loss=0.662]         Epochs:  11%|█         | 28/250 [00:01<00:11, 19.75it/s, loss=0.662]
    Sample:   0%|          | 0/8 [00:00<?, ?it/s]    Epochs:  11%|█         | 28/250 [00:01<00:11, 19.75it/s, acc=50.5859375%]    Epochs:  11%|█         | 28/250 [00:01<00:11, 19.75it/s, acc=50.5859375%]    Epochs:  11%|█         | 28/250 [00:01<00:11, 19.75it/s, acc=50.5859375%]    Epochs:  11%|█         | 28/250 [00:01<00:11, 19.75it/s, acc=50.5859375%]    Epochs:  11%|█         | 28/250 [00:01<00:11, 19.75it/s, acc=50.5859375%]    Epochs:  11%|█         | 28/250 [00:01<00:11, 19.75it/s, acc=50.5859375%]    Epochs:  11%|█         | 28/250 [00:01<00:11, 19.75it/s, acc=50.5859375%]    Epochs:  11%|█         | 28/250 [00:01<00:11, 19.75it/s, acc=50.5859375%]
                                                     Epochs:  11%|█         | 28/250 [00:01<00:11, 19.75it/s, loss=0.66]      
    Sample:   0%|          | 0/8 [00:00<?, ?it/s]    Epochs:  11%|█         | 28/250 [00:01<00:11, 19.75it/s, acc=50.5859375%]    Epochs:  11%|█         | 28/250 [00:01<00:11, 19.75it/s, acc=50.5859375%]    Epochs:  11%|█         | 28/250 [00:01<00:11, 19.75it/s, acc=50.5859375%]    Epochs:  11%|█         | 28/250 [00:01<00:11, 19.75it/s, acc=50.5859375%]    Epochs:  11%|█         | 28/250 [00:01<00:11, 19.75it/s, acc=50.5859375%]    Epochs:  11%|█         | 28/250 [00:01<00:11, 19.75it/s, acc=50.5859375%]    Epochs:  11%|█         | 28/250 [00:01<00:11, 19.75it/s, acc=50.5859375%]    Epochs:  11%|█         | 28/250 [00:01<00:11, 19.75it/s, acc=50.5859375%]
                                                     Epochs:  11%|█         | 28/250 [00:01<00:11, 19.75it/s, loss=0.658]         Epochs:  12%|█▏        | 30/250 [00:01<00:11, 19.58it/s, loss=0.658]
    Sample:   0%|          | 0/8 [00:00<?, ?it/s]    Epochs:  12%|█▏        | 30/250 [00:01<00:11, 19.58it/s, acc=50.5859375%]    Epochs:  12%|█▏        | 30/250 [00:01<00:11, 19.58it/s, acc=50.5859375%]    Epochs:  12%|█▏        | 30/250 [00:01<00:11, 19.58it/s, acc=50.5859375%]    Epochs:  12%|█▏        | 30/250 [00:01<00:11, 19.58it/s, acc=50.5859375%]    Epochs:  12%|█▏        | 30/250 [00:01<00:11, 19.58it/s, acc=50.5859375%]    Epochs:  12%|█▏        | 30/250 [00:01<00:11, 19.58it/s, acc=50.5859375%]    Epochs:  12%|█▏        | 30/250 [00:01<00:11, 19.58it/s, acc=50.5859375%]    Epochs:  12%|█▏        | 30/250 [00:01<00:11, 19.58it/s, acc=50.5859375%]
                                                     Epochs:  12%|█▏        | 30/250 [00:01<00:11, 19.58it/s, loss=0.656]     
    Sample:   0%|          | 0/8 [00:00<?, ?it/s]    Epochs:  12%|█▏        | 30/250 [00:01<00:11, 19.58it/s, acc=50.5859375%]    Epochs:  12%|█▏        | 30/250 [00:01<00:11, 19.58it/s, acc=50.5859375%]    Epochs:  12%|█▏        | 30/250 [00:01<00:11, 19.58it/s, acc=50.5859375%]    Epochs:  12%|█▏        | 30/250 [00:01<00:11, 19.58it/s, acc=50.5859375%]    Epochs:  12%|█▏        | 30/250 [00:01<00:11, 19.58it/s, acc=50.5859375%]    Epochs:  12%|█▏        | 30/250 [00:01<00:11, 19.58it/s, acc=50.5859375%]    Epochs:  12%|█▏        | 30/250 [00:01<00:11, 19.58it/s, acc=50.5859375%]    Epochs:  12%|█▏        | 30/250 [00:01<00:11, 19.58it/s, acc=50.5859375%]
                                                     Epochs:  12%|█▏        | 30/250 [00:01<00:11, 19.58it/s, loss=0.653]         Epochs:  13%|█▎        | 32/250 [00:01<00:11, 19.60it/s, loss=0.653]
    Sample:   0%|          | 0/8 [00:00<?, ?it/s]    Epochs:  13%|█▎        | 32/250 [00:01<00:11, 19.60it/s, acc=50.5859375%]    Epochs:  13%|█▎        | 32/250 [00:01<00:11, 19.60it/s, acc=50.5859375%]    Epochs:  13%|█▎        | 32/250 [00:01<00:11, 19.60it/s, acc=50.5859375%]    Epochs:  13%|█▎        | 32/250 [00:01<00:11, 19.60it/s, acc=50.5859375%]    Epochs:  13%|█▎        | 32/250 [00:01<00:11, 19.60it/s, acc=50.5859375%]    Epochs:  13%|█▎        | 32/250 [00:01<00:11, 19.60it/s, acc=50.5859375%]    Epochs:  13%|█▎        | 32/250 [00:01<00:11, 19.60it/s, acc=50.5859375%]    Epochs:  13%|█▎        | 32/250 [00:01<00:11, 19.60it/s, acc=50.5859375%]
                                                     Epochs:  13%|█▎        | 32/250 [00:01<00:11, 19.60it/s, loss=0.651]     
    Sample:   0%|          | 0/8 [00:00<?, ?it/s]    Epochs:  13%|█▎        | 32/250 [00:01<00:11, 19.60it/s, acc=50.5859375%]    Epochs:  13%|█▎        | 32/250 [00:01<00:11, 19.60it/s, acc=50.5859375%]    Epochs:  13%|█▎        | 32/250 [00:01<00:11, 19.60it/s, acc=50.5859375%]    Epochs:  13%|█▎        | 32/250 [00:01<00:11, 19.60it/s, acc=50.5859375%]    Epochs:  13%|█▎        | 32/250 [00:01<00:11, 19.60it/s, acc=50.5859375%]    Epochs:  13%|█▎        | 32/250 [00:01<00:11, 19.60it/s, acc=50.5859375%]    Epochs:  13%|█▎        | 32/250 [00:01<00:11, 19.60it/s, acc=50.5859375%]    Epochs:  13%|█▎        | 32/250 [00:01<00:11, 19.60it/s, acc=50.5859375%]
                                                     Epochs:  13%|█▎        | 32/250 [00:01<00:11, 19.60it/s, loss=0.648]         Epochs:  14%|█▎        | 34/250 [00:01<00:11, 19.53it/s, loss=0.648]
    Sample:   0%|          | 0/8 [00:00<?, ?it/s]    Epochs:  14%|█▎        | 34/250 [00:01<00:11, 19.53it/s, acc=50.5859375%]    Epochs:  14%|█▎        | 34/250 [00:01<00:11, 19.53it/s, acc=50.5859375%]    Epochs:  14%|█▎        | 34/250 [00:01<00:11, 19.53it/s, acc=50.5859375%]    Epochs:  14%|█▎        | 34/250 [00:01<00:11, 19.53it/s, acc=50.5859375%]    Epochs:  14%|█▎        | 34/250 [00:01<00:11, 19.53it/s, acc=50.5859375%]    Epochs:  14%|█▎        | 34/250 [00:01<00:11, 19.53it/s, acc=50.5859375%]    Epochs:  14%|█▎        | 34/250 [00:01<00:11, 19.53it/s, acc=50.5859375%]    Epochs:  14%|█▎        | 34/250 [00:01<00:11, 19.53it/s, acc=50.5859375%]
                                                     Epochs:  14%|█▎        | 34/250 [00:01<00:11, 19.53it/s, loss=0.646]     
    Sample:   0%|          | 0/8 [00:00<?, ?it/s]    Epochs:  14%|█▎        | 34/250 [00:01<00:11, 19.53it/s, acc=50.5859375%]    Epochs:  14%|█▎        | 34/250 [00:01<00:11, 19.53it/s, acc=50.5859375%]    Epochs:  14%|█▎        | 34/250 [00:01<00:11, 19.53it/s, acc=50.5859375%]    Epochs:  14%|█▎        | 34/250 [00:01<00:11, 19.53it/s, acc=50.5859375%]    Epochs:  14%|█▎        | 34/250 [00:01<00:11, 19.53it/s, acc=50.5859375%]    Epochs:  14%|█▎        | 34/250 [00:01<00:11, 19.53it/s, acc=50.5859375%]    Epochs:  14%|█▎        | 34/250 [00:01<00:11, 19.53it/s, acc=50.5859375%]    Epochs:  14%|█▎        | 34/250 [00:01<00:11, 19.53it/s, acc=50.5859375%]
                                                     Epochs:  14%|█▎        | 34/250 [00:01<00:11, 19.53it/s, loss=0.643]         Epochs:  14%|█▍        | 36/250 [00:01<00:10, 19.61it/s, loss=0.643]
    Sample:   0%|          | 0/8 [00:00<?, ?it/s]    Epochs:  14%|█▍        | 36/250 [00:01<00:10, 19.61it/s, acc=50.5859375%]    Epochs:  14%|█▍        | 36/250 [00:01<00:10, 19.61it/s, acc=50.5859375%]    Epochs:  14%|█▍        | 36/250 [00:01<00:10, 19.61it/s, acc=50.5859375%]    Epochs:  14%|█▍        | 36/250 [00:01<00:10, 19.61it/s, acc=50.5859375%]    Epochs:  14%|█▍        | 36/250 [00:01<00:10, 19.61it/s, acc=50.5859375%]    Epochs:  14%|█▍        | 36/250 [00:01<00:10, 19.61it/s, acc=50.5859375%]    Epochs:  14%|█▍        | 36/250 [00:01<00:10, 19.61it/s, acc=50.5859375%]    Epochs:  14%|█▍        | 36/250 [00:01<00:10, 19.61it/s, acc=50.5859375%]
                                                     Epochs:  14%|█▍        | 36/250 [00:01<00:10, 19.61it/s, loss=0.641]     
    Sample:   0%|          | 0/8 [00:00<?, ?it/s]    Epochs:  14%|█▍        | 36/250 [00:01<00:10, 19.61it/s, acc=50.5859375%]    Epochs:  14%|█▍        | 36/250 [00:01<00:10, 19.61it/s, acc=50.5859375%]    Epochs:  14%|█▍        | 36/250 [00:01<00:10, 19.61it/s, acc=50.5859375%]    Epochs:  14%|█▍        | 36/250 [00:01<00:10, 19.61it/s, acc=50.5859375%]    Epochs:  14%|█▍        | 36/250 [00:01<00:10, 19.61it/s, acc=50.5859375%]    Epochs:  14%|█▍        | 36/250 [00:01<00:10, 19.61it/s, acc=50.5859375%]    Epochs:  14%|█▍        | 36/250 [00:01<00:10, 19.61it/s, acc=50.5859375%]    Epochs:  14%|█▍        | 36/250 [00:01<00:10, 19.61it/s, acc=50.5859375%]
                                                     Epochs:  14%|█▍        | 36/250 [00:01<00:10, 19.61it/s, loss=0.638]         Epochs:  15%|█▌        | 38/250 [00:01<00:10, 19.65it/s, loss=0.638]
    Sample:   0%|          | 0/8 [00:00<?, ?it/s]    Epochs:  15%|█▌        | 38/250 [00:01<00:10, 19.65it/s, acc=50.5859375%]    Epochs:  15%|█▌        | 38/250 [00:01<00:10, 19.65it/s, acc=50.5859375%]    Epochs:  15%|█▌        | 38/250 [00:01<00:10, 19.65it/s, acc=50.5859375%]    Epochs:  15%|█▌        | 38/250 [00:01<00:10, 19.65it/s, acc=50.5859375%]    Epochs:  15%|█▌        | 38/250 [00:01<00:10, 19.65it/s, acc=50.5859375%]    Epochs:  15%|█▌        | 38/250 [00:01<00:10, 19.65it/s, acc=50.5859375%]    Epochs:  15%|█▌        | 38/250 [00:01<00:10, 19.65it/s, acc=50.5859375%]    Epochs:  15%|█▌        | 38/250 [00:01<00:10, 19.65it/s, acc=50.5859375%]
                                                     Epochs:  15%|█▌        | 38/250 [00:01<00:10, 19.65it/s, loss=0.636]     
    Sample:   0%|          | 0/8 [00:00<?, ?it/s]    Epochs:  15%|█▌        | 38/250 [00:01<00:10, 19.65it/s, acc=50.5859375%]    Epochs:  15%|█▌        | 38/250 [00:02<00:10, 19.65it/s, acc=50.5859375%]    Epochs:  15%|█▌        | 38/250 [00:02<00:10, 19.65it/s, acc=50.5859375%]    Epochs:  15%|█▌        | 38/250 [00:02<00:10, 19.65it/s, acc=50.5859375%]    Epochs:  15%|█▌        | 38/250 [00:02<00:10, 19.65it/s, acc=50.5859375%]    Epochs:  15%|█▌        | 38/250 [00:02<00:10, 19.65it/s, acc=50.5859375%]    Epochs:  15%|█▌        | 38/250 [00:02<00:10, 19.65it/s, acc=50.5859375%]    Epochs:  15%|█▌        | 38/250 [00:02<00:10, 19.65it/s, acc=50.5859375%]
                                                     Epochs:  15%|█▌        | 38/250 [00:02<00:10, 19.65it/s, loss=0.633]         Epochs:  16%|█▌        | 40/250 [00:02<00:10, 19.59it/s, loss=0.633]
    Sample:   0%|          | 0/8 [00:00<?, ?it/s]    Epochs:  16%|█▌        | 40/250 [00:02<00:10, 19.59it/s, acc=50.5859375%]    Epochs:  16%|█▌        | 40/250 [00:02<00:10, 19.59it/s, acc=50.5859375%]    Epochs:  16%|█▌        | 40/250 [00:02<00:10, 19.59it/s, acc=50.5859375%]    Epochs:  16%|█▌        | 40/250 [00:02<00:10, 19.59it/s, acc=50.5859375%]    Epochs:  16%|█▌        | 40/250 [00:02<00:10, 19.59it/s, acc=50.5859375%]    Epochs:  16%|█▌        | 40/250 [00:02<00:10, 19.59it/s, acc=50.5859375%]    Epochs:  16%|█▌        | 40/250 [00:02<00:10, 19.59it/s, acc=50.5859375%]    Epochs:  16%|█▌        | 40/250 [00:02<00:10, 19.59it/s, acc=50.5859375%]
                                                     Epochs:  16%|█▌        | 40/250 [00:02<00:10, 19.59it/s, loss=0.631]     
    Sample:   0%|          | 0/8 [00:00<?, ?it/s]    Epochs:  16%|█▌        | 40/250 [00:02<00:10, 19.59it/s, acc=50.5859375%]    Epochs:  16%|█▌        | 40/250 [00:02<00:10, 19.59it/s, acc=50.5859375%]    Epochs:  16%|█▌        | 40/250 [00:02<00:10, 19.59it/s, acc=50.5859375%]    Epochs:  16%|█▌        | 40/250 [00:02<00:10, 19.59it/s, acc=50.5859375%]    Epochs:  16%|█▌        | 40/250 [00:02<00:10, 19.59it/s, acc=50.5859375%]    Epochs:  16%|█▌        | 40/250 [00:02<00:10, 19.59it/s, acc=50.5859375%]    Epochs:  16%|█▌        | 40/250 [00:02<00:10, 19.59it/s, acc=50.5859375%]    Epochs:  16%|█▌        | 40/250 [00:02<00:10, 19.59it/s, acc=50.5859375%]
                                                     Epochs:  16%|█▌        | 40/250 [00:02<00:10, 19.59it/s, loss=0.628]         Epochs:  17%|█▋        | 42/250 [00:02<00:10, 19.60it/s, loss=0.628]
    Sample:   0%|          | 0/8 [00:00<?, ?it/s]    Epochs:  17%|█▋        | 42/250 [00:02<00:10, 19.60it/s, acc=50.5859375%]    Epochs:  17%|█▋        | 42/250 [00:02<00:10, 19.60it/s, acc=50.5859375%]    Epochs:  17%|█▋        | 42/250 [00:02<00:10, 19.60it/s, acc=50.5859375%]    Epochs:  17%|█▋        | 42/250 [00:02<00:10, 19.60it/s, acc=50.5859375%]    Epochs:  17%|█▋        | 42/250 [00:02<00:10, 19.60it/s, acc=50.5859375%]    Epochs:  17%|█▋        | 42/250 [00:02<00:10, 19.60it/s, acc=50.5859375%]    Epochs:  17%|█▋        | 42/250 [00:02<00:10, 19.60it/s, acc=50.5859375%]    Epochs:  17%|█▋        | 42/250 [00:02<00:10, 19.60it/s, acc=50.5859375%]
                                                     Epochs:  17%|█▋        | 42/250 [00:02<00:10, 19.60it/s, loss=0.626]     
    Sample:   0%|          | 0/8 [00:00<?, ?it/s]    Epochs:  17%|█▋        | 42/250 [00:02<00:10, 19.60it/s, acc=50.5859375%]    Epochs:  17%|█▋        | 42/250 [00:02<00:10, 19.60it/s, acc=50.5859375%]    Epochs:  17%|█▋        | 42/250 [00:02<00:10, 19.60it/s, acc=50.5859375%]    Epochs:  17%|█▋        | 42/250 [00:02<00:10, 19.60it/s, acc=50.5859375%]    Epochs:  17%|█▋        | 42/250 [00:02<00:10, 19.60it/s, acc=50.5859375%]    Epochs:  17%|█▋        | 42/250 [00:02<00:10, 19.60it/s, acc=50.5859375%]    Epochs:  17%|█▋        | 42/250 [00:02<00:10, 19.60it/s, acc=50.5859375%]    Epochs:  17%|█▋        | 42/250 [00:02<00:10, 19.60it/s, acc=50.5859375%]
                                                     Epochs:  17%|█▋        | 42/250 [00:02<00:10, 19.60it/s, loss=0.623]         Epochs:  18%|█▊        | 44/250 [00:02<00:10, 19.65it/s, loss=0.623]
    Sample:   0%|          | 0/8 [00:00<?, ?it/s]    Epochs:  18%|█▊        | 44/250 [00:02<00:10, 19.65it/s, acc=50.5859375%]    Epochs:  18%|█▊        | 44/250 [00:02<00:10, 19.65it/s, acc=50.5859375%]    Epochs:  18%|█▊        | 44/250 [00:02<00:10, 19.65it/s, acc=50.5859375%]    Epochs:  18%|█▊        | 44/250 [00:02<00:10, 19.65it/s, acc=50.5859375%]    Epochs:  18%|█▊        | 44/250 [00:02<00:10, 19.65it/s, acc=50.5859375%]    Epochs:  18%|█▊        | 44/250 [00:02<00:10, 19.65it/s, acc=50.5859375%]    Epochs:  18%|█▊        | 44/250 [00:02<00:10, 19.65it/s, acc=50.5859375%]    Epochs:  18%|█▊        | 44/250 [00:02<00:10, 19.65it/s, acc=50.5859375%]
                                                     Epochs:  18%|█▊        | 44/250 [00:02<00:10, 19.65it/s, loss=0.62]      
    Sample:   0%|          | 0/8 [00:00<?, ?it/s]    Epochs:  18%|█▊        | 44/250 [00:02<00:10, 19.65it/s, acc=50.5859375%]    Epochs:  18%|█▊        | 44/250 [00:02<00:10, 19.65it/s, acc=50.5859375%]    Epochs:  18%|█▊        | 44/250 [00:02<00:10, 19.65it/s, acc=50.5859375%]    Epochs:  18%|█▊        | 44/250 [00:02<00:10, 19.65it/s, acc=50.5859375%]    Epochs:  18%|█▊        | 44/250 [00:02<00:10, 19.65it/s, acc=50.5859375%]    Epochs:  18%|█▊        | 44/250 [00:02<00:10, 19.65it/s, acc=50.5859375%]    Epochs:  18%|█▊        | 44/250 [00:02<00:10, 19.65it/s, acc=50.5859375%]    Epochs:  18%|█▊        | 44/250 [00:02<00:10, 19.65it/s, acc=50.5859375%]
                                                     Epochs:  18%|█▊        | 44/250 [00:02<00:10, 19.65it/s, loss=0.618]         Epochs:  18%|█▊        | 46/250 [00:02<00:10, 19.62it/s, loss=0.618]
    Sample:   0%|          | 0/8 [00:00<?, ?it/s]    Epochs:  18%|█▊        | 46/250 [00:02<00:10, 19.62it/s, acc=50.5859375%]    Epochs:  18%|█▊        | 46/250 [00:02<00:10, 19.62it/s, acc=50.5859375%]    Epochs:  18%|█▊        | 46/250 [00:02<00:10, 19.62it/s, acc=50.5859375%]    Epochs:  18%|█▊        | 46/250 [00:02<00:10, 19.62it/s, acc=50.5859375%]    Epochs:  18%|█▊        | 46/250 [00:02<00:10, 19.62it/s, acc=50.5859375%]    Epochs:  18%|█▊        | 46/250 [00:02<00:10, 19.62it/s, acc=50.5859375%]    Epochs:  18%|█▊        | 46/250 [00:02<00:10, 19.62it/s, acc=50.5859375%]    Epochs:  18%|█▊        | 46/250 [00:02<00:10, 19.62it/s, acc=50.5859375%]
                                                     Epochs:  18%|█▊        | 46/250 [00:02<00:10, 19.62it/s, loss=0.615]     
    Sample:   0%|          | 0/8 [00:00<?, ?it/s]    Epochs:  18%|█▊        | 46/250 [00:02<00:10, 19.62it/s, acc=50.5859375%]    Epochs:  18%|█▊        | 46/250 [00:02<00:10, 19.62it/s, acc=50.5859375%]    Epochs:  18%|█▊        | 46/250 [00:02<00:10, 19.62it/s, acc=50.5859375%]    Epochs:  18%|█▊        | 46/250 [00:02<00:10, 19.62it/s, acc=50.5859375%]    Epochs:  18%|█▊        | 46/250 [00:02<00:10, 19.62it/s, acc=50.5859375%]    Epochs:  18%|█▊        | 46/250 [00:02<00:10, 19.62it/s, acc=50.5859375%]    Epochs:  18%|█▊        | 46/250 [00:02<00:10, 19.62it/s, acc=50.5859375%]    Epochs:  18%|█▊        | 46/250 [00:02<00:10, 19.62it/s, acc=50.5859375%]
                                                     Epochs:  18%|█▊        | 46/250 [00:02<00:10, 19.62it/s, loss=0.613]         Epochs:  19%|█▉        | 48/250 [00:02<00:10, 19.51it/s, loss=0.613]
    Sample:   0%|          | 0/8 [00:00<?, ?it/s]    Epochs:  19%|█▉        | 48/250 [00:02<00:10, 19.51it/s, acc=50.5859375%]    Epochs:  19%|█▉        | 48/250 [00:02<00:10, 19.51it/s, acc=50.5859375%]    Epochs:  19%|█▉        | 48/250 [00:02<00:10, 19.51it/s, acc=50.5859375%]    Epochs:  19%|█▉        | 48/250 [00:02<00:10, 19.51it/s, acc=50.5859375%]    Epochs:  19%|█▉        | 48/250 [00:02<00:10, 19.51it/s, acc=50.5859375%]    Epochs:  19%|█▉        | 48/250 [00:02<00:10, 19.51it/s, acc=50.5859375%]    Epochs:  19%|█▉        | 48/250 [00:02<00:10, 19.51it/s, acc=50.5859375%]    Epochs:  19%|█▉        | 48/250 [00:02<00:10, 19.51it/s, acc=50.5859375%]
                                                     Epochs:  19%|█▉        | 48/250 [00:02<00:10, 19.51it/s, loss=0.61]      
    Sample:   0%|          | 0/8 [00:00<?, ?it/s]    Epochs:  19%|█▉        | 48/250 [00:02<00:10, 19.51it/s, acc=50.5859375%]    Epochs:  19%|█▉        | 48/250 [00:02<00:10, 19.51it/s, acc=50.5859375%]    Epochs:  19%|█▉        | 48/250 [00:02<00:10, 19.51it/s, acc=50.5859375%]    Epochs:  19%|█▉        | 48/250 [00:02<00:10, 19.51it/s, acc=50.5859375%]    Epochs:  19%|█▉        | 48/250 [00:02<00:10, 19.51it/s, acc=50.5859375%]    Epochs:  19%|█▉        | 48/250 [00:02<00:10, 19.51it/s, acc=50.5859375%]    Epochs:  19%|█▉        | 48/250 [00:02<00:10, 19.51it/s, acc=50.5859375%]    Epochs:  19%|█▉        | 48/250 [00:02<00:10, 19.51it/s, acc=50.5859375%]
                                                     Epochs:  19%|█▉        | 48/250 [00:02<00:10, 19.51it/s, loss=0.607]         Epochs:  20%|██        | 50/250 [00:02<00:10, 19.59it/s, loss=0.607]
    Sample:   0%|          | 0/8 [00:00<?, ?it/s]    Epochs:  20%|██        | 50/250 [00:02<00:10, 19.59it/s, acc=50.5859375%]    Epochs:  20%|██        | 50/250 [00:02<00:10, 19.59it/s, acc=50.5859375%]    Epochs:  20%|██        | 50/250 [00:02<00:10, 19.59it/s, acc=50.5859375%]    Epochs:  20%|██        | 50/250 [00:02<00:10, 19.59it/s, acc=50.5859375%]    Epochs:  20%|██        | 50/250 [00:02<00:10, 19.59it/s, acc=50.5859375%]    Epochs:  20%|██        | 50/250 [00:02<00:10, 19.59it/s, acc=50.5859375%]    Epochs:  20%|██        | 50/250 [00:02<00:10, 19.59it/s, acc=50.5859375%]    Epochs:  20%|██        | 50/250 [00:02<00:10, 19.59it/s, acc=50.5859375%]
                                                     Epochs:  20%|██        | 50/250 [00:02<00:10, 19.59it/s, loss=0.605]     
    Sample:   0%|          | 0/8 [00:00<?, ?it/s]    Epochs:  20%|██        | 50/250 [00:02<00:10, 19.59it/s, acc=50.5859375%]    Epochs:  20%|██        | 50/250 [00:02<00:10, 19.59it/s, acc=50.5859375%]    Epochs:  20%|██        | 50/250 [00:02<00:10, 19.59it/s, acc=50.5859375%]    Epochs:  20%|██        | 50/250 [00:02<00:10, 19.59it/s, acc=50.5859375%]    Epochs:  20%|██        | 50/250 [00:02<00:10, 19.59it/s, acc=50.5859375%]    Epochs:  20%|██        | 50/250 [00:02<00:10, 19.59it/s, acc=50.5859375%]    Epochs:  20%|██        | 50/250 [00:02<00:10, 19.59it/s, acc=50.5859375%]    Epochs:  20%|██        | 50/250 [00:02<00:10, 19.59it/s, acc=50.5859375%]
                                                     Epochs:  20%|██        | 50/250 [00:02<00:10, 19.59it/s, loss=0.602]         Epochs:  21%|██        | 52/250 [00:02<00:10, 19.64it/s, loss=0.602]
    Sample:   0%|          | 0/8 [00:00<?, ?it/s]    Epochs:  21%|██        | 52/250 [00:02<00:10, 19.64it/s, acc=50.5859375%]    Epochs:  21%|██        | 52/250 [00:02<00:10, 19.64it/s, acc=50.5859375%]    Epochs:  21%|██        | 52/250 [00:02<00:10, 19.64it/s, acc=50.5859375%]    Epochs:  21%|██        | 52/250 [00:02<00:10, 19.64it/s, acc=50.5859375%]    Epochs:  21%|██        | 52/250 [00:02<00:10, 19.64it/s, acc=50.5859375%]    Epochs:  21%|██        | 52/250 [00:02<00:10, 19.64it/s, acc=50.5859375%]    Epochs:  21%|██        | 52/250 [00:02<00:10, 19.64it/s, acc=50.5859375%]    Epochs:  21%|██        | 52/250 [00:02<00:10, 19.64it/s, acc=50.5859375%]
                                                     Epochs:  21%|██        | 52/250 [00:02<00:10, 19.64it/s, loss=0.599]     
    Sample:   0%|          | 0/8 [00:00<?, ?it/s]    Epochs:  21%|██        | 52/250 [00:02<00:10, 19.64it/s, acc=50.5859375%]    Epochs:  21%|██        | 52/250 [00:02<00:10, 19.64it/s, acc=50.5859375%]    Epochs:  21%|██        | 52/250 [00:02<00:10, 19.64it/s, acc=50.5859375%]    Epochs:  21%|██        | 52/250 [00:02<00:10, 19.64it/s, acc=50.5859375%]    Epochs:  21%|██        | 52/250 [00:02<00:10, 19.64it/s, acc=50.5859375%]    Epochs:  21%|██        | 52/250 [00:02<00:10, 19.64it/s, acc=50.5859375%]    Epochs:  21%|██        | 52/250 [00:02<00:10, 19.64it/s, acc=50.5859375%]    Epochs:  21%|██        | 52/250 [00:02<00:10, 19.64it/s, acc=50.5859375%]
                                                     Epochs:  21%|██        | 52/250 [00:02<00:10, 19.64it/s, loss=0.597]         Epochs:  22%|██▏       | 54/250 [00:02<00:09, 19.68it/s, loss=0.597]
    Sample:   0%|          | 0/8 [00:00<?, ?it/s]    Epochs:  22%|██▏       | 54/250 [00:02<00:09, 19.68it/s, acc=50.5859375%]    Epochs:  22%|██▏       | 54/250 [00:02<00:09, 19.68it/s, acc=50.5859375%]    Epochs:  22%|██▏       | 54/250 [00:02<00:09, 19.68it/s, acc=50.5859375%]    Epochs:  22%|██▏       | 54/250 [00:02<00:09, 19.68it/s, acc=50.5859375%]    Epochs:  22%|██▏       | 54/250 [00:02<00:09, 19.68it/s, acc=50.5859375%]    Epochs:  22%|██▏       | 54/250 [00:02<00:09, 19.68it/s, acc=84.765625%]     Epochs:  22%|██▏       | 54/250 [00:02<00:09, 19.68it/s, acc=84.5703125%]    Epochs:  22%|██▏       | 54/250 [00:02<00:09, 19.68it/s, acc=84.5703125%]
                                                     Epochs:  22%|██▏       | 54/250 [00:02<00:09, 19.68it/s, loss=0.594]     
    Sample:   0%|          | 0/8 [00:00<?, ?it/s]    Epochs:  22%|██▏       | 54/250 [00:02<00:09, 19.68it/s, acc=84.5703125%]    Epochs:  22%|██▏       | 54/250 [00:02<00:09, 19.68it/s, acc=84.5703125%]    Epochs:  22%|██▏       | 54/250 [00:02<00:09, 19.68it/s, acc=84.765625%]     Epochs:  22%|██▏       | 54/250 [00:02<00:09, 19.68it/s, acc=84.9609375%]    Epochs:  22%|██▏       | 54/250 [00:02<00:09, 19.68it/s, acc=85.3515625%]    Epochs:  22%|██▏       | 54/250 [00:02<00:09, 19.68it/s, acc=85.3515625%]    Epochs:  22%|██▏       | 54/250 [00:02<00:09, 19.68it/s, acc=85.7421875%]    Epochs:  22%|██▏       | 54/250 [00:02<00:09, 19.68it/s, acc=85.7421875%]
                                                     Epochs:  22%|██▏       | 54/250 [00:02<00:09, 19.68it/s, loss=0.591]         Epochs:  22%|██▏       | 56/250 [00:02<00:09, 19.66it/s, loss=0.591]
    Sample:   0%|          | 0/8 [00:00<?, ?it/s]    Epochs:  22%|██▏       | 56/250 [00:02<00:09, 19.66it/s, acc=85.9375%]    Epochs:  22%|██▏       | 56/250 [00:02<00:09, 19.66it/s, acc=85.9375%]    Epochs:  22%|██▏       | 56/250 [00:02<00:09, 19.66it/s, acc=85.9375%]    Epochs:  22%|██▏       | 56/250 [00:02<00:09, 19.66it/s, acc=85.9375%]    Epochs:  22%|██▏       | 56/250 [00:02<00:09, 19.66it/s, acc=85.9375%]    Epochs:  22%|██▏       | 56/250 [00:02<00:09, 19.66it/s, acc=85.9375%]    Epochs:  22%|██▏       | 56/250 [00:02<00:09, 19.66it/s, acc=86.1328125%]    Epochs:  22%|██▏       | 56/250 [00:02<00:09, 19.66it/s, acc=86.1328125%]
                                                     Epochs:  22%|██▏       | 56/250 [00:02<00:09, 19.66it/s, loss=0.589]     
    Sample:   0%|          | 0/8 [00:00<?, ?it/s]    Epochs:  22%|██▏       | 56/250 [00:02<00:09, 19.66it/s, acc=86.1328125%]    Epochs:  22%|██▏       | 56/250 [00:02<00:09, 19.66it/s, acc=86.1328125%]    Epochs:  22%|██▏       | 56/250 [00:02<00:09, 19.66it/s, acc=86.1328125%]    Epochs:  22%|██▏       | 56/250 [00:02<00:09, 19.66it/s, acc=86.1328125%]    Epochs:  22%|██▏       | 56/250 [00:02<00:09, 19.66it/s, acc=86.1328125%]    Epochs:  22%|██▏       | 56/250 [00:02<00:09, 19.66it/s, acc=86.1328125%]    Epochs:  22%|██▏       | 56/250 [00:02<00:09, 19.66it/s, acc=86.1328125%]    Epochs:  22%|██▏       | 56/250 [00:02<00:09, 19.66it/s, acc=85.9375%]   
                                                     Epochs:  22%|██▏       | 56/250 [00:02<00:09, 19.66it/s, loss=0.586]      Epochs:  23%|██▎       | 58/250 [00:02<00:09, 19.67it/s, loss=0.586]
    Sample:   0%|          | 0/8 [00:00<?, ?it/s]    Epochs:  23%|██▎       | 58/250 [00:02<00:09, 19.67it/s, acc=85.9375%]    Epochs:  23%|██▎       | 58/250 [00:02<00:09, 19.67it/s, acc=85.9375%]    Epochs:  23%|██▎       | 58/250 [00:02<00:09, 19.67it/s, acc=85.9375%]    Epochs:  23%|██▎       | 58/250 [00:02<00:09, 19.67it/s, acc=85.9375%]    Epochs:  23%|██▎       | 58/250 [00:02<00:09, 19.67it/s, acc=85.9375%]    Epochs:  23%|██▎       | 58/250 [00:02<00:09, 19.67it/s, acc=85.9375%]    Epochs:  23%|██▎       | 58/250 [00:02<00:09, 19.67it/s, acc=85.9375%]    Epochs:  23%|██▎       | 58/250 [00:03<00:09, 19.67it/s, acc=85.9375%]
                                                     Epochs:  23%|██▎       | 58/250 [00:03<00:09, 19.67it/s, loss=0.583]  
    Sample:   0%|          | 0/8 [00:00<?, ?it/s]    Epochs:  23%|██▎       | 58/250 [00:03<00:09, 19.67it/s, acc=86.1328125%]    Epochs:  23%|██▎       | 58/250 [00:03<00:09, 19.67it/s, acc=86.1328125%]    Epochs:  23%|██▎       | 58/250 [00:03<00:09, 19.67it/s, acc=86.1328125%]    Epochs:  23%|██▎       | 58/250 [00:03<00:09, 19.67it/s, acc=86.1328125%]    Epochs:  23%|██▎       | 58/250 [00:03<00:09, 19.67it/s, acc=86.1328125%]    Epochs:  23%|██▎       | 58/250 [00:03<00:09, 19.67it/s, acc=86.1328125%]    Epochs:  23%|██▎       | 58/250 [00:03<00:09, 19.67it/s, acc=86.1328125%]    Epochs:  23%|██▎       | 58/250 [00:03<00:09, 19.67it/s, acc=86.1328125%]
                                                     Epochs:  23%|██▎       | 58/250 [00:03<00:09, 19.67it/s, loss=0.58]          Epochs:  24%|██▍       | 60/250 [00:03<00:09, 19.70it/s, loss=0.58]
    Sample:   0%|          | 0/8 [00:00<?, ?it/s]    Epochs:  24%|██▍       | 60/250 [00:03<00:09, 19.70it/s, acc=85.9375%]    Epochs:  24%|██▍       | 60/250 [00:03<00:09, 19.70it/s, acc=85.9375%]    Epochs:  24%|██▍       | 60/250 [00:03<00:09, 19.70it/s, acc=85.9375%]    Epochs:  24%|██▍       | 60/250 [00:03<00:09, 19.70it/s, acc=85.9375%]    Epochs:  24%|██▍       | 60/250 [00:03<00:09, 19.70it/s, acc=85.9375%]    Epochs:  24%|██▍       | 60/250 [00:03<00:09, 19.70it/s, acc=85.9375%]    Epochs:  24%|██▍       | 60/250 [00:03<00:09, 19.70it/s, acc=85.9375%]    Epochs:  24%|██▍       | 60/250 [00:03<00:09, 19.70it/s, acc=85.9375%]
                                                     Epochs:  24%|██▍       | 60/250 [00:03<00:09, 19.70it/s, loss=0.578]  
    Sample:   0%|          | 0/8 [00:00<?, ?it/s]    Epochs:  24%|██▍       | 60/250 [00:03<00:09, 19.70it/s, acc=85.9375%]    Epochs:  24%|██▍       | 60/250 [00:03<00:09, 19.70it/s, acc=86.1328125%]    Epochs:  24%|██▍       | 60/250 [00:03<00:09, 19.70it/s, acc=86.1328125%]    Epochs:  24%|██▍       | 60/250 [00:03<00:09, 19.70it/s, acc=86.1328125%]    Epochs:  24%|██▍       | 60/250 [00:03<00:09, 19.70it/s, acc=86.1328125%]    Epochs:  24%|██▍       | 60/250 [00:03<00:09, 19.70it/s, acc=85.9375%]       Epochs:  24%|██▍       | 60/250 [00:03<00:09, 19.70it/s, acc=85.9375%]    Epochs:  24%|██▍       | 60/250 [00:03<00:09, 19.70it/s, acc=85.7421875%]
                                                     Epochs:  24%|██▍       | 60/250 [00:03<00:09, 19.70it/s, loss=0.575]         Epochs:  25%|██▍       | 62/250 [00:03<00:09, 19.69it/s, loss=0.575]
    Sample:   0%|          | 0/8 [00:00<?, ?it/s]    Epochs:  25%|██▍       | 62/250 [00:03<00:09, 19.69it/s, acc=85.7421875%]    Epochs:  25%|██▍       | 62/250 [00:03<00:09, 19.69it/s, acc=85.546875%]     Epochs:  25%|██▍       | 62/250 [00:03<00:09, 19.69it/s, acc=85.546875%]    Epochs:  25%|██▍       | 62/250 [00:03<00:09, 19.69it/s, acc=85.546875%]    Epochs:  25%|██▍       | 62/250 [00:03<00:09, 19.69it/s, acc=85.546875%]    Epochs:  25%|██▍       | 62/250 [00:03<00:09, 19.69it/s, acc=85.546875%]    Epochs:  25%|██▍       | 62/250 [00:03<00:09, 19.69it/s, acc=85.3515625%]    Epochs:  25%|██▍       | 62/250 [00:03<00:09, 19.69it/s, acc=85.3515625%]
                                                     Epochs:  25%|██▍       | 62/250 [00:03<00:09, 19.69it/s, loss=0.572]     
    Sample:   0%|          | 0/8 [00:00<?, ?it/s]    Epochs:  25%|██▍       | 62/250 [00:03<00:09, 19.69it/s, acc=85.3515625%]    Epochs:  25%|██▍       | 62/250 [00:03<00:09, 19.69it/s, acc=85.3515625%]    Epochs:  25%|██▍       | 62/250 [00:03<00:09, 19.69it/s, acc=85.546875%]     Epochs:  25%|██▍       | 62/250 [00:03<00:09, 19.69it/s, acc=85.546875%]    Epochs:  25%|██▍       | 62/250 [00:03<00:09, 19.69it/s, acc=85.7421875%]    Epochs:  25%|██▍       | 62/250 [00:03<00:09, 19.69it/s, acc=85.9375%]       Epochs:  25%|██▍       | 62/250 [00:03<00:09, 19.69it/s, acc=85.9375%]    Epochs:  25%|██▍       | 62/250 [00:03<00:09, 19.69it/s, acc=86.1328125%]
                                                     Epochs:  25%|██▍       | 62/250 [00:03<00:09, 19.69it/s, loss=0.57]          Epochs:  26%|██▌       | 64/250 [00:03<00:09, 19.72it/s, loss=0.57]
    Sample:   0%|          | 0/8 [00:00<?, ?it/s]    Epochs:  26%|██▌       | 64/250 [00:03<00:09, 19.72it/s, acc=86.1328125%]    Epochs:  26%|██▌       | 64/250 [00:03<00:09, 19.72it/s, acc=86.1328125%]    Epochs:  26%|██▌       | 64/250 [00:03<00:09, 19.72it/s, acc=86.1328125%]    Epochs:  26%|██▌       | 64/250 [00:03<00:09, 19.72it/s, acc=86.1328125%]    Epochs:  26%|██▌       | 64/250 [00:03<00:09, 19.72it/s, acc=86.1328125%]    Epochs:  26%|██▌       | 64/250 [00:03<00:09, 19.72it/s, acc=86.5234375%]    Epochs:  26%|██▌       | 64/250 [00:03<00:09, 19.72it/s, acc=86.5234375%]    Epochs:  26%|██▌       | 64/250 [00:03<00:09, 19.72it/s, acc=86.5234375%]
                                                     Epochs:  26%|██▌       | 64/250 [00:03<00:09, 19.72it/s, loss=0.567]     
    Sample:   0%|          | 0/8 [00:00<?, ?it/s]    Epochs:  26%|██▌       | 64/250 [00:03<00:09, 19.72it/s, acc=86.71875%]    Epochs:  26%|██▌       | 64/250 [00:03<00:09, 19.72it/s, acc=86.71875%]    Epochs:  26%|██▌       | 64/250 [00:03<00:09, 19.72it/s, acc=86.71875%]    Epochs:  26%|██▌       | 64/250 [00:03<00:09, 19.72it/s, acc=86.71875%]    Epochs:  26%|██▌       | 64/250 [00:03<00:09, 19.72it/s, acc=86.71875%]    Epochs:  26%|██▌       | 64/250 [00:03<00:09, 19.72it/s, acc=86.71875%]    Epochs:  26%|██▌       | 64/250 [00:03<00:09, 19.72it/s, acc=86.71875%]    Epochs:  26%|██▌       | 64/250 [00:03<00:09, 19.72it/s, acc=86.71875%]
                                                     Epochs:  26%|██▌       | 64/250 [00:03<00:09, 19.72it/s, loss=0.564]       Epochs:  26%|██▋       | 66/250 [00:03<00:09, 19.74it/s, loss=0.564]
    Sample:   0%|          | 0/8 [00:00<?, ?it/s]    Epochs:  26%|██▋       | 66/250 [00:03<00:09, 19.74it/s, acc=86.71875%]    Epochs:  26%|██▋       | 66/250 [00:03<00:09, 19.74it/s, acc=86.71875%]    Epochs:  26%|██▋       | 66/250 [00:03<00:09, 19.74it/s, acc=86.71875%]    Epochs:  26%|██▋       | 66/250 [00:03<00:09, 19.74it/s, acc=86.71875%]    Epochs:  26%|██▋       | 66/250 [00:03<00:09, 19.74it/s, acc=86.5234375%]    Epochs:  26%|██▋       | 66/250 [00:03<00:09, 19.74it/s, acc=86.5234375%]    Epochs:  26%|██▋       | 66/250 [00:03<00:09, 19.74it/s, acc=86.5234375%]    Epochs:  26%|██▋       | 66/250 [00:03<00:09, 19.74it/s, acc=87.109375%] 
                                                     Epochs:  26%|██▋       | 66/250 [00:03<00:09, 19.74it/s, loss=0.562]    
    Sample:   0%|          | 0/8 [00:00<?, ?it/s]    Epochs:  26%|██▋       | 66/250 [00:03<00:09, 19.74it/s, acc=87.109375%]    Epochs:  26%|██▋       | 66/250 [00:03<00:09, 19.74it/s, acc=87.109375%]    Epochs:  26%|██▋       | 66/250 [00:03<00:09, 19.74it/s, acc=87.109375%]    Epochs:  26%|██▋       | 66/250 [00:03<00:09, 19.74it/s, acc=87.109375%]    Epochs:  26%|██▋       | 66/250 [00:03<00:09, 19.74it/s, acc=87.109375%]    Epochs:  26%|██▋       | 66/250 [00:03<00:09, 19.74it/s, acc=87.109375%]    Epochs:  26%|██▋       | 66/250 [00:03<00:09, 19.74it/s, acc=87.109375%]    Epochs:  26%|██▋       | 66/250 [00:03<00:09, 19.74it/s, acc=86.9140625%]
                                                     Epochs:  26%|██▋       | 66/250 [00:03<00:09, 19.74it/s, loss=0.559]         Epochs:  27%|██▋       | 68/250 [00:03<00:09, 19.71it/s, loss=0.559]
    Sample:   0%|          | 0/8 [00:00<?, ?it/s]    Epochs:  27%|██▋       | 68/250 [00:03<00:09, 19.71it/s, acc=86.9140625%]    Epochs:  27%|██▋       | 68/250 [00:03<00:09, 19.71it/s, acc=86.9140625%]    Epochs:  27%|██▋       | 68/250 [00:03<00:09, 19.71it/s, acc=86.9140625%]    Epochs:  27%|██▋       | 68/250 [00:03<00:09, 19.71it/s, acc=86.9140625%]    Epochs:  27%|██▋       | 68/250 [00:03<00:09, 19.71it/s, acc=87.109375%]     Epochs:  27%|██▋       | 68/250 [00:03<00:09, 19.71it/s, acc=87.109375%]    Epochs:  27%|██▋       | 68/250 [00:03<00:09, 19.71it/s, acc=86.9140625%]    Epochs:  27%|██▋       | 68/250 [00:03<00:09, 19.71it/s, acc=86.9140625%]
                                                     Epochs:  27%|██▋       | 68/250 [00:03<00:09, 19.71it/s, loss=0.556]     
    Sample:   0%|          | 0/8 [00:00<?, ?it/s]    Epochs:  27%|██▋       | 68/250 [00:03<00:09, 19.71it/s, acc=86.9140625%]    Epochs:  27%|██▋       | 68/250 [00:03<00:09, 19.71it/s, acc=86.9140625%]    Epochs:  27%|██▋       | 68/250 [00:03<00:09, 19.71it/s, acc=86.9140625%]    Epochs:  27%|██▋       | 68/250 [00:03<00:09, 19.71it/s, acc=86.9140625%]    Epochs:  27%|██▋       | 68/250 [00:03<00:09, 19.71it/s, acc=86.9140625%]    Epochs:  27%|██▋       | 68/250 [00:03<00:09, 19.71it/s, acc=86.71875%]      Epochs:  27%|██▋       | 68/250 [00:03<00:09, 19.71it/s, acc=86.71875%]    Epochs:  27%|██▋       | 68/250 [00:03<00:09, 19.71it/s, acc=86.71875%]
                                                     Epochs:  27%|██▋       | 68/250 [00:03<00:09, 19.71it/s, loss=0.554]       Epochs:  28%|██▊       | 70/250 [00:03<00:09, 19.56it/s, loss=0.554]
    Sample:   0%|          | 0/8 [00:00<?, ?it/s]    Epochs:  28%|██▊       | 70/250 [00:03<00:09, 19.56it/s, acc=86.5234375%]    Epochs:  28%|██▊       | 70/250 [00:03<00:09, 19.56it/s, acc=86.5234375%]    Epochs:  28%|██▊       | 70/250 [00:03<00:09, 19.56it/s, acc=86.5234375%]    Epochs:  28%|██▊       | 70/250 [00:03<00:09, 19.56it/s, acc=86.5234375%]    Epochs:  28%|██▊       | 70/250 [00:03<00:09, 19.56it/s, acc=86.5234375%]    Epochs:  28%|██▊       | 70/250 [00:03<00:09, 19.56it/s, acc=86.5234375%]    Epochs:  28%|██▊       | 70/250 [00:03<00:09, 19.56it/s, acc=86.71875%]      Epochs:  28%|██▊       | 70/250 [00:03<00:09, 19.56it/s, acc=86.71875%]
                                                     Epochs:  28%|██▊       | 70/250 [00:03<00:09, 19.56it/s, loss=0.551]   
    Sample:   0%|          | 0/8 [00:00<?, ?it/s]    Epochs:  28%|██▊       | 70/250 [00:03<00:09, 19.56it/s, acc=86.71875%]    Epochs:  28%|██▊       | 70/250 [00:03<00:09, 19.56it/s, acc=86.71875%]    Epochs:  28%|██▊       | 70/250 [00:03<00:09, 19.56it/s, acc=86.71875%]    Epochs:  28%|██▊       | 70/250 [00:03<00:09, 19.56it/s, acc=86.71875%]    Epochs:  28%|██▊       | 70/250 [00:03<00:09, 19.56it/s, acc=86.71875%]    Epochs:  28%|██▊       | 70/250 [00:03<00:09, 19.56it/s, acc=86.71875%]    Epochs:  28%|██▊       | 70/250 [00:03<00:09, 19.56it/s, acc=86.71875%]    Epochs:  28%|██▊       | 70/250 [00:03<00:09, 19.56it/s, acc=86.71875%]
                                                     Epochs:  28%|██▊       | 70/250 [00:03<00:09, 19.56it/s, loss=0.548]       Epochs:  29%|██▉       | 72/250 [00:03<00:09, 19.63it/s, loss=0.548]
    Sample:   0%|          | 0/8 [00:00<?, ?it/s]    Epochs:  29%|██▉       | 72/250 [00:03<00:09, 19.63it/s, acc=86.71875%]    Epochs:  29%|██▉       | 72/250 [00:03<00:09, 19.63it/s, acc=86.71875%]    Epochs:  29%|██▉       | 72/250 [00:03<00:09, 19.63it/s, acc=86.71875%]    Epochs:  29%|██▉       | 72/250 [00:03<00:09, 19.63it/s, acc=86.71875%]    Epochs:  29%|██▉       | 72/250 [00:03<00:09, 19.63it/s, acc=86.71875%]    Epochs:  29%|██▉       | 72/250 [00:03<00:09, 19.63it/s, acc=86.71875%]    Epochs:  29%|██▉       | 72/250 [00:03<00:09, 19.63it/s, acc=86.5234375%]    Epochs:  29%|██▉       | 72/250 [00:03<00:09, 19.63it/s, acc=86.5234375%]
                                                     Epochs:  29%|██▉       | 72/250 [00:03<00:09, 19.63it/s, loss=0.546]     
    Sample:   0%|          | 0/8 [00:00<?, ?it/s]    Epochs:  29%|██▉       | 72/250 [00:03<00:09, 19.63it/s, acc=86.5234375%]    Epochs:  29%|██▉       | 72/250 [00:03<00:09, 19.63it/s, acc=86.5234375%]    Epochs:  29%|██▉       | 72/250 [00:03<00:09, 19.63it/s, acc=86.5234375%]    Epochs:  29%|██▉       | 72/250 [00:03<00:09, 19.63it/s, acc=86.5234375%]    Epochs:  29%|██▉       | 72/250 [00:03<00:09, 19.63it/s, acc=86.328125%]     Epochs:  29%|██▉       | 72/250 [00:03<00:09, 19.63it/s, acc=86.328125%]    Epochs:  29%|██▉       | 72/250 [00:03<00:09, 19.63it/s, acc=86.328125%]    Epochs:  29%|██▉       | 72/250 [00:03<00:09, 19.63it/s, acc=86.328125%]
                                                     Epochs:  29%|██▉       | 72/250 [00:03<00:09, 19.63it/s, loss=0.543]        Epochs:  30%|██▉       | 74/250 [00:03<00:08, 19.61it/s, loss=0.543]
    Sample:   0%|          | 0/8 [00:00<?, ?it/s]    Epochs:  30%|██▉       | 74/250 [00:03<00:08, 19.61it/s, acc=86.328125%]    Epochs:  30%|██▉       | 74/250 [00:03<00:08, 19.61it/s, acc=86.328125%]    Epochs:  30%|██▉       | 74/250 [00:03<00:08, 19.61it/s, acc=86.328125%]    Epochs:  30%|██▉       | 74/250 [00:03<00:08, 19.61it/s, acc=86.328125%]    Epochs:  30%|██▉       | 74/250 [00:03<00:08, 19.61it/s, acc=86.328125%]    Epochs:  30%|██▉       | 74/250 [00:03<00:08, 19.61it/s, acc=86.5234375%]    Epochs:  30%|██▉       | 74/250 [00:03<00:08, 19.61it/s, acc=86.5234375%]    Epochs:  30%|██▉       | 74/250 [00:03<00:08, 19.61it/s, acc=86.5234375%]
                                                     Epochs:  30%|██▉       | 74/250 [00:03<00:08, 19.61it/s, loss=0.541]     
    Sample:   0%|          | 0/8 [00:00<?, ?it/s]    Epochs:  30%|██▉       | 74/250 [00:03<00:08, 19.61it/s, acc=86.5234375%]    Epochs:  30%|██▉       | 74/250 [00:03<00:08, 19.61it/s, acc=86.5234375%]    Epochs:  30%|██▉       | 74/250 [00:03<00:08, 19.61it/s, acc=86.5234375%]    Epochs:  30%|██▉       | 74/250 [00:03<00:08, 19.61it/s, acc=86.5234375%]    Epochs:  30%|██▉       | 74/250 [00:03<00:08, 19.61it/s, acc=86.71875%]      Epochs:  30%|██▉       | 74/250 [00:03<00:08, 19.61it/s, acc=86.71875%]    Epochs:  30%|██▉       | 74/250 [00:03<00:08, 19.61it/s, acc=86.71875%]    Epochs:  30%|██▉       | 74/250 [00:03<00:08, 19.61it/s, acc=86.71875%]
                                                     Epochs:  30%|██▉       | 74/250 [00:03<00:08, 19.61it/s, loss=0.538]       Epochs:  30%|███       | 76/250 [00:03<00:08, 19.67it/s, loss=0.538]
    Sample:   0%|          | 0/8 [00:00<?, ?it/s]    Epochs:  30%|███       | 76/250 [00:03<00:08, 19.67it/s, acc=86.71875%]    Epochs:  30%|███       | 76/250 [00:03<00:08, 19.67it/s, acc=86.71875%]    Epochs:  30%|███       | 76/250 [00:03<00:08, 19.67it/s, acc=86.71875%]    Epochs:  30%|███       | 76/250 [00:03<00:08, 19.67it/s, acc=86.71875%]    Epochs:  30%|███       | 76/250 [00:03<00:08, 19.67it/s, acc=86.71875%]    Epochs:  30%|███       | 76/250 [00:03<00:08, 19.67it/s, acc=86.9140625%]    Epochs:  30%|███       | 76/250 [00:03<00:08, 19.67it/s, acc=86.9140625%]    Epochs:  30%|███       | 76/250 [00:03<00:08, 19.67it/s, acc=86.9140625%]
                                                     Epochs:  30%|███       | 76/250 [00:03<00:08, 19.67it/s, loss=0.535]     
    Sample:   0%|          | 0/8 [00:00<?, ?it/s]    Epochs:  30%|███       | 76/250 [00:03<00:08, 19.67it/s, acc=86.9140625%]    Epochs:  30%|███       | 76/250 [00:03<00:08, 19.67it/s, acc=86.9140625%]    Epochs:  30%|███       | 76/250 [00:03<00:08, 19.67it/s, acc=86.9140625%]    Epochs:  30%|███       | 76/250 [00:03<00:08, 19.67it/s, acc=87.109375%]     Epochs:  30%|███       | 76/250 [00:03<00:08, 19.67it/s, acc=87.109375%]    Epochs:  30%|███       | 76/250 [00:03<00:08, 19.67it/s, acc=87.109375%]    Epochs:  30%|███       | 76/250 [00:03<00:08, 19.67it/s, acc=86.9140625%]    Epochs:  30%|███       | 76/250 [00:03<00:08, 19.67it/s, acc=86.9140625%]
                                                     Epochs:  30%|███       | 76/250 [00:03<00:08, 19.67it/s, loss=0.533]         Epochs:  31%|███       | 78/250 [00:03<00:08, 19.65it/s, loss=0.533]
    Sample:   0%|          | 0/8 [00:00<?, ?it/s]    Epochs:  31%|███       | 78/250 [00:03<00:08, 19.65it/s, acc=86.9140625%]    Epochs:  31%|███       | 78/250 [00:03<00:08, 19.65it/s, acc=86.9140625%]    Epochs:  31%|███       | 78/250 [00:03<00:08, 19.65it/s, acc=86.9140625%]    Epochs:  31%|███       | 78/250 [00:03<00:08, 19.65it/s, acc=86.9140625%]    Epochs:  31%|███       | 78/250 [00:04<00:08, 19.65it/s, acc=86.9140625%]    Epochs:  31%|███       | 78/250 [00:04<00:08, 19.65it/s, acc=86.9140625%]    Epochs:  31%|███       | 78/250 [00:04<00:08, 19.65it/s, acc=86.9140625%]    Epochs:  31%|███       | 78/250 [00:04<00:08, 19.65it/s, acc=86.9140625%]
                                                     Epochs:  31%|███       | 78/250 [00:04<00:08, 19.65it/s, loss=0.53]      
    Sample:   0%|          | 0/8 [00:00<?, ?it/s]    Epochs:  31%|███       | 78/250 [00:04<00:08, 19.65it/s, acc=86.9140625%]    Epochs:  31%|███       | 78/250 [00:04<00:08, 19.65it/s, acc=86.9140625%]    Epochs:  31%|███       | 78/250 [00:04<00:08, 19.65it/s, acc=86.9140625%]    Epochs:  31%|███       | 78/250 [00:04<00:08, 19.65it/s, acc=86.9140625%]    Epochs:  31%|███       | 78/250 [00:04<00:08, 19.65it/s, acc=87.109375%]     Epochs:  31%|███       | 78/250 [00:04<00:08, 19.65it/s, acc=87.109375%]    Epochs:  31%|███       | 78/250 [00:04<00:08, 19.65it/s, acc=87.109375%]    Epochs:  31%|███       | 78/250 [00:04<00:08, 19.65it/s, acc=87.109375%]
                                                     Epochs:  31%|███       | 78/250 [00:04<00:08, 19.65it/s, loss=0.528]        Epochs:  32%|███▏      | 80/250 [00:04<00:08, 19.64it/s, loss=0.528]
    Sample:   0%|          | 0/8 [00:00<?, ?it/s]    Epochs:  32%|███▏      | 80/250 [00:04<00:08, 19.64it/s, acc=87.3046875%]    Epochs:  32%|███▏      | 80/250 [00:04<00:08, 19.64it/s, acc=87.3046875%]    Epochs:  32%|███▏      | 80/250 [00:04<00:08, 19.64it/s, acc=87.3046875%]    Epochs:  32%|███▏      | 80/250 [00:04<00:08, 19.64it/s, acc=87.3046875%]    Epochs:  32%|███▏      | 80/250 [00:04<00:08, 19.64it/s, acc=87.3046875%]    Epochs:  32%|███▏      | 80/250 [00:04<00:08, 19.64it/s, acc=87.3046875%]    Epochs:  32%|███▏      | 80/250 [00:04<00:08, 19.64it/s, acc=87.3046875%]    Epochs:  32%|███▏      | 80/250 [00:04<00:08, 19.64it/s, acc=87.3046875%]
                                                     Epochs:  32%|███▏      | 80/250 [00:04<00:08, 19.64it/s, loss=0.525]     
    Sample:   0%|          | 0/8 [00:00<?, ?it/s]    Epochs:  32%|███▏      | 80/250 [00:04<00:08, 19.64it/s, acc=87.3046875%]    Epochs:  32%|███▏      | 80/250 [00:04<00:08, 19.64it/s, acc=87.3046875%]    Epochs:  32%|███▏      | 80/250 [00:04<00:08, 19.64it/s, acc=87.3046875%]    Epochs:  32%|███▏      | 80/250 [00:04<00:08, 19.64it/s, acc=87.3046875%]    Epochs:  32%|███▏      | 80/250 [00:04<00:08, 19.64it/s, acc=87.3046875%]    Epochs:  32%|███▏      | 80/250 [00:04<00:08, 19.64it/s, acc=87.3046875%]    Epochs:  32%|███▏      | 80/250 [00:04<00:08, 19.64it/s, acc=87.5%]          Epochs:  32%|███▏      | 80/250 [00:04<00:08, 19.64it/s, acc=87.5%]
                                                     Epochs:  32%|███▏      | 80/250 [00:04<00:08, 19.64it/s, loss=0.523]    Epochs:  33%|███▎      | 82/250 [00:04<00:08, 19.64it/s, loss=0.523]
    Sample:   0%|          | 0/8 [00:00<?, ?it/s]    Epochs:  33%|███▎      | 82/250 [00:04<00:08, 19.64it/s, acc=87.5%]     Epochs:  33%|███▎      | 82/250 [00:04<00:08, 19.64it/s, acc=87.5%]    Epochs:  33%|███▎      | 82/250 [00:04<00:08, 19.64it/s, acc=87.5%]    Epochs:  33%|███▎      | 82/250 [00:04<00:08, 19.64it/s, acc=87.5%]    Epochs:  33%|███▎      | 82/250 [00:04<00:08, 19.64it/s, acc=87.5%]    Epochs:  33%|███▎      | 82/250 [00:04<00:08, 19.64it/s, acc=87.5%]    Epochs:  33%|███▎      | 82/250 [00:04<00:08, 19.64it/s, acc=87.5%]    Epochs:  33%|███▎      | 82/250 [00:04<00:08, 19.64it/s, acc=87.5%]
                                                     Epochs:  33%|███▎      | 82/250 [00:04<00:08, 19.64it/s, loss=0.52]
    Sample:   0%|          | 0/8 [00:00<?, ?it/s]    Epochs:  33%|███▎      | 82/250 [00:04<00:08, 19.64it/s, acc=87.5%]    Epochs:  33%|███▎      | 82/250 [00:04<00:08, 19.64it/s, acc=87.5%]    Epochs:  33%|███▎      | 82/250 [00:04<00:08, 19.64it/s, acc=87.5%]    Epochs:  33%|███▎      | 82/250 [00:04<00:08, 19.64it/s, acc=87.5%]    Epochs:  33%|███▎      | 82/250 [00:04<00:08, 19.64it/s, acc=87.5%]    Epochs:  33%|███▎      | 82/250 [00:04<00:08, 19.64it/s, acc=87.5%]    Epochs:  33%|███▎      | 82/250 [00:04<00:08, 19.64it/s, acc=87.5%]    Epochs:  33%|███▎      | 82/250 [00:04<00:08, 19.64it/s, acc=87.5%]
                                                     Epochs:  33%|███▎      | 82/250 [00:04<00:08, 19.64it/s, loss=0.518]    Epochs:  34%|███▎      | 84/250 [00:04<00:08, 19.68it/s, loss=0.518]
    Sample:   0%|          | 0/8 [00:00<?, ?it/s]    Epochs:  34%|███▎      | 84/250 [00:04<00:08, 19.68it/s, acc=87.5%]     Epochs:  34%|███▎      | 84/250 [00:04<00:08, 19.68it/s, acc=87.5%]    Epochs:  34%|███▎      | 84/250 [00:04<00:08, 19.68it/s, acc=87.5%]    Epochs:  34%|███▎      | 84/250 [00:04<00:08, 19.68it/s, acc=87.5%]    Epochs:  34%|███▎      | 84/250 [00:04<00:08, 19.68it/s, acc=87.5%]    Epochs:  34%|███▎      | 84/250 [00:04<00:08, 19.68it/s, acc=87.5%]    Epochs:  34%|███▎      | 84/250 [00:04<00:08, 19.68it/s, acc=87.5%]    Epochs:  34%|███▎      | 84/250 [00:04<00:08, 19.68it/s, acc=87.5%]
                                                     Epochs:  34%|███▎      | 84/250 [00:04<00:08, 19.68it/s, loss=0.515]
    Sample:   0%|          | 0/8 [00:00<?, ?it/s]    Epochs:  34%|███▎      | 84/250 [00:04<00:08, 19.68it/s, acc=87.5%]     Epochs:  34%|███▎      | 84/250 [00:04<00:08, 19.68it/s, acc=87.5%]    Epochs:  34%|███▎      | 84/250 [00:04<00:08, 19.68it/s, acc=87.5%]    Epochs:  34%|███▎      | 84/250 [00:04<00:08, 19.68it/s, acc=87.5%]    Epochs:  34%|███▎      | 84/250 [00:04<00:08, 19.68it/s, acc=87.5%]    Epochs:  34%|███▎      | 84/250 [00:04<00:08, 19.68it/s, acc=87.5%]    Epochs:  34%|███▎      | 84/250 [00:04<00:08, 19.68it/s, acc=87.6953125%]    Epochs:  34%|███▎      | 84/250 [00:04<00:08, 19.68it/s, acc=87.6953125%]
                                                     Epochs:  34%|███▎      | 84/250 [00:04<00:08, 19.68it/s, loss=0.513]         Epochs:  34%|███▍      | 86/250 [00:04<00:08, 19.61it/s, loss=0.513]
    Sample:   0%|          | 0/8 [00:00<?, ?it/s]    Epochs:  34%|███▍      | 86/250 [00:04<00:08, 19.61it/s, acc=87.6953125%]    Epochs:  34%|███▍      | 86/250 [00:04<00:08, 19.61it/s, acc=87.6953125%]    Epochs:  34%|███▍      | 86/250 [00:04<00:08, 19.61it/s, acc=87.6953125%]    Epochs:  34%|███▍      | 86/250 [00:04<00:08, 19.61it/s, acc=87.6953125%]    Epochs:  34%|███▍      | 86/250 [00:04<00:08, 19.61it/s, acc=87.6953125%]    Epochs:  34%|███▍      | 86/250 [00:04<00:08, 19.61it/s, acc=87.6953125%]    Epochs:  34%|███▍      | 86/250 [00:04<00:08, 19.61it/s, acc=87.6953125%]    Epochs:  34%|███▍      | 86/250 [00:04<00:08, 19.61it/s, acc=87.6953125%]
                                                     Epochs:  34%|███▍      | 86/250 [00:04<00:08, 19.61it/s, loss=0.51]      
    Sample:   0%|          | 0/8 [00:00<?, ?it/s]    Epochs:  34%|███▍      | 86/250 [00:04<00:08, 19.61it/s, acc=87.6953125%]    Epochs:  34%|███▍      | 86/250 [00:04<00:08, 19.61it/s, acc=87.6953125%]    Epochs:  34%|███▍      | 86/250 [00:04<00:08, 19.61it/s, acc=87.6953125%]    Epochs:  34%|███▍      | 86/250 [00:04<00:08, 19.61it/s, acc=87.6953125%]    Epochs:  34%|███▍      | 86/250 [00:04<00:08, 19.61it/s, acc=87.6953125%]    Epochs:  34%|███▍      | 86/250 [00:04<00:08, 19.61it/s, acc=87.6953125%]    Epochs:  34%|███▍      | 86/250 [00:04<00:08, 19.61it/s, acc=87.6953125%]    Epochs:  34%|███▍      | 86/250 [00:04<00:08, 19.61it/s, acc=87.890625%] 
                                                     Epochs:  34%|███▍      | 86/250 [00:04<00:08, 19.61it/s, loss=0.508]        Epochs:  35%|███▌      | 88/250 [00:04<00:08, 19.56it/s, loss=0.508]
    Sample:   0%|          | 0/8 [00:00<?, ?it/s]    Epochs:  35%|███▌      | 88/250 [00:04<00:08, 19.56it/s, acc=87.890625%]    Epochs:  35%|███▌      | 88/250 [00:04<00:08, 19.56it/s, acc=87.890625%]    Epochs:  35%|███▌      | 88/250 [00:04<00:08, 19.56it/s, acc=87.890625%]    Epochs:  35%|███▌      | 88/250 [00:04<00:08, 19.56it/s, acc=87.890625%]    Epochs:  35%|███▌      | 88/250 [00:04<00:08, 19.56it/s, acc=87.6953125%]    Epochs:  35%|███▌      | 88/250 [00:04<00:08, 19.56it/s, acc=87.6953125%]    Epochs:  35%|███▌      | 88/250 [00:04<00:08, 19.56it/s, acc=87.890625%]     Epochs:  35%|███▌      | 88/250 [00:04<00:08, 19.56it/s, acc=88.0859375%]
                                                     Epochs:  35%|███▌      | 88/250 [00:04<00:08, 19.56it/s, loss=0.505]     
    Sample:   0%|          | 0/8 [00:00<?, ?it/s]    Epochs:  35%|███▌      | 88/250 [00:04<00:08, 19.56it/s, acc=88.0859375%]    Epochs:  35%|███▌      | 88/250 [00:04<00:08, 19.56it/s, acc=88.0859375%]    Epochs:  35%|███▌      | 88/250 [00:04<00:08, 19.56it/s, acc=88.0859375%]    Epochs:  35%|███▌      | 88/250 [00:04<00:08, 19.56it/s, acc=88.28125%]      Epochs:  35%|███▌      | 88/250 [00:04<00:08, 19.56it/s, acc=88.28125%]    Epochs:  35%|███▌      | 88/250 [00:04<00:08, 19.56it/s, acc=88.28125%]    Epochs:  35%|███▌      | 88/250 [00:04<00:08, 19.56it/s, acc=88.28125%]    Epochs:  35%|███▌      | 88/250 [00:04<00:08, 19.56it/s, acc=88.28125%]
                                                     Epochs:  35%|███▌      | 88/250 [00:04<00:08, 19.56it/s, loss=0.503]       Epochs:  36%|███▌      | 90/250 [00:04<00:08, 19.62it/s, loss=0.503]
    Sample:   0%|          | 0/8 [00:00<?, ?it/s]    Epochs:  36%|███▌      | 90/250 [00:04<00:08, 19.62it/s, acc=88.28125%]    Epochs:  36%|███▌      | 90/250 [00:04<00:08, 19.62it/s, acc=88.28125%]    Epochs:  36%|███▌      | 90/250 [00:04<00:08, 19.62it/s, acc=88.28125%]    Epochs:  36%|███▌      | 90/250 [00:04<00:08, 19.62it/s, acc=88.28125%]    Epochs:  36%|███▌      | 90/250 [00:04<00:08, 19.62it/s, acc=88.28125%]    Epochs:  36%|███▌      | 90/250 [00:04<00:08, 19.62it/s, acc=88.28125%]    Epochs:  36%|███▌      | 90/250 [00:04<00:08, 19.62it/s, acc=88.28125%]    Epochs:  36%|███▌      | 90/250 [00:04<00:08, 19.62it/s, acc=88.28125%]
                                                     Epochs:  36%|███▌      | 90/250 [00:04<00:08, 19.62it/s, loss=0.501]   
    Sample:   0%|          | 0/8 [00:00<?, ?it/s]    Epochs:  36%|███▌      | 90/250 [00:04<00:08, 19.62it/s, acc=88.28125%]    Epochs:  36%|███▌      | 90/250 [00:04<00:08, 19.62it/s, acc=88.28125%]    Epochs:  36%|███▌      | 90/250 [00:04<00:08, 19.62it/s, acc=88.28125%]    Epochs:  36%|███▌      | 90/250 [00:04<00:08, 19.62it/s, acc=88.28125%]    Epochs:  36%|███▌      | 90/250 [00:04<00:08, 19.62it/s, acc=88.28125%]    Epochs:  36%|███▌      | 90/250 [00:04<00:08, 19.62it/s, acc=88.28125%]    Epochs:  36%|███▌      | 90/250 [00:04<00:08, 19.62it/s, acc=88.28125%]    Epochs:  36%|███▌      | 90/250 [00:04<00:08, 19.62it/s, acc=88.28125%]
                                                     Epochs:  36%|███▌      | 90/250 [00:04<00:08, 19.62it/s, loss=0.498]       Epochs:  37%|███▋      | 92/250 [00:04<00:08, 19.67it/s, loss=0.498]
    Sample:   0%|          | 0/8 [00:00<?, ?it/s]    Epochs:  37%|███▋      | 92/250 [00:04<00:08, 19.67it/s, acc=88.28125%]    Epochs:  37%|███▋      | 92/250 [00:04<00:08, 19.67it/s, acc=88.28125%]    Epochs:  37%|███▋      | 92/250 [00:04<00:08, 19.67it/s, acc=88.28125%]    Epochs:  37%|███▋      | 92/250 [00:04<00:08, 19.67it/s, acc=88.28125%]    Epochs:  37%|███▋      | 92/250 [00:04<00:08, 19.67it/s, acc=88.28125%]    Epochs:  37%|███▋      | 92/250 [00:04<00:08, 19.67it/s, acc=88.4765625%]    Epochs:  37%|███▋      | 92/250 [00:04<00:08, 19.67it/s, acc=88.671875%]     Epochs:  37%|███▋      | 92/250 [00:04<00:08, 19.67it/s, acc=88.671875%]
                                                     Epochs:  37%|███▋      | 92/250 [00:04<00:08, 19.67it/s, loss=0.496]    
    Sample:   0%|          | 0/8 [00:00<?, ?it/s]    Epochs:  37%|███▋      | 92/250 [00:04<00:08, 19.67it/s, acc=88.671875%]    Epochs:  37%|███▋      | 92/250 [00:04<00:08, 19.67it/s, acc=88.671875%]    Epochs:  37%|███▋      | 92/250 [00:04<00:08, 19.67it/s, acc=88.671875%]    Epochs:  37%|███▋      | 92/250 [00:04<00:08, 19.67it/s, acc=88.671875%]    Epochs:  37%|███▋      | 92/250 [00:04<00:08, 19.67it/s, acc=88.671875%]    Epochs:  37%|███▋      | 92/250 [00:04<00:08, 19.67it/s, acc=88.671875%]    Epochs:  37%|███▋      | 92/250 [00:04<00:08, 19.67it/s, acc=88.671875%]    Epochs:  37%|███▋      | 92/250 [00:04<00:08, 19.67it/s, acc=88.671875%]
                                                     Epochs:  37%|███▋      | 92/250 [00:04<00:08, 19.67it/s, loss=0.494]        Epochs:  38%|███▊      | 94/250 [00:04<00:07, 19.62it/s, loss=0.494]
    Sample:   0%|          | 0/8 [00:00<?, ?it/s]    Epochs:  38%|███▊      | 94/250 [00:04<00:07, 19.62it/s, acc=88.671875%]    Epochs:  38%|███▊      | 94/250 [00:04<00:07, 19.62it/s, acc=88.671875%]    Epochs:  38%|███▊      | 94/250 [00:04<00:07, 19.62it/s, acc=88.671875%]    Epochs:  38%|███▊      | 94/250 [00:04<00:07, 19.62it/s, acc=88.671875%]    Epochs:  38%|███▊      | 94/250 [00:04<00:07, 19.62it/s, acc=88.671875%]    Epochs:  38%|███▊      | 94/250 [00:04<00:07, 19.62it/s, acc=88.671875%]    Epochs:  38%|███▊      | 94/250 [00:04<00:07, 19.62it/s, acc=88.671875%]    Epochs:  38%|███▊      | 94/250 [00:04<00:07, 19.62it/s, acc=88.671875%]
                                                     Epochs:  38%|███▊      | 94/250 [00:04<00:07, 19.62it/s, loss=0.491]    
    Sample:   0%|          | 0/8 [00:00<?, ?it/s]    Epochs:  38%|███▊      | 94/250 [00:04<00:07, 19.62it/s, acc=88.671875%]    Epochs:  38%|███▊      | 94/250 [00:04<00:07, 19.62it/s, acc=88.671875%]    Epochs:  38%|███▊      | 94/250 [00:04<00:07, 19.62it/s, acc=88.671875%]    Epochs:  38%|███▊      | 94/250 [00:04<00:07, 19.62it/s, acc=88.671875%]    Epochs:  38%|███▊      | 94/250 [00:04<00:07, 19.62it/s, acc=88.671875%]    Epochs:  38%|███▊      | 94/250 [00:04<00:07, 19.62it/s, acc=88.671875%]    Epochs:  38%|███▊      | 94/250 [00:04<00:07, 19.62it/s, acc=88.671875%]    Epochs:  38%|███▊      | 94/250 [00:04<00:07, 19.62it/s, acc=88.671875%]
                                                     Epochs:  38%|███▊      | 94/250 [00:04<00:07, 19.62it/s, loss=0.489]        Epochs:  38%|███▊      | 96/250 [00:04<00:07, 19.63it/s, loss=0.489]
    Sample:   0%|          | 0/8 [00:00<?, ?it/s]    Epochs:  38%|███▊      | 96/250 [00:04<00:07, 19.63it/s, acc=88.671875%]    Epochs:  38%|███▊      | 96/250 [00:04<00:07, 19.63it/s, acc=88.671875%]    Epochs:  38%|███▊      | 96/250 [00:04<00:07, 19.63it/s, acc=88.671875%]    Epochs:  38%|███▊      | 96/250 [00:04<00:07, 19.63it/s, acc=88.671875%]    Epochs:  38%|███▊      | 96/250 [00:04<00:07, 19.63it/s, acc=88.671875%]    Epochs:  38%|███▊      | 96/250 [00:04<00:07, 19.63it/s, acc=88.671875%]    Epochs:  38%|███▊      | 96/250 [00:04<00:07, 19.63it/s, acc=88.671875%]    Epochs:  38%|███▊      | 96/250 [00:04<00:07, 19.63it/s, acc=88.671875%]
                                                     Epochs:  38%|███▊      | 96/250 [00:04<00:07, 19.63it/s, loss=0.487]    
    Sample:   0%|          | 0/8 [00:00<?, ?it/s]    Epochs:  38%|███▊      | 96/250 [00:04<00:07, 19.63it/s, acc=88.671875%]    Epochs:  38%|███▊      | 96/250 [00:04<00:07, 19.63it/s, acc=88.671875%]    Epochs:  38%|███▊      | 96/250 [00:04<00:07, 19.63it/s, acc=88.671875%]    Epochs:  38%|███▊      | 96/250 [00:04<00:07, 19.63it/s, acc=88.671875%]    Epochs:  38%|███▊      | 96/250 [00:04<00:07, 19.63it/s, acc=88.8671875%]    Epochs:  38%|███▊      | 96/250 [00:04<00:07, 19.63it/s, acc=88.671875%]     Epochs:  38%|███▊      | 96/250 [00:04<00:07, 19.63it/s, acc=88.671875%]    Epochs:  38%|███▊      | 96/250 [00:04<00:07, 19.63it/s, acc=88.671875%]
                                                     Epochs:  38%|███▊      | 96/250 [00:04<00:07, 19.63it/s, loss=0.485]        Epochs:  39%|███▉      | 98/250 [00:04<00:07, 19.65it/s, loss=0.485]
    Sample:   0%|          | 0/8 [00:00<?, ?it/s]    Epochs:  39%|███▉      | 98/250 [00:04<00:07, 19.65it/s, acc=88.671875%]    Epochs:  39%|███▉      | 98/250 [00:05<00:07, 19.65it/s, acc=88.671875%]    Epochs:  39%|███▉      | 98/250 [00:05<00:07, 19.65it/s, acc=88.671875%]    Epochs:  39%|███▉      | 98/250 [00:05<00:07, 19.65it/s, acc=88.671875%]    Epochs:  39%|███▉      | 98/250 [00:05<00:07, 19.65it/s, acc=88.671875%]    Epochs:  39%|███▉      | 98/250 [00:05<00:07, 19.65it/s, acc=88.671875%]    Epochs:  39%|███▉      | 98/250 [00:05<00:07, 19.65it/s, acc=88.671875%]    Epochs:  39%|███▉      | 98/250 [00:05<00:07, 19.65it/s, acc=88.671875%]
                                                     Epochs:  39%|███▉      | 98/250 [00:05<00:07, 19.65it/s, loss=0.482]    
    Sample:   0%|          | 0/8 [00:00<?, ?it/s]    Epochs:  39%|███▉      | 98/250 [00:05<00:07, 19.65it/s, acc=88.671875%]    Epochs:  39%|███▉      | 98/250 [00:05<00:07, 19.65it/s, acc=88.671875%]    Epochs:  39%|███▉      | 98/250 [00:05<00:07, 19.65it/s, acc=88.671875%]    Epochs:  39%|███▉      | 98/250 [00:05<00:07, 19.65it/s, acc=88.671875%]    Epochs:  39%|███▉      | 98/250 [00:05<00:07, 19.65it/s, acc=88.671875%]    Epochs:  39%|███▉      | 98/250 [00:05<00:07, 19.65it/s, acc=88.671875%]    Epochs:  39%|███▉      | 98/250 [00:05<00:07, 19.65it/s, acc=88.671875%]    Epochs:  39%|███▉      | 98/250 [00:05<00:07, 19.65it/s, acc=88.671875%]
                                                     Epochs:  39%|███▉      | 98/250 [00:05<00:07, 19.65it/s, loss=0.48]         Epochs:  40%|████      | 100/250 [00:05<00:07, 19.67it/s, loss=0.48]
    Sample:   0%|          | 0/8 [00:00<?, ?it/s]    Epochs:  40%|████      | 100/250 [00:05<00:07, 19.67it/s, acc=88.671875%]    Epochs:  40%|████      | 100/250 [00:05<00:07, 19.67it/s, acc=88.671875%]    Epochs:  40%|████      | 100/250 [00:05<00:07, 19.67it/s, acc=88.671875%]    Epochs:  40%|████      | 100/250 [00:05<00:07, 19.67it/s, acc=88.671875%]    Epochs:  40%|████      | 100/250 [00:05<00:07, 19.67it/s, acc=88.671875%]    Epochs:  40%|████      | 100/250 [00:05<00:07, 19.67it/s, acc=88.671875%]    Epochs:  40%|████      | 100/250 [00:05<00:07, 19.67it/s, acc=88.671875%]    Epochs:  40%|████      | 100/250 [00:05<00:07, 19.67it/s, acc=88.671875%]
                                                     Epochs:  40%|████      | 100/250 [00:05<00:07, 19.67it/s, loss=0.478]    
    Sample:   0%|          | 0/8 [00:00<?, ?it/s]    Epochs:  40%|████      | 100/250 [00:05<00:07, 19.67it/s, acc=88.671875%]    Epochs:  40%|████      | 100/250 [00:05<00:07, 19.67it/s, acc=88.671875%]    Epochs:  40%|████      | 100/250 [00:05<00:07, 19.67it/s, acc=88.671875%]    Epochs:  40%|████      | 100/250 [00:05<00:07, 19.67it/s, acc=88.671875%]    Epochs:  40%|████      | 100/250 [00:05<00:07, 19.67it/s, acc=88.671875%]    Epochs:  40%|████      | 100/250 [00:05<00:07, 19.67it/s, acc=88.671875%]    Epochs:  40%|████      | 100/250 [00:05<00:07, 19.67it/s, acc=88.671875%]    Epochs:  40%|████      | 100/250 [00:05<00:07, 19.67it/s, acc=88.671875%]
                                                     Epochs:  40%|████      | 100/250 [00:05<00:07, 19.67it/s, loss=0.476]        Epochs:  41%|████      | 102/250 [00:05<00:07, 19.66it/s, loss=0.476]
    Sample:   0%|          | 0/8 [00:00<?, ?it/s]    Epochs:  41%|████      | 102/250 [00:05<00:07, 19.66it/s, acc=88.671875%]    Epochs:  41%|████      | 102/250 [00:05<00:07, 19.66it/s, acc=88.671875%]    Epochs:  41%|████      | 102/250 [00:05<00:07, 19.66it/s, acc=88.671875%]    Epochs:  41%|████      | 102/250 [00:05<00:07, 19.66it/s, acc=88.671875%]    Epochs:  41%|████      | 102/250 [00:05<00:07, 19.66it/s, acc=88.671875%]    Epochs:  41%|████      | 102/250 [00:05<00:07, 19.66it/s, acc=88.8671875%]    Epochs:  41%|████      | 102/250 [00:05<00:07, 19.66it/s, acc=88.8671875%]    Epochs:  41%|████      | 102/250 [00:05<00:07, 19.66it/s, acc=88.8671875%]
                                                     Epochs:  41%|████      | 102/250 [00:05<00:07, 19.66it/s, loss=0.474]     
    Sample:   0%|          | 0/8 [00:00<?, ?it/s]    Epochs:  41%|████      | 102/250 [00:05<00:07, 19.66it/s, acc=88.8671875%]    Epochs:  41%|████      | 102/250 [00:05<00:07, 19.66it/s, acc=88.671875%]     Epochs:  41%|████      | 102/250 [00:05<00:07, 19.66it/s, acc=88.671875%]    Epochs:  41%|████      | 102/250 [00:05<00:07, 19.66it/s, acc=88.671875%]    Epochs:  41%|████      | 102/250 [00:05<00:07, 19.66it/s, acc=88.671875%]    Epochs:  41%|████      | 102/250 [00:05<00:07, 19.66it/s, acc=88.671875%]    Epochs:  41%|████      | 102/250 [00:05<00:07, 19.66it/s, acc=88.671875%]    Epochs:  41%|████      | 102/250 [00:05<00:07, 19.66it/s, acc=88.671875%]
                                                     Epochs:  41%|████      | 102/250 [00:05<00:07, 19.66it/s, loss=0.471]        Epochs:  42%|████▏     | 104/250 [00:05<00:07, 19.69it/s, loss=0.471]
    Sample:   0%|          | 0/8 [00:00<?, ?it/s]    Epochs:  42%|████▏     | 104/250 [00:05<00:07, 19.69it/s, acc=88.671875%]    Epochs:  42%|████▏     | 104/250 [00:05<00:07, 19.69it/s, acc=88.671875%]    Epochs:  42%|████▏     | 104/250 [00:05<00:07, 19.69it/s, acc=88.671875%]    Epochs:  42%|████▏     | 104/250 [00:05<00:07, 19.69it/s, acc=88.671875%]    Epochs:  42%|████▏     | 104/250 [00:05<00:07, 19.69it/s, acc=88.671875%]    Epochs:  42%|████▏     | 104/250 [00:05<00:07, 19.69it/s, acc=88.8671875%]    Epochs:  42%|████▏     | 104/250 [00:05<00:07, 19.69it/s, acc=88.8671875%]    Epochs:  42%|████▏     | 104/250 [00:05<00:07, 19.69it/s, acc=88.671875%] 
                                                     Epochs:  42%|████▏     | 104/250 [00:05<00:07, 19.69it/s, loss=0.469]    
    Sample:   0%|          | 0/8 [00:00<?, ?it/s]    Epochs:  42%|████▏     | 104/250 [00:05<00:07, 19.69it/s, acc=88.671875%]    Epochs:  42%|████▏     | 104/250 [00:05<00:07, 19.69it/s, acc=88.671875%]    Epochs:  42%|████▏     | 104/250 [00:05<00:07, 19.69it/s, acc=88.671875%]    Epochs:  42%|████▏     | 104/250 [00:05<00:07, 19.69it/s, acc=88.671875%]    Epochs:  42%|████▏     | 104/250 [00:05<00:07, 19.69it/s, acc=88.671875%]    Epochs:  42%|████▏     | 104/250 [00:05<00:07, 19.69it/s, acc=88.671875%]    Epochs:  42%|████▏     | 104/250 [00:05<00:07, 19.69it/s, acc=88.671875%]    Epochs:  42%|████▏     | 104/250 [00:05<00:07, 19.69it/s, acc=88.671875%]
                                                     Epochs:  42%|████▏     | 104/250 [00:05<00:07, 19.69it/s, loss=0.467]        Epochs:  42%|████▏     | 106/250 [00:05<00:07, 19.70it/s, loss=0.467]
    Sample:   0%|          | 0/8 [00:00<?, ?it/s]    Epochs:  42%|████▏     | 106/250 [00:05<00:07, 19.70it/s, acc=88.671875%]    Epochs:  42%|████▏     | 106/250 [00:05<00:07, 19.70it/s, acc=88.671875%]    Epochs:  42%|████▏     | 106/250 [00:05<00:07, 19.70it/s, acc=88.671875%]    Epochs:  42%|████▏     | 106/250 [00:05<00:07, 19.70it/s, acc=88.671875%]    Epochs:  42%|████▏     | 106/250 [00:05<00:07, 19.70it/s, acc=88.671875%]    Epochs:  42%|████▏     | 106/250 [00:05<00:07, 19.70it/s, acc=88.671875%]    Epochs:  42%|████▏     | 106/250 [00:05<00:07, 19.70it/s, acc=88.671875%]    Epochs:  42%|████▏     | 106/250 [00:05<00:07, 19.70it/s, acc=88.671875%]
                                                     Epochs:  42%|████▏     | 106/250 [00:05<00:07, 19.70it/s, loss=0.465]    
    Sample:   0%|          | 0/8 [00:00<?, ?it/s]    Epochs:  42%|████▏     | 106/250 [00:05<00:07, 19.70it/s, acc=88.671875%]    Epochs:  42%|████▏     | 106/250 [00:05<00:07, 19.70it/s, acc=88.671875%]    Epochs:  42%|████▏     | 106/250 [00:05<00:07, 19.70it/s, acc=88.671875%]    Epochs:  42%|████▏     | 106/250 [00:05<00:07, 19.70it/s, acc=88.671875%]    Epochs:  42%|████▏     | 106/250 [00:05<00:07, 19.70it/s, acc=88.671875%]    Epochs:  42%|████▏     | 106/250 [00:05<00:07, 19.70it/s, acc=88.671875%]    Epochs:  42%|████▏     | 106/250 [00:05<00:07, 19.70it/s, acc=88.671875%]    Epochs:  42%|████▏     | 106/250 [00:05<00:07, 19.70it/s, acc=88.671875%]
                                                     Epochs:  42%|████▏     | 106/250 [00:05<00:07, 19.70it/s, loss=0.463]        Epochs:  43%|████▎     | 108/250 [00:05<00:07, 19.52it/s, loss=0.463]
    Sample:   0%|          | 0/8 [00:00<?, ?it/s]    Epochs:  43%|████▎     | 108/250 [00:05<00:07, 19.52it/s, acc=88.671875%]    Epochs:  43%|████▎     | 108/250 [00:05<00:07, 19.52it/s, acc=88.671875%]    Epochs:  43%|████▎     | 108/250 [00:05<00:07, 19.52it/s, acc=88.671875%]    Epochs:  43%|████▎     | 108/250 [00:05<00:07, 19.52it/s, acc=88.671875%]    Epochs:  43%|████▎     | 108/250 [00:05<00:07, 19.52it/s, acc=88.671875%]    Epochs:  43%|████▎     | 108/250 [00:05<00:07, 19.52it/s, acc=88.671875%]    Epochs:  43%|████▎     | 108/250 [00:05<00:07, 19.52it/s, acc=88.671875%]    Epochs:  43%|████▎     | 108/250 [00:05<00:07, 19.52it/s, acc=88.4765625%]
                                                     Epochs:  43%|████▎     | 108/250 [00:05<00:07, 19.52it/s, loss=0.461]     
    Sample:   0%|          | 0/8 [00:00<?, ?it/s]    Epochs:  43%|████▎     | 108/250 [00:05<00:07, 19.52it/s, acc=88.4765625%]    Epochs:  43%|████▎     | 108/250 [00:05<00:07, 19.52it/s, acc=88.4765625%]    Epochs:  43%|████▎     | 108/250 [00:05<00:07, 19.52it/s, acc=88.4765625%]    Epochs:  43%|████▎     | 108/250 [00:05<00:07, 19.52it/s, acc=88.4765625%]    Epochs:  43%|████▎     | 108/250 [00:05<00:07, 19.52it/s, acc=88.4765625%]    Epochs:  43%|████▎     | 108/250 [00:05<00:07, 19.52it/s, acc=88.4765625%]    Epochs:  43%|████▎     | 108/250 [00:05<00:07, 19.52it/s, acc=88.4765625%]    Epochs:  43%|████▎     | 108/250 [00:05<00:07, 19.52it/s, acc=88.4765625%]
                                                     Epochs:  43%|████▎     | 108/250 [00:05<00:07, 19.52it/s, loss=0.459]         Epochs:  44%|████▍     | 110/250 [00:05<00:07, 19.44it/s, loss=0.459]
    Sample:   0%|          | 0/8 [00:00<?, ?it/s]    Epochs:  44%|████▍     | 110/250 [00:05<00:07, 19.44it/s, acc=88.4765625%]    Epochs:  44%|████▍     | 110/250 [00:05<00:07, 19.44it/s, acc=88.4765625%]    Epochs:  44%|████▍     | 110/250 [00:05<00:07, 19.44it/s, acc=88.4765625%]    Epochs:  44%|████▍     | 110/250 [00:05<00:07, 19.44it/s, acc=88.4765625%]    Epochs:  44%|████▍     | 110/250 [00:05<00:07, 19.44it/s, acc=88.4765625%]    Epochs:  44%|████▍     | 110/250 [00:05<00:07, 19.44it/s, acc=88.4765625%]    Epochs:  44%|████▍     | 110/250 [00:05<00:07, 19.44it/s, acc=88.4765625%]    Epochs:  44%|████▍     | 110/250 [00:05<00:07, 19.44it/s, acc=88.4765625%]
                                                     Epochs:  44%|████▍     | 110/250 [00:05<00:07, 19.44it/s, loss=0.457]     
    Sample:   0%|          | 0/8 [00:00<?, ?it/s]    Epochs:  44%|████▍     | 110/250 [00:05<00:07, 19.44it/s, acc=88.4765625%]    Epochs:  44%|████▍     | 110/250 [00:05<00:07, 19.44it/s, acc=88.4765625%]    Epochs:  44%|████▍     | 110/250 [00:05<00:07, 19.44it/s, acc=88.4765625%]    Epochs:  44%|████▍     | 110/250 [00:05<00:07, 19.44it/s, acc=88.4765625%]    Epochs:  44%|████▍     | 110/250 [00:05<00:07, 19.44it/s, acc=88.4765625%]    Epochs:  44%|████▍     | 110/250 [00:05<00:07, 19.44it/s, acc=88.4765625%]    Epochs:  44%|████▍     | 110/250 [00:05<00:07, 19.44it/s, acc=88.4765625%]    Epochs:  44%|████▍     | 110/250 [00:05<00:07, 19.44it/s, acc=88.4765625%]
                                                     Epochs:  44%|████▍     | 110/250 [00:05<00:07, 19.44it/s, loss=0.455]         Epochs:  45%|████▍     | 112/250 [00:05<00:07, 19.48it/s, loss=0.455]
    Sample:   0%|          | 0/8 [00:00<?, ?it/s]    Epochs:  45%|████▍     | 112/250 [00:05<00:07, 19.48it/s, acc=88.4765625%]    Epochs:  45%|████▍     | 112/250 [00:05<00:07, 19.48it/s, acc=88.4765625%]    Epochs:  45%|████▍     | 112/250 [00:05<00:07, 19.48it/s, acc=88.4765625%]    Epochs:  45%|████▍     | 112/250 [00:05<00:07, 19.48it/s, acc=88.4765625%]    Epochs:  45%|████▍     | 112/250 [00:05<00:07, 19.48it/s, acc=88.4765625%]    Epochs:  45%|████▍     | 112/250 [00:05<00:07, 19.48it/s, acc=88.4765625%]    Epochs:  45%|████▍     | 112/250 [00:05<00:07, 19.48it/s, acc=88.4765625%]    Epochs:  45%|████▍     | 112/250 [00:05<00:07, 19.48it/s, acc=88.4765625%]
                                                     Epochs:  45%|████▍     | 112/250 [00:05<00:07, 19.48it/s, loss=0.453]     
    Sample:   0%|          | 0/8 [00:00<?, ?it/s]    Epochs:  45%|████▍     | 112/250 [00:05<00:07, 19.48it/s, acc=88.4765625%]    Epochs:  45%|████▍     | 112/250 [00:05<00:07, 19.48it/s, acc=88.4765625%]    Epochs:  45%|████▍     | 112/250 [00:05<00:07, 19.48it/s, acc=88.4765625%]    Epochs:  45%|████▍     | 112/250 [00:05<00:07, 19.48it/s, acc=88.4765625%]    Epochs:  45%|████▍     | 112/250 [00:05<00:07, 19.48it/s, acc=88.4765625%]    Epochs:  45%|████▍     | 112/250 [00:05<00:07, 19.48it/s, acc=88.4765625%]    Epochs:  45%|████▍     | 112/250 [00:05<00:07, 19.48it/s, acc=88.4765625%]    Epochs:  45%|████▍     | 112/250 [00:05<00:07, 19.48it/s, acc=88.4765625%]
                                                     Epochs:  45%|████▍     | 112/250 [00:05<00:07, 19.48it/s, loss=0.451]         Epochs:  46%|████▌     | 114/250 [00:05<00:06, 19.54it/s, loss=0.451]
    Sample:   0%|          | 0/8 [00:00<?, ?it/s]    Epochs:  46%|████▌     | 114/250 [00:05<00:06, 19.54it/s, acc=88.28125%]    Epochs:  46%|████▌     | 114/250 [00:05<00:06, 19.54it/s, acc=88.28125%]    Epochs:  46%|████▌     | 114/250 [00:05<00:06, 19.54it/s, acc=88.28125%]    Epochs:  46%|████▌     | 114/250 [00:05<00:06, 19.54it/s, acc=88.28125%]    Epochs:  46%|████▌     | 114/250 [00:05<00:06, 19.54it/s, acc=88.28125%]    Epochs:  46%|████▌     | 114/250 [00:05<00:06, 19.54it/s, acc=88.28125%]    Epochs:  46%|████▌     | 114/250 [00:05<00:06, 19.54it/s, acc=88.28125%]    Epochs:  46%|████▌     | 114/250 [00:05<00:06, 19.54it/s, acc=88.4765625%]
                                                     Epochs:  46%|████▌     | 114/250 [00:05<00:06, 19.54it/s, loss=0.449]     
    Sample:   0%|          | 0/8 [00:00<?, ?it/s]    Epochs:  46%|████▌     | 114/250 [00:05<00:06, 19.54it/s, acc=88.4765625%]    Epochs:  46%|████▌     | 114/250 [00:05<00:06, 19.54it/s, acc=88.4765625%]    Epochs:  46%|████▌     | 114/250 [00:05<00:06, 19.54it/s, acc=88.4765625%]    Epochs:  46%|████▌     | 114/250 [00:05<00:06, 19.54it/s, acc=88.4765625%]    Epochs:  46%|████▌     | 114/250 [00:05<00:06, 19.54it/s, acc=88.4765625%]    Epochs:  46%|████▌     | 114/250 [00:05<00:06, 19.54it/s, acc=88.4765625%]    Epochs:  46%|████▌     | 114/250 [00:05<00:06, 19.54it/s, acc=88.4765625%]    Epochs:  46%|████▌     | 114/250 [00:05<00:06, 19.54it/s, acc=88.4765625%]
                                                     Epochs:  46%|████▌     | 114/250 [00:05<00:06, 19.54it/s, loss=0.447]         Epochs:  46%|████▋     | 116/250 [00:05<00:06, 19.57it/s, loss=0.447]
    Sample:   0%|          | 0/8 [00:00<?, ?it/s]    Epochs:  46%|████▋     | 116/250 [00:05<00:06, 19.57it/s, acc=88.4765625%]    Epochs:  46%|████▋     | 116/250 [00:05<00:06, 19.57it/s, acc=88.4765625%]    Epochs:  46%|████▋     | 116/250 [00:05<00:06, 19.57it/s, acc=88.4765625%]    Epochs:  46%|████▋     | 116/250 [00:05<00:06, 19.57it/s, acc=88.4765625%]    Epochs:  46%|████▋     | 116/250 [00:05<00:06, 19.57it/s, acc=88.4765625%]    Epochs:  46%|████▋     | 116/250 [00:05<00:06, 19.57it/s, acc=88.4765625%]    Epochs:  46%|████▋     | 116/250 [00:05<00:06, 19.57it/s, acc=88.4765625%]    Epochs:  46%|████▋     | 116/250 [00:05<00:06, 19.57it/s, acc=88.4765625%]
                                                     Epochs:  46%|████▋     | 116/250 [00:05<00:06, 19.57it/s, loss=0.445]     
    Sample:   0%|          | 0/8 [00:00<?, ?it/s]    Epochs:  46%|████▋     | 116/250 [00:05<00:06, 19.57it/s, acc=88.4765625%]    Epochs:  46%|████▋     | 116/250 [00:05<00:06, 19.57it/s, acc=88.4765625%]    Epochs:  46%|████▋     | 116/250 [00:05<00:06, 19.57it/s, acc=88.4765625%]    Epochs:  46%|████▋     | 116/250 [00:05<00:06, 19.57it/s, acc=88.4765625%]    Epochs:  46%|████▋     | 116/250 [00:05<00:06, 19.57it/s, acc=88.4765625%]    Epochs:  46%|████▋     | 116/250 [00:06<00:06, 19.57it/s, acc=88.4765625%]    Epochs:  46%|████▋     | 116/250 [00:06<00:06, 19.57it/s, acc=88.4765625%]    Epochs:  46%|████▋     | 116/250 [00:06<00:06, 19.57it/s, acc=88.4765625%]
                                                     Epochs:  46%|████▋     | 116/250 [00:06<00:06, 19.57it/s, loss=0.444]         Epochs:  47%|████▋     | 118/250 [00:06<00:06, 19.52it/s, loss=0.444]
    Sample:   0%|          | 0/8 [00:00<?, ?it/s]    Epochs:  47%|████▋     | 118/250 [00:06<00:06, 19.52it/s, acc=88.4765625%]    Epochs:  47%|████▋     | 118/250 [00:06<00:06, 19.52it/s, acc=88.4765625%]    Epochs:  47%|████▋     | 118/250 [00:06<00:06, 19.52it/s, acc=88.4765625%]    Epochs:  47%|████▋     | 118/250 [00:06<00:06, 19.52it/s, acc=88.4765625%]    Epochs:  47%|████▋     | 118/250 [00:06<00:06, 19.52it/s, acc=88.671875%]     Epochs:  47%|████▋     | 118/250 [00:06<00:06, 19.52it/s, acc=88.671875%]    Epochs:  47%|████▋     | 118/250 [00:06<00:06, 19.52it/s, acc=88.671875%]    Epochs:  47%|████▋     | 118/250 [00:06<00:06, 19.52it/s, acc=88.671875%]
                                                     Epochs:  47%|████▋     | 118/250 [00:06<00:06, 19.52it/s, loss=0.442]    
    Sample:   0%|          | 0/8 [00:00<?, ?it/s]    Epochs:  47%|████▋     | 118/250 [00:06<00:06, 19.52it/s, acc=88.671875%]    Epochs:  47%|████▋     | 118/250 [00:06<00:06, 19.52it/s, acc=88.671875%]    Epochs:  47%|████▋     | 118/250 [00:06<00:06, 19.52it/s, acc=88.671875%]    Epochs:  47%|████▋     | 118/250 [00:06<00:06, 19.52it/s, acc=88.671875%]    Epochs:  47%|████▋     | 118/250 [00:06<00:06, 19.52it/s, acc=88.671875%]    Epochs:  47%|████▋     | 118/250 [00:06<00:06, 19.52it/s, acc=88.671875%]    Epochs:  47%|████▋     | 118/250 [00:06<00:06, 19.52it/s, acc=88.671875%]    Epochs:  47%|████▋     | 118/250 [00:06<00:06, 19.52it/s, acc=88.671875%]
                                                     Epochs:  47%|████▋     | 118/250 [00:06<00:06, 19.52it/s, loss=0.44]         Epochs:  48%|████▊     | 120/250 [00:06<00:06, 19.55it/s, loss=0.44]
    Sample:   0%|          | 0/8 [00:00<?, ?it/s]    Epochs:  48%|████▊     | 120/250 [00:06<00:06, 19.55it/s, acc=88.4765625%]    Epochs:  48%|████▊     | 120/250 [00:06<00:06, 19.55it/s, acc=88.671875%]     Epochs:  48%|████▊     | 120/250 [00:06<00:06, 19.55it/s, acc=88.671875%]    Epochs:  48%|████▊     | 120/250 [00:06<00:06, 19.55it/s, acc=88.671875%]    Epochs:  48%|████▊     | 120/250 [00:06<00:06, 19.55it/s, acc=88.4765625%]    Epochs:  48%|████▊     | 120/250 [00:06<00:06, 19.55it/s, acc=88.4765625%]    Epochs:  48%|████▊     | 120/250 [00:06<00:06, 19.55it/s, acc=88.4765625%]    Epochs:  48%|████▊     | 120/250 [00:06<00:06, 19.55it/s, acc=88.4765625%]
                                                     Epochs:  48%|████▊     | 120/250 [00:06<00:06, 19.55it/s, loss=0.438]     
    Sample:   0%|          | 0/8 [00:00<?, ?it/s]    Epochs:  48%|████▊     | 120/250 [00:06<00:06, 19.55it/s, acc=88.4765625%]    Epochs:  48%|████▊     | 120/250 [00:06<00:06, 19.55it/s, acc=88.4765625%]    Epochs:  48%|████▊     | 120/250 [00:06<00:06, 19.55it/s, acc=88.4765625%]    Epochs:  48%|████▊     | 120/250 [00:06<00:06, 19.55it/s, acc=88.4765625%]    Epochs:  48%|████▊     | 120/250 [00:06<00:06, 19.55it/s, acc=88.4765625%]    Epochs:  48%|████▊     | 120/250 [00:06<00:06, 19.55it/s, acc=88.4765625%]    Epochs:  48%|████▊     | 120/250 [00:06<00:06, 19.55it/s, acc=88.4765625%]    Epochs:  48%|████▊     | 120/250 [00:06<00:06, 19.55it/s, acc=88.4765625%]
                                                     Epochs:  48%|████▊     | 120/250 [00:06<00:06, 19.55it/s, loss=0.436]         Epochs:  49%|████▉     | 122/250 [00:06<00:06, 19.60it/s, loss=0.436]
    Sample:   0%|          | 0/8 [00:00<?, ?it/s]    Epochs:  49%|████▉     | 122/250 [00:06<00:06, 19.60it/s, acc=88.4765625%]    Epochs:  49%|████▉     | 122/250 [00:06<00:06, 19.60it/s, acc=88.4765625%]    Epochs:  49%|████▉     | 122/250 [00:06<00:06, 19.60it/s, acc=88.4765625%]    Epochs:  49%|████▉     | 122/250 [00:06<00:06, 19.60it/s, acc=88.4765625%]    Epochs:  49%|████▉     | 122/250 [00:06<00:06, 19.60it/s, acc=88.4765625%]    Epochs:  49%|████▉     | 122/250 [00:06<00:06, 19.60it/s, acc=88.4765625%]    Epochs:  49%|████▉     | 122/250 [00:06<00:06, 19.60it/s, acc=88.4765625%]    Epochs:  49%|████▉     | 122/250 [00:06<00:06, 19.60it/s, acc=88.4765625%]
                                                     Epochs:  49%|████▉     | 122/250 [00:06<00:06, 19.60it/s, loss=0.435]     
    Sample:   0%|          | 0/8 [00:00<?, ?it/s]    Epochs:  49%|████▉     | 122/250 [00:06<00:06, 19.60it/s, acc=88.4765625%]    Epochs:  49%|████▉     | 122/250 [00:06<00:06, 19.60it/s, acc=88.4765625%]    Epochs:  49%|████▉     | 122/250 [00:06<00:06, 19.60it/s, acc=88.4765625%]    Epochs:  49%|████▉     | 122/250 [00:06<00:06, 19.60it/s, acc=88.4765625%]    Epochs:  49%|████▉     | 122/250 [00:06<00:06, 19.60it/s, acc=88.4765625%]    Epochs:  49%|████▉     | 122/250 [00:06<00:06, 19.60it/s, acc=88.4765625%]    Epochs:  49%|████▉     | 122/250 [00:06<00:06, 19.60it/s, acc=88.4765625%]    Epochs:  49%|████▉     | 122/250 [00:06<00:06, 19.60it/s, acc=88.4765625%]
                                                     Epochs:  49%|████▉     | 122/250 [00:06<00:06, 19.60it/s, loss=0.433]         Epochs:  50%|████▉     | 124/250 [00:06<00:06, 19.61it/s, loss=0.433]
    Sample:   0%|          | 0/8 [00:00<?, ?it/s]    Epochs:  50%|████▉     | 124/250 [00:06<00:06, 19.61it/s, acc=88.4765625%]    Epochs:  50%|████▉     | 124/250 [00:06<00:06, 19.61it/s, acc=88.4765625%]    Epochs:  50%|████▉     | 124/250 [00:06<00:06, 19.61it/s, acc=88.4765625%]    Epochs:  50%|████▉     | 124/250 [00:06<00:06, 19.61it/s, acc=88.4765625%]    Epochs:  50%|████▉     | 124/250 [00:06<00:06, 19.61it/s, acc=88.4765625%]    Epochs:  50%|████▉     | 124/250 [00:06<00:06, 19.61it/s, acc=88.4765625%]    Epochs:  50%|████▉     | 124/250 [00:06<00:06, 19.61it/s, acc=88.4765625%]    Epochs:  50%|████▉     | 124/250 [00:06<00:06, 19.61it/s, acc=88.4765625%]
                                                     Epochs:  50%|████▉     | 124/250 [00:06<00:06, 19.61it/s, loss=0.431]     
    Sample:   0%|          | 0/8 [00:00<?, ?it/s]    Epochs:  50%|████▉     | 124/250 [00:06<00:06, 19.61it/s, acc=88.4765625%]    Epochs:  50%|████▉     | 124/250 [00:06<00:06, 19.61it/s, acc=88.4765625%]    Epochs:  50%|████▉     | 124/250 [00:06<00:06, 19.61it/s, acc=88.4765625%]    Epochs:  50%|████▉     | 124/250 [00:06<00:06, 19.61it/s, acc=88.4765625%]    Epochs:  50%|████▉     | 124/250 [00:06<00:06, 19.61it/s, acc=88.4765625%]    Epochs:  50%|████▉     | 124/250 [00:06<00:06, 19.61it/s, acc=88.4765625%]    Epochs:  50%|████▉     | 124/250 [00:06<00:06, 19.61it/s, acc=88.4765625%]    Epochs:  50%|████▉     | 124/250 [00:06<00:06, 19.61it/s, acc=88.4765625%]
                                                     Epochs:  50%|████▉     | 124/250 [00:06<00:06, 19.61it/s, loss=0.43]          Epochs:  50%|█████     | 126/250 [00:06<00:06, 19.51it/s, loss=0.43]
    Sample:   0%|          | 0/8 [00:00<?, ?it/s]    Epochs:  50%|█████     | 126/250 [00:06<00:06, 19.51it/s, acc=88.4765625%]    Epochs:  50%|█████     | 126/250 [00:06<00:06, 19.51it/s, acc=88.4765625%]    Epochs:  50%|█████     | 126/250 [00:06<00:06, 19.51it/s, acc=88.4765625%]    Epochs:  50%|█████     | 126/250 [00:06<00:06, 19.51it/s, acc=88.4765625%]    Epochs:  50%|█████     | 126/250 [00:06<00:06, 19.51it/s, acc=88.4765625%]    Epochs:  50%|█████     | 126/250 [00:06<00:06, 19.51it/s, acc=88.4765625%]    Epochs:  50%|█████     | 126/250 [00:06<00:06, 19.51it/s, acc=88.4765625%]    Epochs:  50%|█████     | 126/250 [00:06<00:06, 19.51it/s, acc=88.4765625%]
                                                     Epochs:  50%|█████     | 126/250 [00:06<00:06, 19.51it/s, loss=0.428]     
    Sample:   0%|          | 0/8 [00:00<?, ?it/s]    Epochs:  50%|█████     | 126/250 [00:06<00:06, 19.51it/s, acc=88.4765625%]    Epochs:  50%|█████     | 126/250 [00:06<00:06, 19.51it/s, acc=88.4765625%]    Epochs:  50%|█████     | 126/250 [00:06<00:06, 19.51it/s, acc=88.4765625%]    Epochs:  50%|█████     | 126/250 [00:06<00:06, 19.51it/s, acc=88.4765625%]    Epochs:  50%|█████     | 126/250 [00:06<00:06, 19.51it/s, acc=88.4765625%]    Epochs:  50%|█████     | 126/250 [00:06<00:06, 19.51it/s, acc=88.4765625%]    Epochs:  50%|█████     | 126/250 [00:06<00:06, 19.51it/s, acc=88.4765625%]    Epochs:  50%|█████     | 126/250 [00:06<00:06, 19.51it/s, acc=88.4765625%]
                                                     Epochs:  50%|█████     | 126/250 [00:06<00:06, 19.51it/s, loss=0.426]         Epochs:  51%|█████     | 128/250 [00:06<00:06, 19.36it/s, loss=0.426]
    Sample:   0%|          | 0/8 [00:00<?, ?it/s]    Epochs:  51%|█████     | 128/250 [00:06<00:06, 19.36it/s, acc=88.4765625%]    Epochs:  51%|█████     | 128/250 [00:06<00:06, 19.36it/s, acc=88.4765625%]    Epochs:  51%|█████     | 128/250 [00:06<00:06, 19.36it/s, acc=88.4765625%]    Epochs:  51%|█████     | 128/250 [00:06<00:06, 19.36it/s, acc=88.4765625%]    Epochs:  51%|█████     | 128/250 [00:06<00:06, 19.36it/s, acc=88.4765625%]    Epochs:  51%|█████     | 128/250 [00:06<00:06, 19.36it/s, acc=88.4765625%]    Epochs:  51%|█████     | 128/250 [00:06<00:06, 19.36it/s, acc=88.4765625%]    Epochs:  51%|█████     | 128/250 [00:06<00:06, 19.36it/s, acc=88.4765625%]
                                                     Epochs:  51%|█████     | 128/250 [00:06<00:06, 19.36it/s, loss=0.425]     
    Sample:   0%|          | 0/8 [00:00<?, ?it/s]    Epochs:  51%|█████     | 128/250 [00:06<00:06, 19.36it/s, acc=88.671875%]    Epochs:  51%|█████     | 128/250 [00:06<00:06, 19.36it/s, acc=88.671875%]    Epochs:  51%|█████     | 128/250 [00:06<00:06, 19.36it/s, acc=88.671875%]    Epochs:  51%|█████     | 128/250 [00:06<00:06, 19.36it/s, acc=88.671875%]    Epochs:  51%|█████     | 128/250 [00:06<00:06, 19.36it/s, acc=88.671875%]    Epochs:  51%|█████     | 128/250 [00:06<00:06, 19.36it/s, acc=88.671875%]    Epochs:  51%|█████     | 128/250 [00:06<00:06, 19.36it/s, acc=88.671875%]    Epochs:  51%|█████     | 128/250 [00:06<00:06, 19.36it/s, acc=88.671875%]
                                                     Epochs:  51%|█████     | 128/250 [00:06<00:06, 19.36it/s, loss=0.423]        Epochs:  52%|█████▏    | 130/250 [00:06<00:06, 19.45it/s, loss=0.423]
    Sample:   0%|          | 0/8 [00:00<?, ?it/s]    Epochs:  52%|█████▏    | 130/250 [00:06<00:06, 19.45it/s, acc=88.671875%]    Epochs:  52%|█████▏    | 130/250 [00:06<00:06, 19.45it/s, acc=88.671875%]    Epochs:  52%|█████▏    | 130/250 [00:06<00:06, 19.45it/s, acc=88.671875%]    Epochs:  52%|█████▏    | 130/250 [00:06<00:06, 19.45it/s, acc=88.671875%]    Epochs:  52%|█████▏    | 130/250 [00:06<00:06, 19.45it/s, acc=88.671875%]    Epochs:  52%|█████▏    | 130/250 [00:06<00:06, 19.45it/s, acc=88.671875%]    Epochs:  52%|█████▏    | 130/250 [00:06<00:06, 19.45it/s, acc=88.671875%]    Epochs:  52%|█████▏    | 130/250 [00:06<00:06, 19.45it/s, acc=88.671875%]
                                                     Epochs:  52%|█████▏    | 130/250 [00:06<00:06, 19.45it/s, loss=0.421]    
    Sample:   0%|          | 0/8 [00:00<?, ?it/s]    Epochs:  52%|█████▏    | 130/250 [00:06<00:06, 19.45it/s, acc=88.671875%]    Epochs:  52%|█████▏    | 130/250 [00:06<00:06, 19.45it/s, acc=88.671875%]    Epochs:  52%|█████▏    | 130/250 [00:06<00:06, 19.45it/s, acc=88.671875%]    Epochs:  52%|█████▏    | 130/250 [00:06<00:06, 19.45it/s, acc=88.671875%]    Epochs:  52%|█████▏    | 130/250 [00:06<00:06, 19.45it/s, acc=88.8671875%]    Epochs:  52%|█████▏    | 130/250 [00:06<00:06, 19.45it/s, acc=88.8671875%]    Epochs:  52%|█████▏    | 130/250 [00:06<00:06, 19.45it/s, acc=88.8671875%]    Epochs:  52%|█████▏    | 130/250 [00:06<00:06, 19.45it/s, acc=88.8671875%]
                                                     Epochs:  52%|█████▏    | 130/250 [00:06<00:06, 19.45it/s, loss=0.42]          Epochs:  53%|█████▎    | 132/250 [00:06<00:06, 19.53it/s, loss=0.42]
    Sample:   0%|          | 0/8 [00:00<?, ?it/s]    Epochs:  53%|█████▎    | 132/250 [00:06<00:06, 19.53it/s, acc=88.8671875%]    Epochs:  53%|█████▎    | 132/250 [00:06<00:06, 19.53it/s, acc=88.8671875%]    Epochs:  53%|█████▎    | 132/250 [00:06<00:06, 19.53it/s, acc=88.8671875%]    Epochs:  53%|█████▎    | 132/250 [00:06<00:06, 19.53it/s, acc=88.8671875%]    Epochs:  53%|█████▎    | 132/250 [00:06<00:06, 19.53it/s, acc=88.8671875%]    Epochs:  53%|█████▎    | 132/250 [00:06<00:06, 19.53it/s, acc=88.8671875%]    Epochs:  53%|█████▎    | 132/250 [00:06<00:06, 19.53it/s, acc=88.8671875%]    Epochs:  53%|█████▎    | 132/250 [00:06<00:06, 19.53it/s, acc=88.8671875%]
                                                     Epochs:  53%|█████▎    | 132/250 [00:06<00:06, 19.53it/s, loss=0.418]     
    Sample:   0%|          | 0/8 [00:00<?, ?it/s]    Epochs:  53%|█████▎    | 132/250 [00:06<00:06, 19.53it/s, acc=88.8671875%]    Epochs:  53%|█████▎    | 132/250 [00:06<00:06, 19.53it/s, acc=88.8671875%]    Epochs:  53%|█████▎    | 132/250 [00:06<00:06, 19.53it/s, acc=88.8671875%]    Epochs:  53%|█████▎    | 132/250 [00:06<00:06, 19.53it/s, acc=88.8671875%]    Epochs:  53%|█████▎    | 132/250 [00:06<00:06, 19.53it/s, acc=88.8671875%]    Epochs:  53%|█████▎    | 132/250 [00:06<00:06, 19.53it/s, acc=88.8671875%]    Epochs:  53%|█████▎    | 132/250 [00:06<00:06, 19.53it/s, acc=88.8671875%]    Epochs:  53%|█████▎    | 132/250 [00:06<00:06, 19.53it/s, acc=88.8671875%]
                                                     Epochs:  53%|█████▎    | 132/250 [00:06<00:06, 19.53it/s, loss=0.417]         Epochs:  54%|█████▎    | 134/250 [00:06<00:05, 19.54it/s, loss=0.417]
    Sample:   0%|          | 0/8 [00:00<?, ?it/s]    Epochs:  54%|█████▎    | 134/250 [00:06<00:05, 19.54it/s, acc=88.8671875%]    Epochs:  54%|█████▎    | 134/250 [00:06<00:05, 19.54it/s, acc=88.8671875%]    Epochs:  54%|█████▎    | 134/250 [00:06<00:05, 19.54it/s, acc=88.8671875%]    Epochs:  54%|█████▎    | 134/250 [00:06<00:05, 19.54it/s, acc=88.8671875%]    Epochs:  54%|█████▎    | 134/250 [00:06<00:05, 19.54it/s, acc=88.671875%]     Epochs:  54%|█████▎    | 134/250 [00:06<00:05, 19.54it/s, acc=88.671875%]    Epochs:  54%|█████▎    | 134/250 [00:06<00:05, 19.54it/s, acc=88.671875%]    Epochs:  54%|█████▎    | 134/250 [00:06<00:05, 19.54it/s, acc=88.671875%]
                                                     Epochs:  54%|█████▎    | 134/250 [00:06<00:05, 19.54it/s, loss=0.415]    
    Sample:   0%|          | 0/8 [00:00<?, ?it/s]    Epochs:  54%|█████▎    | 134/250 [00:06<00:05, 19.54it/s, acc=88.671875%]    Epochs:  54%|█████▎    | 134/250 [00:06<00:05, 19.54it/s, acc=88.671875%]    Epochs:  54%|█████▎    | 134/250 [00:06<00:05, 19.54it/s, acc=88.671875%]    Epochs:  54%|█████▎    | 134/250 [00:06<00:05, 19.54it/s, acc=88.671875%]    Epochs:  54%|█████▎    | 134/250 [00:06<00:05, 19.54it/s, acc=88.671875%]    Epochs:  54%|█████▎    | 134/250 [00:06<00:05, 19.54it/s, acc=88.671875%]    Epochs:  54%|█████▎    | 134/250 [00:06<00:05, 19.54it/s, acc=88.671875%]    Epochs:  54%|█████▎    | 134/250 [00:06<00:05, 19.54it/s, acc=88.671875%]
                                                     Epochs:  54%|█████▎    | 134/250 [00:06<00:05, 19.54it/s, loss=0.414]        Epochs:  54%|█████▍    | 136/250 [00:06<00:05, 19.56it/s, loss=0.414]
    Sample:   0%|          | 0/8 [00:00<?, ?it/s]    Epochs:  54%|█████▍    | 136/250 [00:06<00:05, 19.56it/s, acc=88.671875%]    Epochs:  54%|█████▍    | 136/250 [00:06<00:05, 19.56it/s, acc=88.671875%]    Epochs:  54%|█████▍    | 136/250 [00:06<00:05, 19.56it/s, acc=88.671875%]    Epochs:  54%|█████▍    | 136/250 [00:06<00:05, 19.56it/s, acc=88.671875%]    Epochs:  54%|█████▍    | 136/250 [00:06<00:05, 19.56it/s, acc=88.671875%]    Epochs:  54%|█████▍    | 136/250 [00:06<00:05, 19.56it/s, acc=88.671875%]    Epochs:  54%|█████▍    | 136/250 [00:06<00:05, 19.56it/s, acc=88.671875%]    Epochs:  54%|█████▍    | 136/250 [00:06<00:05, 19.56it/s, acc=88.671875%]
                                                     Epochs:  54%|█████▍    | 136/250 [00:06<00:05, 19.56it/s, loss=0.412]    
    Sample:   0%|          | 0/8 [00:00<?, ?it/s]    Epochs:  54%|█████▍    | 136/250 [00:06<00:05, 19.56it/s, acc=88.671875%]    Epochs:  54%|█████▍    | 136/250 [00:06<00:05, 19.56it/s, acc=88.671875%]    Epochs:  54%|█████▍    | 136/250 [00:07<00:05, 19.56it/s, acc=88.671875%]    Epochs:  54%|█████▍    | 136/250 [00:07<00:05, 19.56it/s, acc=88.671875%]    Epochs:  54%|█████▍    | 136/250 [00:07<00:05, 19.56it/s, acc=88.671875%]    Epochs:  54%|█████▍    | 136/250 [00:07<00:05, 19.56it/s, acc=88.4765625%]    Epochs:  54%|█████▍    | 136/250 [00:07<00:05, 19.56it/s, acc=88.671875%]     Epochs:  54%|█████▍    | 136/250 [00:07<00:05, 19.56it/s, acc=88.671875%]
                                                     Epochs:  54%|█████▍    | 136/250 [00:07<00:05, 19.56it/s, loss=0.411]        Epochs:  55%|█████▌    | 138/250 [00:07<00:05, 19.61it/s, loss=0.411]
    Sample:   0%|          | 0/8 [00:00<?, ?it/s]    Epochs:  55%|█████▌    | 138/250 [00:07<00:05, 19.61it/s, acc=88.4765625%]    Epochs:  55%|█████▌    | 138/250 [00:07<00:05, 19.61it/s, acc=88.4765625%]    Epochs:  55%|█████▌    | 138/250 [00:07<00:05, 19.61it/s, acc=88.4765625%]    Epochs:  55%|█████▌    | 138/250 [00:07<00:05, 19.61it/s, acc=88.4765625%]    Epochs:  55%|█████▌    | 138/250 [00:07<00:05, 19.61it/s, acc=88.4765625%]    Epochs:  55%|█████▌    | 138/250 [00:07<00:05, 19.61it/s, acc=88.4765625%]    Epochs:  55%|█████▌    | 138/250 [00:07<00:05, 19.61it/s, acc=88.4765625%]    Epochs:  55%|█████▌    | 138/250 [00:07<00:05, 19.61it/s, acc=88.4765625%]
                                                     Epochs:  55%|█████▌    | 138/250 [00:07<00:05, 19.61it/s, loss=0.409]     
    Sample:   0%|          | 0/8 [00:00<?, ?it/s]    Epochs:  55%|█████▌    | 138/250 [00:07<00:05, 19.61it/s, acc=88.4765625%]    Epochs:  55%|█████▌    | 138/250 [00:07<00:05, 19.61it/s, acc=88.4765625%]    Epochs:  55%|█████▌    | 138/250 [00:07<00:05, 19.61it/s, acc=88.4765625%]    Epochs:  55%|█████▌    | 138/250 [00:07<00:05, 19.61it/s, acc=88.4765625%]    Epochs:  55%|█████▌    | 138/250 [00:07<00:05, 19.61it/s, acc=88.4765625%]    Epochs:  55%|█████▌    | 138/250 [00:07<00:05, 19.61it/s, acc=88.4765625%]    Epochs:  55%|█████▌    | 138/250 [00:07<00:05, 19.61it/s, acc=88.4765625%]    Epochs:  55%|█████▌    | 138/250 [00:07<00:05, 19.61it/s, acc=88.4765625%]
                                                     Epochs:  55%|█████▌    | 138/250 [00:07<00:05, 19.61it/s, loss=0.408]         Epochs:  56%|█████▌    | 140/250 [00:07<00:05, 19.63it/s, loss=0.408]
    Sample:   0%|          | 0/8 [00:00<?, ?it/s]    Epochs:  56%|█████▌    | 140/250 [00:07<00:05, 19.63it/s, acc=88.4765625%]    Epochs:  56%|█████▌    | 140/250 [00:07<00:05, 19.63it/s, acc=88.4765625%]    Epochs:  56%|█████▌    | 140/250 [00:07<00:05, 19.63it/s, acc=88.4765625%]    Epochs:  56%|█████▌    | 140/250 [00:07<00:05, 19.63it/s, acc=88.4765625%]    Epochs:  56%|█████▌    | 140/250 [00:07<00:05, 19.63it/s, acc=88.4765625%]    Epochs:  56%|█████▌    | 140/250 [00:07<00:05, 19.63it/s, acc=88.4765625%]    Epochs:  56%|█████▌    | 140/250 [00:07<00:05, 19.63it/s, acc=88.4765625%]    Epochs:  56%|█████▌    | 140/250 [00:07<00:05, 19.63it/s, acc=88.4765625%]
                                                     Epochs:  56%|█████▌    | 140/250 [00:07<00:05, 19.63it/s, loss=0.406]     
    Sample:   0%|          | 0/8 [00:00<?, ?it/s]    Epochs:  56%|█████▌    | 140/250 [00:07<00:05, 19.63it/s, acc=88.4765625%]    Epochs:  56%|█████▌    | 140/250 [00:07<00:05, 19.63it/s, acc=88.4765625%]    Epochs:  56%|█████▌    | 140/250 [00:07<00:05, 19.63it/s, acc=88.28125%]      Epochs:  56%|█████▌    | 140/250 [00:07<00:05, 19.63it/s, acc=88.28125%]    Epochs:  56%|█████▌    | 140/250 [00:07<00:05, 19.63it/s, acc=88.28125%]    Epochs:  56%|█████▌    | 140/250 [00:07<00:05, 19.63it/s, acc=88.28125%]    Epochs:  56%|█████▌    | 140/250 [00:07<00:05, 19.63it/s, acc=88.28125%]    Epochs:  56%|█████▌    | 140/250 [00:07<00:05, 19.63it/s, acc=88.28125%]
                                                     Epochs:  56%|█████▌    | 140/250 [00:07<00:05, 19.63it/s, loss=0.405]       Epochs:  57%|█████▋    | 142/250 [00:07<00:05, 19.63it/s, loss=0.405]
    Sample:   0%|          | 0/8 [00:00<?, ?it/s]    Epochs:  57%|█████▋    | 142/250 [00:07<00:05, 19.63it/s, acc=88.28125%]    Epochs:  57%|█████▋    | 142/250 [00:07<00:05, 19.63it/s, acc=88.28125%]    Epochs:  57%|█████▋    | 142/250 [00:07<00:05, 19.63it/s, acc=88.28125%]    Epochs:  57%|█████▋    | 142/250 [00:07<00:05, 19.63it/s, acc=88.28125%]    Epochs:  57%|█████▋    | 142/250 [00:07<00:05, 19.63it/s, acc=88.28125%]    Epochs:  57%|█████▋    | 142/250 [00:07<00:05, 19.63it/s, acc=88.28125%]    Epochs:  57%|█████▋    | 142/250 [00:07<00:05, 19.63it/s, acc=88.28125%]    Epochs:  57%|█████▋    | 142/250 [00:07<00:05, 19.63it/s, acc=88.28125%]
                                                     Epochs:  57%|█████▋    | 142/250 [00:07<00:05, 19.63it/s, loss=0.404]   
    Sample:   0%|          | 0/8 [00:00<?, ?it/s]    Epochs:  57%|█████▋    | 142/250 [00:07<00:05, 19.63it/s, acc=88.28125%]    Epochs:  57%|█████▋    | 142/250 [00:07<00:05, 19.63it/s, acc=88.28125%]    Epochs:  57%|█████▋    | 142/250 [00:07<00:05, 19.63it/s, acc=88.28125%]    Epochs:  57%|█████▋    | 142/250 [00:07<00:05, 19.63it/s, acc=88.28125%]    Epochs:  57%|█████▋    | 142/250 [00:07<00:05, 19.63it/s, acc=88.28125%]    Epochs:  57%|█████▋    | 142/250 [00:07<00:05, 19.63it/s, acc=88.28125%]    Epochs:  57%|█████▋    | 142/250 [00:07<00:05, 19.63it/s, acc=88.28125%]    Epochs:  57%|█████▋    | 142/250 [00:07<00:05, 19.63it/s, acc=88.28125%]
                                                     Epochs:  57%|█████▋    | 142/250 [00:07<00:05, 19.63it/s, loss=0.402]       Epochs:  58%|█████▊    | 144/250 [00:07<00:05, 19.64it/s, loss=0.402]
    Sample:   0%|          | 0/8 [00:00<?, ?it/s]    Epochs:  58%|█████▊    | 144/250 [00:07<00:05, 19.64it/s, acc=88.28125%]    Epochs:  58%|█████▊    | 144/250 [00:07<00:05, 19.64it/s, acc=88.28125%]    Epochs:  58%|█████▊    | 144/250 [00:07<00:05, 19.64it/s, acc=88.28125%]    Epochs:  58%|█████▊    | 144/250 [00:07<00:05, 19.64it/s, acc=88.28125%]    Epochs:  58%|█████▊    | 144/250 [00:07<00:05, 19.64it/s, acc=88.28125%]    Epochs:  58%|█████▊    | 144/250 [00:07<00:05, 19.64it/s, acc=88.28125%]    Epochs:  58%|█████▊    | 144/250 [00:07<00:05, 19.64it/s, acc=88.28125%]    Epochs:  58%|█████▊    | 144/250 [00:07<00:05, 19.64it/s, acc=88.28125%]
                                                     Epochs:  58%|█████▊    | 144/250 [00:07<00:05, 19.64it/s, loss=0.401]   
    Sample:   0%|          | 0/8 [00:00<?, ?it/s]    Epochs:  58%|█████▊    | 144/250 [00:07<00:05, 19.64it/s, acc=88.28125%]    Epochs:  58%|█████▊    | 144/250 [00:07<00:05, 19.64it/s, acc=88.28125%]    Epochs:  58%|█████▊    | 144/250 [00:07<00:05, 19.64it/s, acc=88.28125%]    Epochs:  58%|█████▊    | 144/250 [00:07<00:05, 19.64it/s, acc=88.28125%]    Epochs:  58%|█████▊    | 144/250 [00:07<00:05, 19.64it/s, acc=88.28125%]    Epochs:  58%|█████▊    | 144/250 [00:07<00:05, 19.64it/s, acc=88.28125%]    Epochs:  58%|█████▊    | 144/250 [00:07<00:05, 19.64it/s, acc=88.28125%]    Epochs:  58%|█████▊    | 144/250 [00:07<00:05, 19.64it/s, acc=88.28125%]
                                                     Epochs:  58%|█████▊    | 144/250 [00:07<00:05, 19.64it/s, loss=0.4]         Epochs:  58%|█████▊    | 146/250 [00:07<00:05, 19.67it/s, loss=0.4]
    Sample:   0%|          | 0/8 [00:00<?, ?it/s]    Epochs:  58%|█████▊    | 146/250 [00:07<00:05, 19.67it/s, acc=88.28125%]    Epochs:  58%|█████▊    | 146/250 [00:07<00:05, 19.67it/s, acc=88.28125%]    Epochs:  58%|█████▊    | 146/250 [00:07<00:05, 19.67it/s, acc=88.28125%]    Epochs:  58%|█████▊    | 146/250 [00:07<00:05, 19.67it/s, acc=88.28125%]    Epochs:  58%|█████▊    | 146/250 [00:07<00:05, 19.67it/s, acc=88.28125%]    Epochs:  58%|█████▊    | 146/250 [00:07<00:05, 19.67it/s, acc=88.28125%]    Epochs:  58%|█████▊    | 146/250 [00:07<00:05, 19.67it/s, acc=88.28125%]    Epochs:  58%|█████▊    | 146/250 [00:07<00:05, 19.67it/s, acc=88.28125%]
                                                     Epochs:  58%|█████▊    | 146/250 [00:07<00:05, 19.67it/s, loss=0.398]   
    Sample:   0%|          | 0/8 [00:00<?, ?it/s]    Epochs:  58%|█████▊    | 146/250 [00:07<00:05, 19.67it/s, acc=88.28125%]    Epochs:  58%|█████▊    | 146/250 [00:07<00:05, 19.67it/s, acc=88.28125%]    Epochs:  58%|█████▊    | 146/250 [00:07<00:05, 19.67it/s, acc=88.28125%]    Epochs:  58%|█████▊    | 146/250 [00:07<00:05, 19.67it/s, acc=88.28125%]    Epochs:  58%|█████▊    | 146/250 [00:07<00:05, 19.67it/s, acc=88.28125%]    Epochs:  58%|█████▊    | 146/250 [00:07<00:05, 19.67it/s, acc=88.28125%]    Epochs:  58%|█████▊    | 146/250 [00:07<00:05, 19.67it/s, acc=88.28125%]    Epochs:  58%|█████▊    | 146/250 [00:07<00:05, 19.67it/s, acc=88.28125%]
                                                     Epochs:  58%|█████▊    | 146/250 [00:07<00:05, 19.67it/s, loss=0.397]       Epochs:  59%|█████▉    | 148/250 [00:07<00:05, 19.50it/s, loss=0.397]
    Sample:   0%|          | 0/8 [00:00<?, ?it/s]    Epochs:  59%|█████▉    | 148/250 [00:07<00:05, 19.50it/s, acc=88.28125%]    Epochs:  59%|█████▉    | 148/250 [00:07<00:05, 19.50it/s, acc=88.28125%]    Epochs:  59%|█████▉    | 148/250 [00:07<00:05, 19.50it/s, acc=88.28125%]    Epochs:  59%|█████▉    | 148/250 [00:07<00:05, 19.50it/s, acc=88.28125%]    Epochs:  59%|█████▉    | 148/250 [00:07<00:05, 19.50it/s, acc=88.28125%]    Epochs:  59%|█████▉    | 148/250 [00:07<00:05, 19.50it/s, acc=88.28125%]    Epochs:  59%|█████▉    | 148/250 [00:07<00:05, 19.50it/s, acc=88.28125%]    Epochs:  59%|█████▉    | 148/250 [00:07<00:05, 19.50it/s, acc=88.28125%]
                                                     Epochs:  59%|█████▉    | 148/250 [00:07<00:05, 19.50it/s, loss=0.396]   
    Sample:   0%|          | 0/8 [00:00<?, ?it/s]    Epochs:  59%|█████▉    | 148/250 [00:07<00:05, 19.50it/s, acc=88.28125%]    Epochs:  59%|█████▉    | 148/250 [00:07<00:05, 19.50it/s, acc=88.28125%]    Epochs:  59%|█████▉    | 148/250 [00:07<00:05, 19.50it/s, acc=88.28125%]    Epochs:  59%|█████▉    | 148/250 [00:07<00:05, 19.50it/s, acc=88.28125%]    Epochs:  59%|█████▉    | 148/250 [00:07<00:05, 19.50it/s, acc=88.28125%]    Epochs:  59%|█████▉    | 148/250 [00:07<00:05, 19.50it/s, acc=88.28125%]    Epochs:  59%|█████▉    | 148/250 [00:07<00:05, 19.50it/s, acc=88.28125%]    Epochs:  59%|█████▉    | 148/250 [00:07<00:05, 19.50it/s, acc=88.28125%]
                                                     Epochs:  59%|█████▉    | 148/250 [00:07<00:05, 19.50it/s, loss=0.394]       Epochs:  60%|██████    | 150/250 [00:07<00:05, 19.50it/s, loss=0.394]
    Sample:   0%|          | 0/8 [00:00<?, ?it/s]    Epochs:  60%|██████    | 150/250 [00:07<00:05, 19.50it/s, acc=88.28125%]    Epochs:  60%|██████    | 150/250 [00:07<00:05, 19.50it/s, acc=88.28125%]    Epochs:  60%|██████    | 150/250 [00:07<00:05, 19.50it/s, acc=88.28125%]    Epochs:  60%|██████    | 150/250 [00:07<00:05, 19.50it/s, acc=88.28125%]    Epochs:  60%|██████    | 150/250 [00:07<00:05, 19.50it/s, acc=88.28125%]    Epochs:  60%|██████    | 150/250 [00:07<00:05, 19.50it/s, acc=88.28125%]    Epochs:  60%|██████    | 150/250 [00:07<00:05, 19.50it/s, acc=88.28125%]    Epochs:  60%|██████    | 150/250 [00:07<00:05, 19.50it/s, acc=88.28125%]
                                                     Epochs:  60%|██████    | 150/250 [00:07<00:05, 19.50it/s, loss=0.393]   
    Sample:   0%|          | 0/8 [00:00<?, ?it/s]    Epochs:  60%|██████    | 150/250 [00:07<00:05, 19.50it/s, acc=88.28125%]    Epochs:  60%|██████    | 150/250 [00:07<00:05, 19.50it/s, acc=88.28125%]    Epochs:  60%|██████    | 150/250 [00:07<00:05, 19.50it/s, acc=88.28125%]    Epochs:  60%|██████    | 150/250 [00:07<00:05, 19.50it/s, acc=88.28125%]    Epochs:  60%|██████    | 150/250 [00:07<00:05, 19.50it/s, acc=88.28125%]    Epochs:  60%|██████    | 150/250 [00:07<00:05, 19.50it/s, acc=88.28125%]    Epochs:  60%|██████    | 150/250 [00:07<00:05, 19.50it/s, acc=88.28125%]    Epochs:  60%|██████    | 150/250 [00:07<00:05, 19.50it/s, acc=88.28125%]
                                                     Epochs:  60%|██████    | 150/250 [00:07<00:05, 19.50it/s, loss=0.392]       Epochs:  61%|██████    | 152/250 [00:07<00:05, 19.50it/s, loss=0.392]
    Sample:   0%|          | 0/8 [00:00<?, ?it/s]    Epochs:  61%|██████    | 152/250 [00:07<00:05, 19.50it/s, acc=88.28125%]    Epochs:  61%|██████    | 152/250 [00:07<00:05, 19.50it/s, acc=88.28125%]    Epochs:  61%|██████    | 152/250 [00:07<00:05, 19.50it/s, acc=88.28125%]    Epochs:  61%|██████    | 152/250 [00:07<00:05, 19.50it/s, acc=88.28125%]    Epochs:  61%|██████    | 152/250 [00:07<00:05, 19.50it/s, acc=88.28125%]    Epochs:  61%|██████    | 152/250 [00:07<00:05, 19.50it/s, acc=88.28125%]    Epochs:  61%|██████    | 152/250 [00:07<00:05, 19.50it/s, acc=88.28125%]    Epochs:  61%|██████    | 152/250 [00:07<00:05, 19.50it/s, acc=88.28125%]
                                                     Epochs:  61%|██████    | 152/250 [00:07<00:05, 19.50it/s, loss=0.391]   
    Sample:   0%|          | 0/8 [00:00<?, ?it/s]    Epochs:  61%|██████    | 152/250 [00:07<00:05, 19.50it/s, acc=88.28125%]    Epochs:  61%|██████    | 152/250 [00:07<00:05, 19.50it/s, acc=88.28125%]    Epochs:  61%|██████    | 152/250 [00:07<00:05, 19.50it/s, acc=88.28125%]    Epochs:  61%|██████    | 152/250 [00:07<00:05, 19.50it/s, acc=88.28125%]    Epochs:  61%|██████    | 152/250 [00:07<00:05, 19.50it/s, acc=88.28125%]    Epochs:  61%|██████    | 152/250 [00:07<00:05, 19.50it/s, acc=88.28125%]    Epochs:  61%|██████    | 152/250 [00:07<00:05, 19.50it/s, acc=88.28125%]    Epochs:  61%|██████    | 152/250 [00:07<00:05, 19.50it/s, acc=88.28125%]
                                                     Epochs:  61%|██████    | 152/250 [00:07<00:05, 19.50it/s, loss=0.389]       Epochs:  62%|██████▏   | 154/250 [00:07<00:04, 19.57it/s, loss=0.389]
    Sample:   0%|          | 0/8 [00:00<?, ?it/s]    Epochs:  62%|██████▏   | 154/250 [00:07<00:04, 19.57it/s, acc=88.28125%]    Epochs:  62%|██████▏   | 154/250 [00:07<00:04, 19.57it/s, acc=88.28125%]    Epochs:  62%|██████▏   | 154/250 [00:07<00:04, 19.57it/s, acc=88.28125%]    Epochs:  62%|██████▏   | 154/250 [00:07<00:04, 19.57it/s, acc=88.28125%]    Epochs:  62%|██████▏   | 154/250 [00:07<00:04, 19.57it/s, acc=88.28125%]    Epochs:  62%|██████▏   | 154/250 [00:07<00:04, 19.57it/s, acc=88.28125%]    Epochs:  62%|██████▏   | 154/250 [00:07<00:04, 19.57it/s, acc=88.0859375%]    Epochs:  62%|██████▏   | 154/250 [00:07<00:04, 19.57it/s, acc=88.28125%]  
                                                     Epochs:  62%|██████▏   | 154/250 [00:07<00:04, 19.57it/s, loss=0.388]   
    Sample:   0%|          | 0/8 [00:00<?, ?it/s]    Epochs:  62%|██████▏   | 154/250 [00:07<00:04, 19.57it/s, acc=88.28125%]    Epochs:  62%|██████▏   | 154/250 [00:07<00:04, 19.57it/s, acc=88.28125%]    Epochs:  62%|██████▏   | 154/250 [00:07<00:04, 19.57it/s, acc=88.28125%]    Epochs:  62%|██████▏   | 154/250 [00:07<00:04, 19.57it/s, acc=88.28125%]    Epochs:  62%|██████▏   | 154/250 [00:07<00:04, 19.57it/s, acc=88.4765625%]    Epochs:  62%|██████▏   | 154/250 [00:07<00:04, 19.57it/s, acc=88.28125%]      Epochs:  62%|██████▏   | 154/250 [00:07<00:04, 19.57it/s, acc=88.28125%]    Epochs:  62%|██████▏   | 154/250 [00:07<00:04, 19.57it/s, acc=88.28125%]
                                                     Epochs:  62%|██████▏   | 154/250 [00:07<00:04, 19.57it/s, loss=0.387]       Epochs:  62%|██████▏   | 156/250 [00:07<00:04, 19.57it/s, loss=0.387]
    Sample:   0%|          | 0/8 [00:00<?, ?it/s]    Epochs:  62%|██████▏   | 156/250 [00:07<00:04, 19.57it/s, acc=88.28125%]    Epochs:  62%|██████▏   | 156/250 [00:07<00:04, 19.57it/s, acc=88.28125%]    Epochs:  62%|██████▏   | 156/250 [00:07<00:04, 19.57it/s, acc=88.28125%]    Epochs:  62%|██████▏   | 156/250 [00:07<00:04, 19.57it/s, acc=88.28125%]    Epochs:  62%|██████▏   | 156/250 [00:07<00:04, 19.57it/s, acc=88.28125%]    Epochs:  62%|██████▏   | 156/250 [00:07<00:04, 19.57it/s, acc=88.28125%]    Epochs:  62%|██████▏   | 156/250 [00:08<00:04, 19.57it/s, acc=88.28125%]    Epochs:  62%|██████▏   | 156/250 [00:08<00:04, 19.57it/s, acc=88.4765625%]
                                                     Epochs:  62%|██████▏   | 156/250 [00:08<00:04, 19.57it/s, loss=0.386]     
    Sample:   0%|          | 0/8 [00:00<?, ?it/s]    Epochs:  62%|██████▏   | 156/250 [00:08<00:04, 19.57it/s, acc=88.4765625%]    Epochs:  62%|██████▏   | 156/250 [00:08<00:04, 19.57it/s, acc=88.4765625%]    Epochs:  62%|██████▏   | 156/250 [00:08<00:04, 19.57it/s, acc=88.28125%]      Epochs:  62%|██████▏   | 156/250 [00:08<00:04, 19.57it/s, acc=88.28125%]    Epochs:  62%|██████▏   | 156/250 [00:08<00:04, 19.57it/s, acc=88.28125%]    Epochs:  62%|██████▏   | 156/250 [00:08<00:04, 19.57it/s, acc=88.28125%]    Epochs:  62%|██████▏   | 156/250 [00:08<00:04, 19.57it/s, acc=88.28125%]    Epochs:  62%|██████▏   | 156/250 [00:08<00:04, 19.57it/s, acc=88.28125%]
                                                     Epochs:  62%|██████▏   | 156/250 [00:08<00:04, 19.57it/s, loss=0.385]       Epochs:  63%|██████▎   | 158/250 [00:08<00:04, 19.53it/s, loss=0.385]
    Sample:   0%|          | 0/8 [00:00<?, ?it/s]    Epochs:  63%|██████▎   | 158/250 [00:08<00:04, 19.53it/s, acc=88.28125%]    Epochs:  63%|██████▎   | 158/250 [00:08<00:04, 19.53it/s, acc=88.28125%]    Epochs:  63%|██████▎   | 158/250 [00:08<00:04, 19.53it/s, acc=88.28125%]    Epochs:  63%|██████▎   | 158/250 [00:08<00:04, 19.53it/s, acc=88.28125%]    Epochs:  63%|██████▎   | 158/250 [00:08<00:04, 19.53it/s, acc=88.28125%]    Epochs:  63%|██████▎   | 158/250 [00:08<00:04, 19.53it/s, acc=88.28125%]    Epochs:  63%|██████▎   | 158/250 [00:08<00:04, 19.53it/s, acc=88.28125%]    Epochs:  63%|██████▎   | 158/250 [00:08<00:04, 19.53it/s, acc=88.28125%]
                                                     Epochs:  63%|██████▎   | 158/250 [00:08<00:04, 19.53it/s, loss=0.384]   
    Sample:   0%|          | 0/8 [00:00<?, ?it/s]    Epochs:  63%|██████▎   | 158/250 [00:08<00:04, 19.53it/s, acc=88.28125%]    Epochs:  63%|██████▎   | 158/250 [00:08<00:04, 19.53it/s, acc=88.28125%]    Epochs:  63%|██████▎   | 158/250 [00:08<00:04, 19.53it/s, acc=88.28125%]    Epochs:  63%|██████▎   | 158/250 [00:08<00:04, 19.53it/s, acc=88.28125%]    Epochs:  63%|██████▎   | 158/250 [00:08<00:04, 19.53it/s, acc=88.28125%]    Epochs:  63%|██████▎   | 158/250 [00:08<00:04, 19.53it/s, acc=88.28125%]    Epochs:  63%|██████▎   | 158/250 [00:08<00:04, 19.53it/s, acc=88.28125%]    Epochs:  63%|██████▎   | 158/250 [00:08<00:04, 19.53it/s, acc=88.28125%]
                                                     Epochs:  63%|██████▎   | 158/250 [00:08<00:04, 19.53it/s, loss=0.383]       Epochs:  64%|██████▍   | 160/250 [00:08<00:04, 19.55it/s, loss=0.383]
    Sample:   0%|          | 0/8 [00:00<?, ?it/s]    Epochs:  64%|██████▍   | 160/250 [00:08<00:04, 19.55it/s, acc=88.28125%]    Epochs:  64%|██████▍   | 160/250 [00:08<00:04, 19.55it/s, acc=88.28125%]    Epochs:  64%|██████▍   | 160/250 [00:08<00:04, 19.55it/s, acc=88.28125%]    Epochs:  64%|██████▍   | 160/250 [00:08<00:04, 19.55it/s, acc=88.28125%]    Epochs:  64%|██████▍   | 160/250 [00:08<00:04, 19.55it/s, acc=88.28125%]    Epochs:  64%|██████▍   | 160/250 [00:08<00:04, 19.55it/s, acc=88.28125%]    Epochs:  64%|██████▍   | 160/250 [00:08<00:04, 19.55it/s, acc=88.28125%]    Epochs:  64%|██████▍   | 160/250 [00:08<00:04, 19.55it/s, acc=88.28125%]
                                                     Epochs:  64%|██████▍   | 160/250 [00:08<00:04, 19.55it/s, loss=0.381]   
    Sample:   0%|          | 0/8 [00:00<?, ?it/s]    Epochs:  64%|██████▍   | 160/250 [00:08<00:04, 19.55it/s, acc=88.28125%]    Epochs:  64%|██████▍   | 160/250 [00:08<00:04, 19.55it/s, acc=88.28125%]    Epochs:  64%|██████▍   | 160/250 [00:08<00:04, 19.55it/s, acc=88.28125%]    Epochs:  64%|██████▍   | 160/250 [00:08<00:04, 19.55it/s, acc=88.28125%]    Epochs:  64%|██████▍   | 160/250 [00:08<00:04, 19.55it/s, acc=88.28125%]    Epochs:  64%|██████▍   | 160/250 [00:08<00:04, 19.55it/s, acc=88.28125%]    Epochs:  64%|██████▍   | 160/250 [00:08<00:04, 19.55it/s, acc=88.28125%]    Epochs:  64%|██████▍   | 160/250 [00:08<00:04, 19.55it/s, acc=88.28125%]
                                                     Epochs:  64%|██████▍   | 160/250 [00:08<00:04, 19.55it/s, loss=0.38]        Epochs:  65%|██████▍   | 162/250 [00:08<00:04, 19.60it/s, loss=0.38]
    Sample:   0%|          | 0/8 [00:00<?, ?it/s]    Epochs:  65%|██████▍   | 162/250 [00:08<00:04, 19.60it/s, acc=88.28125%]    Epochs:  65%|██████▍   | 162/250 [00:08<00:04, 19.60it/s, acc=88.28125%]    Epochs:  65%|██████▍   | 162/250 [00:08<00:04, 19.60it/s, acc=88.28125%]    Epochs:  65%|██████▍   | 162/250 [00:08<00:04, 19.60it/s, acc=88.28125%]    Epochs:  65%|██████▍   | 162/250 [00:08<00:04, 19.60it/s, acc=88.28125%]    Epochs:  65%|██████▍   | 162/250 [00:08<00:04, 19.60it/s, acc=88.28125%]    Epochs:  65%|██████▍   | 162/250 [00:08<00:04, 19.60it/s, acc=88.28125%]    Epochs:  65%|██████▍   | 162/250 [00:08<00:04, 19.60it/s, acc=88.28125%]
                                                     Epochs:  65%|██████▍   | 162/250 [00:08<00:04, 19.60it/s, loss=0.379]   
    Sample:   0%|          | 0/8 [00:00<?, ?it/s]    Epochs:  65%|██████▍   | 162/250 [00:08<00:04, 19.60it/s, acc=88.28125%]    Epochs:  65%|██████▍   | 162/250 [00:08<00:04, 19.60it/s, acc=88.28125%]    Epochs:  65%|██████▍   | 162/250 [00:08<00:04, 19.60it/s, acc=88.28125%]    Epochs:  65%|██████▍   | 162/250 [00:08<00:04, 19.60it/s, acc=88.28125%]    Epochs:  65%|██████▍   | 162/250 [00:08<00:04, 19.60it/s, acc=88.28125%]    Epochs:  65%|██████▍   | 162/250 [00:08<00:04, 19.60it/s, acc=88.28125%]    Epochs:  65%|██████▍   | 162/250 [00:08<00:04, 19.60it/s, acc=88.28125%]    Epochs:  65%|██████▍   | 162/250 [00:08<00:04, 19.60it/s, acc=88.28125%]
                                                     Epochs:  65%|██████▍   | 162/250 [00:08<00:04, 19.60it/s, loss=0.378]       Epochs:  66%|██████▌   | 164/250 [00:08<00:04, 19.55it/s, loss=0.378]
    Sample:   0%|          | 0/8 [00:00<?, ?it/s]    Epochs:  66%|██████▌   | 164/250 [00:08<00:04, 19.55it/s, acc=88.28125%]    Epochs:  66%|██████▌   | 164/250 [00:08<00:04, 19.55it/s, acc=88.28125%]    Epochs:  66%|██████▌   | 164/250 [00:08<00:04, 19.55it/s, acc=88.28125%]    Epochs:  66%|██████▌   | 164/250 [00:08<00:04, 19.55it/s, acc=88.28125%]    Epochs:  66%|██████▌   | 164/250 [00:08<00:04, 19.55it/s, acc=88.28125%]    Epochs:  66%|██████▌   | 164/250 [00:08<00:04, 19.55it/s, acc=88.28125%]    Epochs:  66%|██████▌   | 164/250 [00:08<00:04, 19.55it/s, acc=88.28125%]    Epochs:  66%|██████▌   | 164/250 [00:08<00:04, 19.55it/s, acc=88.28125%]
                                                     Epochs:  66%|██████▌   | 164/250 [00:08<00:04, 19.55it/s, loss=0.377]   
    Sample:   0%|          | 0/8 [00:00<?, ?it/s]    Epochs:  66%|██████▌   | 164/250 [00:08<00:04, 19.55it/s, acc=88.28125%]    Epochs:  66%|██████▌   | 164/250 [00:08<00:04, 19.55it/s, acc=88.28125%]    Epochs:  66%|██████▌   | 164/250 [00:08<00:04, 19.55it/s, acc=88.28125%]    Epochs:  66%|██████▌   | 164/250 [00:08<00:04, 19.55it/s, acc=88.28125%]    Epochs:  66%|██████▌   | 164/250 [00:08<00:04, 19.55it/s, acc=88.28125%]    Epochs:  66%|██████▌   | 164/250 [00:08<00:04, 19.55it/s, acc=88.28125%]    Epochs:  66%|██████▌   | 164/250 [00:08<00:04, 19.55it/s, acc=88.28125%]    Epochs:  66%|██████▌   | 164/250 [00:08<00:04, 19.55it/s, acc=88.28125%]
                                                     Epochs:  66%|██████▌   | 164/250 [00:08<00:04, 19.55it/s, loss=0.376]       Epochs:  66%|██████▋   | 166/250 [00:08<00:04, 19.47it/s, loss=0.376]
    Sample:   0%|          | 0/8 [00:00<?, ?it/s]    Epochs:  66%|██████▋   | 166/250 [00:08<00:04, 19.47it/s, acc=88.28125%]    Epochs:  66%|██████▋   | 166/250 [00:08<00:04, 19.47it/s, acc=88.28125%]    Epochs:  66%|██████▋   | 166/250 [00:08<00:04, 19.47it/s, acc=88.28125%]    Epochs:  66%|██████▋   | 166/250 [00:08<00:04, 19.47it/s, acc=88.28125%]    Epochs:  66%|██████▋   | 166/250 [00:08<00:04, 19.47it/s, acc=88.28125%]    Epochs:  66%|██████▋   | 166/250 [00:08<00:04, 19.47it/s, acc=88.28125%]    Epochs:  66%|██████▋   | 166/250 [00:08<00:04, 19.47it/s, acc=88.28125%]    Epochs:  66%|██████▋   | 166/250 [00:08<00:04, 19.47it/s, acc=88.28125%]
                                                     Epochs:  66%|██████▋   | 166/250 [00:08<00:04, 19.47it/s, loss=0.375]   
    Sample:   0%|          | 0/8 [00:00<?, ?it/s]    Epochs:  66%|██████▋   | 166/250 [00:08<00:04, 19.47it/s, acc=88.28125%]    Epochs:  66%|██████▋   | 166/250 [00:08<00:04, 19.47it/s, acc=88.28125%]    Epochs:  66%|██████▋   | 166/250 [00:08<00:04, 19.47it/s, acc=88.28125%]    Epochs:  66%|██████▋   | 166/250 [00:08<00:04, 19.47it/s, acc=88.28125%]    Epochs:  66%|██████▋   | 166/250 [00:08<00:04, 19.47it/s, acc=88.28125%]    Epochs:  66%|██████▋   | 166/250 [00:08<00:04, 19.47it/s, acc=88.0859375%]    Epochs:  66%|██████▋   | 166/250 [00:08<00:04, 19.47it/s, acc=88.0859375%]    Epochs:  66%|██████▋   | 166/250 [00:08<00:04, 19.47it/s, acc=88.28125%]  
                                                     Epochs:  66%|██████▋   | 166/250 [00:08<00:04, 19.47it/s, loss=0.374]       Epochs:  67%|██████▋   | 168/250 [00:08<00:04, 19.54it/s, loss=0.374]
    Sample:   0%|          | 0/8 [00:00<?, ?it/s]    Epochs:  67%|██████▋   | 168/250 [00:08<00:04, 19.54it/s, acc=88.28125%]    Epochs:  67%|██████▋   | 168/250 [00:08<00:04, 19.54it/s, acc=88.28125%]    Epochs:  67%|██████▋   | 168/250 [00:08<00:04, 19.54it/s, acc=88.28125%]    Epochs:  67%|██████▋   | 168/250 [00:08<00:04, 19.54it/s, acc=88.28125%]    Epochs:  67%|██████▋   | 168/250 [00:08<00:04, 19.54it/s, acc=88.0859375%]    Epochs:  67%|██████▋   | 168/250 [00:08<00:04, 19.54it/s, acc=88.0859375%]    Epochs:  67%|██████▋   | 168/250 [00:08<00:04, 19.54it/s, acc=88.0859375%]    Epochs:  67%|██████▋   | 168/250 [00:08<00:04, 19.54it/s, acc=88.0859375%]
                                                     Epochs:  67%|██████▋   | 168/250 [00:08<00:04, 19.54it/s, loss=0.373]     
    Sample:   0%|          | 0/8 [00:00<?, ?it/s]    Epochs:  67%|██████▋   | 168/250 [00:08<00:04, 19.54it/s, acc=88.0859375%]    Epochs:  67%|██████▋   | 168/250 [00:08<00:04, 19.54it/s, acc=88.0859375%]    Epochs:  67%|██████▋   | 168/250 [00:08<00:04, 19.54it/s, acc=88.0859375%]    Epochs:  67%|██████▋   | 168/250 [00:08<00:04, 19.54it/s, acc=88.0859375%]    Epochs:  67%|██████▋   | 168/250 [00:08<00:04, 19.54it/s, acc=88.0859375%]    Epochs:  67%|██████▋   | 168/250 [00:08<00:04, 19.54it/s, acc=88.0859375%]    Epochs:  67%|██████▋   | 168/250 [00:08<00:04, 19.54it/s, acc=88.0859375%]    Epochs:  67%|██████▋   | 168/250 [00:08<00:04, 19.54it/s, acc=88.0859375%]
                                                     Epochs:  67%|██████▋   | 168/250 [00:08<00:04, 19.54it/s, loss=0.372]         Epochs:  68%|██████▊   | 170/250 [00:08<00:04, 19.59it/s, loss=0.372]
    Sample:   0%|          | 0/8 [00:00<?, ?it/s]    Epochs:  68%|██████▊   | 170/250 [00:08<00:04, 19.59it/s, acc=88.0859375%]    Epochs:  68%|██████▊   | 170/250 [00:08<00:04, 19.59it/s, acc=88.0859375%]    Epochs:  68%|██████▊   | 170/250 [00:08<00:04, 19.59it/s, acc=88.0859375%]    Epochs:  68%|██████▊   | 170/250 [00:08<00:04, 19.59it/s, acc=88.0859375%]    Epochs:  68%|██████▊   | 170/250 [00:08<00:04, 19.59it/s, acc=88.0859375%]    Epochs:  68%|██████▊   | 170/250 [00:08<00:04, 19.59it/s, acc=88.0859375%]    Epochs:  68%|██████▊   | 170/250 [00:08<00:04, 19.59it/s, acc=88.0859375%]    Epochs:  68%|██████▊   | 170/250 [00:08<00:04, 19.59it/s, acc=88.0859375%]
                                                     Epochs:  68%|██████▊   | 170/250 [00:08<00:04, 19.59it/s, loss=0.371]     
    Sample:   0%|          | 0/8 [00:00<?, ?it/s]    Epochs:  68%|██████▊   | 170/250 [00:08<00:04, 19.59it/s, acc=88.0859375%]    Epochs:  68%|██████▊   | 170/250 [00:08<00:04, 19.59it/s, acc=88.0859375%]    Epochs:  68%|██████▊   | 170/250 [00:08<00:04, 19.59it/s, acc=88.0859375%]    Epochs:  68%|██████▊   | 170/250 [00:08<00:04, 19.59it/s, acc=88.0859375%]    Epochs:  68%|██████▊   | 170/250 [00:08<00:04, 19.59it/s, acc=88.0859375%]    Epochs:  68%|██████▊   | 170/250 [00:08<00:04, 19.59it/s, acc=88.0859375%]    Epochs:  68%|██████▊   | 170/250 [00:08<00:04, 19.59it/s, acc=88.0859375%]    Epochs:  68%|██████▊   | 170/250 [00:08<00:04, 19.59it/s, acc=88.0859375%]
                                                     Epochs:  68%|██████▊   | 170/250 [00:08<00:04, 19.59it/s, loss=0.37]          Epochs:  69%|██████▉   | 172/250 [00:08<00:03, 19.60it/s, loss=0.37]
    Sample:   0%|          | 0/8 [00:00<?, ?it/s]    Epochs:  69%|██████▉   | 172/250 [00:08<00:03, 19.60it/s, acc=88.0859375%]    Epochs:  69%|██████▉   | 172/250 [00:08<00:03, 19.60it/s, acc=88.0859375%]    Epochs:  69%|██████▉   | 172/250 [00:08<00:03, 19.60it/s, acc=88.0859375%]    Epochs:  69%|██████▉   | 172/250 [00:08<00:03, 19.60it/s, acc=88.0859375%]    Epochs:  69%|██████▉   | 172/250 [00:08<00:03, 19.60it/s, acc=88.0859375%]    Epochs:  69%|██████▉   | 172/250 [00:08<00:03, 19.60it/s, acc=87.890625%]     Epochs:  69%|██████▉   | 172/250 [00:08<00:03, 19.60it/s, acc=88.0859375%]    Epochs:  69%|██████▉   | 172/250 [00:08<00:03, 19.60it/s, acc=88.0859375%]
                                                     Epochs:  69%|██████▉   | 172/250 [00:08<00:03, 19.60it/s, loss=0.369]     
    Sample:   0%|          | 0/8 [00:00<?, ?it/s]    Epochs:  69%|██████▉   | 172/250 [00:08<00:03, 19.60it/s, acc=88.0859375%]    Epochs:  69%|██████▉   | 172/250 [00:08<00:03, 19.60it/s, acc=88.0859375%]    Epochs:  69%|██████▉   | 172/250 [00:08<00:03, 19.60it/s, acc=88.0859375%]    Epochs:  69%|██████▉   | 172/250 [00:08<00:03, 19.60it/s, acc=88.0859375%]    Epochs:  69%|██████▉   | 172/250 [00:08<00:03, 19.60it/s, acc=87.890625%]     Epochs:  69%|██████▉   | 172/250 [00:08<00:03, 19.60it/s, acc=87.6953125%]    Epochs:  69%|██████▉   | 172/250 [00:08<00:03, 19.60it/s, acc=87.6953125%]    Epochs:  69%|██████▉   | 172/250 [00:08<00:03, 19.60it/s, acc=87.6953125%]
                                                     Epochs:  69%|██████▉   | 172/250 [00:08<00:03, 19.60it/s, loss=0.368]         Epochs:  70%|██████▉   | 174/250 [00:08<00:03, 19.61it/s, loss=0.368]
    Sample:   0%|          | 0/8 [00:00<?, ?it/s]    Epochs:  70%|██████▉   | 174/250 [00:08<00:03, 19.61it/s, acc=87.6953125%]    Epochs:  70%|██████▉   | 174/250 [00:08<00:03, 19.61it/s, acc=87.6953125%]    Epochs:  70%|██████▉   | 174/250 [00:08<00:03, 19.61it/s, acc=87.6953125%]    Epochs:  70%|██████▉   | 174/250 [00:08<00:03, 19.61it/s, acc=87.6953125%]    Epochs:  70%|██████▉   | 174/250 [00:08<00:03, 19.61it/s, acc=87.6953125%]    Epochs:  70%|██████▉   | 174/250 [00:08<00:03, 19.61it/s, acc=87.6953125%]    Epochs:  70%|██████▉   | 174/250 [00:08<00:03, 19.61it/s, acc=87.6953125%]    Epochs:  70%|██████▉   | 174/250 [00:08<00:03, 19.61it/s, acc=87.6953125%]
                                                     Epochs:  70%|██████▉   | 174/250 [00:08<00:03, 19.61it/s, loss=0.367]     
    Sample:   0%|          | 0/8 [00:00<?, ?it/s]    Epochs:  70%|██████▉   | 174/250 [00:08<00:03, 19.61it/s, acc=87.6953125%]    Epochs:  70%|██████▉   | 174/250 [00:08<00:03, 19.61it/s, acc=87.6953125%]    Epochs:  70%|██████▉   | 174/250 [00:08<00:03, 19.61it/s, acc=87.6953125%]    Epochs:  70%|██████▉   | 174/250 [00:08<00:03, 19.61it/s, acc=87.6953125%]    Epochs:  70%|██████▉   | 174/250 [00:08<00:03, 19.61it/s, acc=87.6953125%]    Epochs:  70%|██████▉   | 174/250 [00:08<00:03, 19.61it/s, acc=87.6953125%]    Epochs:  70%|██████▉   | 174/250 [00:08<00:03, 19.61it/s, acc=87.6953125%]    Epochs:  70%|██████▉   | 174/250 [00:08<00:03, 19.61it/s, acc=87.6953125%]
                                                     Epochs:  70%|██████▉   | 174/250 [00:08<00:03, 19.61it/s, loss=0.367]         Epochs:  70%|███████   | 176/250 [00:08<00:03, 19.61it/s, loss=0.367]
    Sample:   0%|          | 0/8 [00:00<?, ?it/s]    Epochs:  70%|███████   | 176/250 [00:08<00:03, 19.61it/s, acc=87.6953125%]    Epochs:  70%|███████   | 176/250 [00:08<00:03, 19.61it/s, acc=87.6953125%]    Epochs:  70%|███████   | 176/250 [00:08<00:03, 19.61it/s, acc=87.6953125%]    Epochs:  70%|███████   | 176/250 [00:09<00:03, 19.61it/s, acc=87.6953125%]    Epochs:  70%|███████   | 176/250 [00:09<00:03, 19.61it/s, acc=87.6953125%]    Epochs:  70%|███████   | 176/250 [00:09<00:03, 19.61it/s, acc=87.6953125%]    Epochs:  70%|███████   | 176/250 [00:09<00:03, 19.61it/s, acc=87.6953125%]    Epochs:  70%|███████   | 176/250 [00:09<00:03, 19.61it/s, acc=87.6953125%]
                                                     Epochs:  70%|███████   | 176/250 [00:09<00:03, 19.61it/s, loss=0.366]     
    Sample:   0%|          | 0/8 [00:00<?, ?it/s]    Epochs:  70%|███████   | 176/250 [00:09<00:03, 19.61it/s, acc=87.6953125%]    Epochs:  70%|███████   | 176/250 [00:09<00:03, 19.61it/s, acc=87.6953125%]    Epochs:  70%|███████   | 176/250 [00:09<00:03, 19.61it/s, acc=87.6953125%]    Epochs:  70%|███████   | 176/250 [00:09<00:03, 19.61it/s, acc=87.6953125%]    Epochs:  70%|███████   | 176/250 [00:09<00:03, 19.61it/s, acc=87.6953125%]    Epochs:  70%|███████   | 176/250 [00:09<00:03, 19.61it/s, acc=87.6953125%]    Epochs:  70%|███████   | 176/250 [00:09<00:03, 19.61it/s, acc=87.6953125%]    Epochs:  70%|███████   | 176/250 [00:09<00:03, 19.61it/s, acc=87.6953125%]
                                                     Epochs:  70%|███████   | 176/250 [00:09<00:03, 19.61it/s, loss=0.365]         Epochs:  71%|███████   | 178/250 [00:09<00:03, 19.64it/s, loss=0.365]
    Sample:   0%|          | 0/8 [00:00<?, ?it/s]    Epochs:  71%|███████   | 178/250 [00:09<00:03, 19.64it/s, acc=87.6953125%]    Epochs:  71%|███████   | 178/250 [00:09<00:03, 19.64it/s, acc=87.6953125%]    Epochs:  71%|███████   | 178/250 [00:09<00:03, 19.64it/s, acc=87.6953125%]    Epochs:  71%|███████   | 178/250 [00:09<00:03, 19.64it/s, acc=87.6953125%]    Epochs:  71%|███████   | 178/250 [00:09<00:03, 19.64it/s, acc=87.6953125%]    Epochs:  71%|███████   | 178/250 [00:09<00:03, 19.64it/s, acc=87.890625%]     Epochs:  71%|███████   | 178/250 [00:09<00:03, 19.64it/s, acc=87.890625%]    Epochs:  71%|███████   | 178/250 [00:09<00:03, 19.64it/s, acc=87.6953125%]
                                                     Epochs:  71%|███████   | 178/250 [00:09<00:03, 19.64it/s, loss=0.364]     
    Sample:   0%|          | 0/8 [00:00<?, ?it/s]    Epochs:  71%|███████   | 178/250 [00:09<00:03, 19.64it/s, acc=87.890625%]    Epochs:  71%|███████   | 178/250 [00:09<00:03, 19.64it/s, acc=87.6953125%]    Epochs:  71%|███████   | 178/250 [00:09<00:03, 19.64it/s, acc=87.6953125%]    Epochs:  71%|███████   | 178/250 [00:09<00:03, 19.64it/s, acc=87.890625%]     Epochs:  71%|███████   | 178/250 [00:09<00:03, 19.64it/s, acc=87.890625%]    Epochs:  71%|███████   | 178/250 [00:09<00:03, 19.64it/s, acc=87.890625%]    Epochs:  71%|███████   | 178/250 [00:09<00:03, 19.64it/s, acc=87.890625%]    Epochs:  71%|███████   | 178/250 [00:09<00:03, 19.64it/s, acc=87.890625%]
                                                     Epochs:  71%|███████   | 178/250 [00:09<00:03, 19.64it/s, loss=0.363]        Epochs:  72%|███████▏  | 180/250 [00:09<00:03, 19.63it/s, loss=0.363]
    Sample:   0%|          | 0/8 [00:00<?, ?it/s]    Epochs:  72%|███████▏  | 180/250 [00:09<00:03, 19.63it/s, acc=87.890625%]    Epochs:  72%|███████▏  | 180/250 [00:09<00:03, 19.63it/s, acc=87.890625%]    Epochs:  72%|███████▏  | 180/250 [00:09<00:03, 19.63it/s, acc=87.890625%]    Epochs:  72%|███████▏  | 180/250 [00:09<00:03, 19.63it/s, acc=87.890625%]    Epochs:  72%|███████▏  | 180/250 [00:09<00:03, 19.63it/s, acc=87.890625%]    Epochs:  72%|███████▏  | 180/250 [00:09<00:03, 19.63it/s, acc=87.890625%]    Epochs:  72%|███████▏  | 180/250 [00:09<00:03, 19.63it/s, acc=87.890625%]    Epochs:  72%|███████▏  | 180/250 [00:09<00:03, 19.63it/s, acc=87.890625%]
                                                     Epochs:  72%|███████▏  | 180/250 [00:09<00:03, 19.63it/s, loss=0.362]    
    Sample:   0%|          | 0/8 [00:00<?, ?it/s]    Epochs:  72%|███████▏  | 180/250 [00:09<00:03, 19.63it/s, acc=87.890625%]    Epochs:  72%|███████▏  | 180/250 [00:09<00:03, 19.63it/s, acc=87.890625%]    Epochs:  72%|███████▏  | 180/250 [00:09<00:03, 19.63it/s, acc=87.890625%]    Epochs:  72%|███████▏  | 180/250 [00:09<00:03, 19.63it/s, acc=87.890625%]    Epochs:  72%|███████▏  | 180/250 [00:09<00:03, 19.63it/s, acc=87.890625%]    Epochs:  72%|███████▏  | 180/250 [00:09<00:03, 19.63it/s, acc=87.890625%]    Epochs:  72%|███████▏  | 180/250 [00:09<00:03, 19.63it/s, acc=87.890625%]    Epochs:  72%|███████▏  | 180/250 [00:09<00:03, 19.63it/s, acc=87.890625%]
                                                     Epochs:  72%|███████▏  | 180/250 [00:09<00:03, 19.63it/s, loss=0.361]        Epochs:  73%|███████▎  | 182/250 [00:09<00:03, 19.66it/s, loss=0.361]
    Sample:   0%|          | 0/8 [00:00<?, ?it/s]    Epochs:  73%|███████▎  | 182/250 [00:09<00:03, 19.66it/s, acc=87.890625%]    Epochs:  73%|███████▎  | 182/250 [00:09<00:03, 19.66it/s, acc=87.890625%]    Epochs:  73%|███████▎  | 182/250 [00:09<00:03, 19.66it/s, acc=87.890625%]    Epochs:  73%|███████▎  | 182/250 [00:09<00:03, 19.66it/s, acc=87.890625%]    Epochs:  73%|███████▎  | 182/250 [00:09<00:03, 19.66it/s, acc=87.890625%]    Epochs:  73%|███████▎  | 182/250 [00:09<00:03, 19.66it/s, acc=87.890625%]    Epochs:  73%|███████▎  | 182/250 [00:09<00:03, 19.66it/s, acc=87.890625%]    Epochs:  73%|███████▎  | 182/250 [00:09<00:03, 19.66it/s, acc=87.890625%]
                                                     Epochs:  73%|███████▎  | 182/250 [00:09<00:03, 19.66it/s, loss=0.361]    
    Sample:   0%|          | 0/8 [00:00<?, ?it/s]    Epochs:  73%|███████▎  | 182/250 [00:09<00:03, 19.66it/s, acc=87.890625%]    Epochs:  73%|███████▎  | 182/250 [00:09<00:03, 19.66it/s, acc=87.890625%]    Epochs:  73%|███████▎  | 182/250 [00:09<00:03, 19.66it/s, acc=87.890625%]    Epochs:  73%|███████▎  | 182/250 [00:09<00:03, 19.66it/s, acc=87.890625%]    Epochs:  73%|███████▎  | 182/250 [00:09<00:03, 19.66it/s, acc=87.890625%]    Epochs:  73%|███████▎  | 182/250 [00:09<00:03, 19.66it/s, acc=87.890625%]    Epochs:  73%|███████▎  | 182/250 [00:09<00:03, 19.66it/s, acc=87.890625%]    Epochs:  73%|███████▎  | 182/250 [00:09<00:03, 19.66it/s, acc=87.890625%]
                                                     Epochs:  73%|███████▎  | 182/250 [00:09<00:03, 19.66it/s, loss=0.36]         Epochs:  74%|███████▎  | 184/250 [00:09<00:03, 19.67it/s, loss=0.36]
    Sample:   0%|          | 0/8 [00:00<?, ?it/s]    Epochs:  74%|███████▎  | 184/250 [00:09<00:03, 19.67it/s, acc=87.890625%]    Epochs:  74%|███████▎  | 184/250 [00:09<00:03, 19.67it/s, acc=87.890625%]    Epochs:  74%|███████▎  | 184/250 [00:09<00:03, 19.67it/s, acc=87.890625%]    Epochs:  74%|███████▎  | 184/250 [00:09<00:03, 19.67it/s, acc=87.890625%]    Epochs:  74%|███████▎  | 184/250 [00:09<00:03, 19.67it/s, acc=87.890625%]    Epochs:  74%|███████▎  | 184/250 [00:09<00:03, 19.67it/s, acc=87.890625%]    Epochs:  74%|███████▎  | 184/250 [00:09<00:03, 19.67it/s, acc=87.890625%]    Epochs:  74%|███████▎  | 184/250 [00:09<00:03, 19.67it/s, acc=87.890625%]
                                                     Epochs:  74%|███████▎  | 184/250 [00:09<00:03, 19.67it/s, loss=0.359]    
    Sample:   0%|          | 0/8 [00:00<?, ?it/s]    Epochs:  74%|███████▎  | 184/250 [00:09<00:03, 19.67it/s, acc=87.890625%]    Epochs:  74%|███████▎  | 184/250 [00:09<00:03, 19.67it/s, acc=87.890625%]    Epochs:  74%|███████▎  | 184/250 [00:09<00:03, 19.67it/s, acc=87.890625%]    Epochs:  74%|███████▎  | 184/250 [00:09<00:03, 19.67it/s, acc=87.890625%]    Epochs:  74%|███████▎  | 184/250 [00:09<00:03, 19.67it/s, acc=87.890625%]    Epochs:  74%|███████▎  | 184/250 [00:09<00:03, 19.67it/s, acc=87.890625%]    Epochs:  74%|███████▎  | 184/250 [00:09<00:03, 19.67it/s, acc=87.890625%]    Epochs:  74%|███████▎  | 184/250 [00:09<00:03, 19.67it/s, acc=87.890625%]
                                                     Epochs:  74%|███████▎  | 184/250 [00:09<00:03, 19.67it/s, loss=0.358]        Epochs:  74%|███████▍  | 186/250 [00:09<00:03, 19.62it/s, loss=0.358]
    Sample:   0%|          | 0/8 [00:00<?, ?it/s]    Epochs:  74%|███████▍  | 186/250 [00:09<00:03, 19.62it/s, acc=87.890625%]    Epochs:  74%|███████▍  | 186/250 [00:09<00:03, 19.62it/s, acc=87.890625%]    Epochs:  74%|███████▍  | 186/250 [00:09<00:03, 19.62it/s, acc=87.890625%]    Epochs:  74%|███████▍  | 186/250 [00:09<00:03, 19.62it/s, acc=87.890625%]    Epochs:  74%|███████▍  | 186/250 [00:09<00:03, 19.62it/s, acc=87.890625%]    Epochs:  74%|███████▍  | 186/250 [00:09<00:03, 19.62it/s, acc=87.890625%]    Epochs:  74%|███████▍  | 186/250 [00:09<00:03, 19.62it/s, acc=87.890625%]    Epochs:  74%|███████▍  | 186/250 [00:09<00:03, 19.62it/s, acc=87.890625%]
                                                     Epochs:  74%|███████▍  | 186/250 [00:09<00:03, 19.62it/s, loss=0.357]    
    Sample:   0%|          | 0/8 [00:00<?, ?it/s]    Epochs:  74%|███████▍  | 186/250 [00:09<00:03, 19.62it/s, acc=87.890625%]    Epochs:  74%|███████▍  | 186/250 [00:09<00:03, 19.62it/s, acc=87.890625%]    Epochs:  74%|███████▍  | 186/250 [00:09<00:03, 19.62it/s, acc=87.890625%]    Epochs:  74%|███████▍  | 186/250 [00:09<00:03, 19.62it/s, acc=87.890625%]    Epochs:  74%|███████▍  | 186/250 [00:09<00:03, 19.62it/s, acc=87.890625%]    Epochs:  74%|███████▍  | 186/250 [00:09<00:03, 19.62it/s, acc=87.890625%]    Epochs:  74%|███████▍  | 186/250 [00:09<00:03, 19.62it/s, acc=88.0859375%]    Epochs:  74%|███████▍  | 186/250 [00:09<00:03, 19.62it/s, acc=87.890625%] 
                                                     Epochs:  74%|███████▍  | 186/250 [00:09<00:03, 19.62it/s, loss=0.356]        Epochs:  75%|███████▌  | 188/250 [00:09<00:03, 19.50it/s, loss=0.356]
    Sample:   0%|          | 0/8 [00:00<?, ?it/s]    Epochs:  75%|███████▌  | 188/250 [00:09<00:03, 19.50it/s, acc=87.890625%]    Epochs:  75%|███████▌  | 188/250 [00:09<00:03, 19.50it/s, acc=87.890625%]    Epochs:  75%|███████▌  | 188/250 [00:09<00:03, 19.50it/s, acc=87.890625%]    Epochs:  75%|███████▌  | 188/250 [00:09<00:03, 19.50it/s, acc=87.890625%]    Epochs:  75%|███████▌  | 188/250 [00:09<00:03, 19.50it/s, acc=87.890625%]    Epochs:  75%|███████▌  | 188/250 [00:09<00:03, 19.50it/s, acc=87.890625%]    Epochs:  75%|███████▌  | 188/250 [00:09<00:03, 19.50it/s, acc=87.890625%]    Epochs:  75%|███████▌  | 188/250 [00:09<00:03, 19.50it/s, acc=87.890625%]
                                                     Epochs:  75%|███████▌  | 188/250 [00:09<00:03, 19.50it/s, loss=0.356]    
    Sample:   0%|          | 0/8 [00:00<?, ?it/s]    Epochs:  75%|███████▌  | 188/250 [00:09<00:03, 19.50it/s, acc=87.890625%]    Epochs:  75%|███████▌  | 188/250 [00:09<00:03, 19.50it/s, acc=87.890625%]    Epochs:  75%|███████▌  | 188/250 [00:09<00:03, 19.50it/s, acc=87.890625%]    Epochs:  75%|███████▌  | 188/250 [00:09<00:03, 19.50it/s, acc=87.890625%]    Epochs:  75%|███████▌  | 188/250 [00:09<00:03, 19.50it/s, acc=87.890625%]    Epochs:  75%|███████▌  | 188/250 [00:09<00:03, 19.50it/s, acc=87.890625%]    Epochs:  75%|███████▌  | 188/250 [00:09<00:03, 19.50it/s, acc=87.890625%]    Epochs:  75%|███████▌  | 188/250 [00:09<00:03, 19.50it/s, acc=87.890625%]
                                                     Epochs:  75%|███████▌  | 188/250 [00:09<00:03, 19.50it/s, loss=0.355]        Epochs:  76%|███████▌  | 190/250 [00:09<00:03, 19.54it/s, loss=0.355]
    Sample:   0%|          | 0/8 [00:00<?, ?it/s]    Epochs:  76%|███████▌  | 190/250 [00:09<00:03, 19.54it/s, acc=87.890625%]    Epochs:  76%|███████▌  | 190/250 [00:09<00:03, 19.54it/s, acc=87.890625%]    Epochs:  76%|███████▌  | 190/250 [00:09<00:03, 19.54it/s, acc=87.890625%]    Epochs:  76%|███████▌  | 190/250 [00:09<00:03, 19.54it/s, acc=87.890625%]    Epochs:  76%|███████▌  | 190/250 [00:09<00:03, 19.54it/s, acc=87.890625%]    Epochs:  76%|███████▌  | 190/250 [00:09<00:03, 19.54it/s, acc=88.0859375%]    Epochs:  76%|███████▌  | 190/250 [00:09<00:03, 19.54it/s, acc=87.890625%]     Epochs:  76%|███████▌  | 190/250 [00:09<00:03, 19.54it/s, acc=87.890625%]
                                                     Epochs:  76%|███████▌  | 190/250 [00:09<00:03, 19.54it/s, loss=0.354]    
    Sample:   0%|          | 0/8 [00:00<?, ?it/s]    Epochs:  76%|███████▌  | 190/250 [00:09<00:03, 19.54it/s, acc=87.890625%]    Epochs:  76%|███████▌  | 190/250 [00:09<00:03, 19.54it/s, acc=87.890625%]    Epochs:  76%|███████▌  | 190/250 [00:09<00:03, 19.54it/s, acc=87.890625%]    Epochs:  76%|███████▌  | 190/250 [00:09<00:03, 19.54it/s, acc=87.890625%]    Epochs:  76%|███████▌  | 190/250 [00:09<00:03, 19.54it/s, acc=88.0859375%]    Epochs:  76%|███████▌  | 190/250 [00:09<00:03, 19.54it/s, acc=88.0859375%]    Epochs:  76%|███████▌  | 190/250 [00:09<00:03, 19.54it/s, acc=88.0859375%]    Epochs:  76%|███████▌  | 190/250 [00:09<00:03, 19.54it/s, acc=88.0859375%]
                                                     Epochs:  76%|███████▌  | 190/250 [00:09<00:03, 19.54it/s, loss=0.353]         Epochs:  77%|███████▋  | 192/250 [00:09<00:02, 19.48it/s, loss=0.353]
    Sample:   0%|          | 0/8 [00:00<?, ?it/s]    Epochs:  77%|███████▋  | 192/250 [00:09<00:02, 19.48it/s, acc=88.0859375%]    Epochs:  77%|███████▋  | 192/250 [00:09<00:02, 19.48it/s, acc=88.0859375%]    Epochs:  77%|███████▋  | 192/250 [00:09<00:02, 19.48it/s, acc=88.0859375%]    Epochs:  77%|███████▋  | 192/250 [00:09<00:02, 19.48it/s, acc=88.0859375%]    Epochs:  77%|███████▋  | 192/250 [00:09<00:02, 19.48it/s, acc=88.0859375%]    Epochs:  77%|███████▋  | 192/250 [00:09<00:02, 19.48it/s, acc=88.0859375%]    Epochs:  77%|███████▋  | 192/250 [00:09<00:02, 19.48it/s, acc=88.0859375%]    Epochs:  77%|███████▋  | 192/250 [00:09<00:02, 19.48it/s, acc=88.0859375%]
                                                     Epochs:  77%|███████▋  | 192/250 [00:09<00:02, 19.48it/s, loss=0.353]     
    Sample:   0%|          | 0/8 [00:00<?, ?it/s]    Epochs:  77%|███████▋  | 192/250 [00:09<00:02, 19.48it/s, acc=88.0859375%]    Epochs:  77%|███████▋  | 192/250 [00:09<00:02, 19.48it/s, acc=88.0859375%]    Epochs:  77%|███████▋  | 192/250 [00:09<00:02, 19.48it/s, acc=88.0859375%]    Epochs:  77%|███████▋  | 192/250 [00:09<00:02, 19.48it/s, acc=88.0859375%]    Epochs:  77%|███████▋  | 192/250 [00:09<00:02, 19.48it/s, acc=88.0859375%]    Epochs:  77%|███████▋  | 192/250 [00:09<00:02, 19.48it/s, acc=88.0859375%]    Epochs:  77%|███████▋  | 192/250 [00:09<00:02, 19.48it/s, acc=88.0859375%]    Epochs:  77%|███████▋  | 192/250 [00:09<00:02, 19.48it/s, acc=88.0859375%]
                                                     Epochs:  77%|███████▋  | 192/250 [00:09<00:02, 19.48it/s, loss=0.352]         Epochs:  78%|███████▊  | 194/250 [00:09<00:02, 19.55it/s, loss=0.352]
    Sample:   0%|          | 0/8 [00:00<?, ?it/s]    Epochs:  78%|███████▊  | 194/250 [00:09<00:02, 19.55it/s, acc=88.0859375%]    Epochs:  78%|███████▊  | 194/250 [00:09<00:02, 19.55it/s, acc=88.0859375%]    Epochs:  78%|███████▊  | 194/250 [00:09<00:02, 19.55it/s, acc=88.0859375%]    Epochs:  78%|███████▊  | 194/250 [00:09<00:02, 19.55it/s, acc=88.0859375%]    Epochs:  78%|███████▊  | 194/250 [00:09<00:02, 19.55it/s, acc=88.0859375%]    Epochs:  78%|███████▊  | 194/250 [00:09<00:02, 19.55it/s, acc=88.0859375%]    Epochs:  78%|███████▊  | 194/250 [00:09<00:02, 19.55it/s, acc=88.0859375%]    Epochs:  78%|███████▊  | 194/250 [00:09<00:02, 19.55it/s, acc=88.0859375%]
                                                     Epochs:  78%|███████▊  | 194/250 [00:09<00:02, 19.55it/s, loss=0.351]     
    Sample:   0%|          | 0/8 [00:00<?, ?it/s]    Epochs:  78%|███████▊  | 194/250 [00:09<00:02, 19.55it/s, acc=88.0859375%]    Epochs:  78%|███████▊  | 194/250 [00:09<00:02, 19.55it/s, acc=88.0859375%]    Epochs:  78%|███████▊  | 194/250 [00:09<00:02, 19.55it/s, acc=88.0859375%]    Epochs:  78%|███████▊  | 194/250 [00:09<00:02, 19.55it/s, acc=88.0859375%]    Epochs:  78%|███████▊  | 194/250 [00:09<00:02, 19.55it/s, acc=88.0859375%]    Epochs:  78%|███████▊  | 194/250 [00:09<00:02, 19.55it/s, acc=88.0859375%]    Epochs:  78%|███████▊  | 194/250 [00:09<00:02, 19.55it/s, acc=88.0859375%]    Epochs:  78%|███████▊  | 194/250 [00:10<00:02, 19.55it/s, acc=88.0859375%]
                                                     Epochs:  78%|███████▊  | 194/250 [00:10<00:02, 19.55it/s, loss=0.351]         Epochs:  78%|███████▊  | 196/250 [00:10<00:02, 19.50it/s, loss=0.351]
    Sample:   0%|          | 0/8 [00:00<?, ?it/s]    Epochs:  78%|███████▊  | 196/250 [00:10<00:02, 19.50it/s, acc=88.0859375%]    Epochs:  78%|███████▊  | 196/250 [00:10<00:02, 19.50it/s, acc=88.0859375%]    Epochs:  78%|███████▊  | 196/250 [00:10<00:02, 19.50it/s, acc=88.0859375%]    Epochs:  78%|███████▊  | 196/250 [00:10<00:02, 19.50it/s, acc=88.0859375%]    Epochs:  78%|███████▊  | 196/250 [00:10<00:02, 19.50it/s, acc=88.0859375%]    Epochs:  78%|███████▊  | 196/250 [00:10<00:02, 19.50it/s, acc=88.0859375%]    Epochs:  78%|███████▊  | 196/250 [00:10<00:02, 19.50it/s, acc=88.0859375%]    Epochs:  78%|███████▊  | 196/250 [00:10<00:02, 19.50it/s, acc=88.0859375%]
                                                     Epochs:  78%|███████▊  | 196/250 [00:10<00:02, 19.50it/s, loss=0.35]      
    Sample:   0%|          | 0/8 [00:00<?, ?it/s]    Epochs:  78%|███████▊  | 196/250 [00:10<00:02, 19.50it/s, acc=88.0859375%]    Epochs:  78%|███████▊  | 196/250 [00:10<00:02, 19.50it/s, acc=88.0859375%]    Epochs:  78%|███████▊  | 196/250 [00:10<00:02, 19.50it/s, acc=88.0859375%]    Epochs:  78%|███████▊  | 196/250 [00:10<00:02, 19.50it/s, acc=88.0859375%]    Epochs:  78%|███████▊  | 196/250 [00:10<00:02, 19.50it/s, acc=88.0859375%]    Epochs:  78%|███████▊  | 196/250 [00:10<00:02, 19.50it/s, acc=88.0859375%]    Epochs:  78%|███████▊  | 196/250 [00:10<00:02, 19.50it/s, acc=88.0859375%]    Epochs:  78%|███████▊  | 196/250 [00:10<00:02, 19.50it/s, acc=88.0859375%]
                                                     Epochs:  78%|███████▊  | 196/250 [00:10<00:02, 19.50it/s, loss=0.349]         Epochs:  79%|███████▉  | 198/250 [00:10<00:02, 19.53it/s, loss=0.349]
    Sample:   0%|          | 0/8 [00:00<?, ?it/s]    Epochs:  79%|███████▉  | 198/250 [00:10<00:02, 19.53it/s, acc=88.0859375%]    Epochs:  79%|███████▉  | 198/250 [00:10<00:02, 19.53it/s, acc=88.0859375%]    Epochs:  79%|███████▉  | 198/250 [00:10<00:02, 19.53it/s, acc=88.0859375%]    Epochs:  79%|███████▉  | 198/250 [00:10<00:02, 19.53it/s, acc=88.0859375%]    Epochs:  79%|███████▉  | 198/250 [00:10<00:02, 19.53it/s, acc=88.0859375%]    Epochs:  79%|███████▉  | 198/250 [00:10<00:02, 19.53it/s, acc=88.0859375%]    Epochs:  79%|███████▉  | 198/250 [00:10<00:02, 19.53it/s, acc=88.0859375%]    Epochs:  79%|███████▉  | 198/250 [00:10<00:02, 19.53it/s, acc=88.0859375%]
                                                     Epochs:  79%|███████▉  | 198/250 [00:10<00:02, 19.53it/s, loss=0.348]     
    Sample:   0%|          | 0/8 [00:00<?, ?it/s]    Epochs:  79%|███████▉  | 198/250 [00:10<00:02, 19.53it/s, acc=88.0859375%]    Epochs:  79%|███████▉  | 198/250 [00:10<00:02, 19.53it/s, acc=88.0859375%]    Epochs:  79%|███████▉  | 198/250 [00:10<00:02, 19.53it/s, acc=88.0859375%]    Epochs:  79%|███████▉  | 198/250 [00:10<00:02, 19.53it/s, acc=88.0859375%]    Epochs:  79%|███████▉  | 198/250 [00:10<00:02, 19.53it/s, acc=88.0859375%]    Epochs:  79%|███████▉  | 198/250 [00:10<00:02, 19.53it/s, acc=88.0859375%]    Epochs:  79%|███████▉  | 198/250 [00:10<00:02, 19.53it/s, acc=88.0859375%]    Epochs:  79%|███████▉  | 198/250 [00:10<00:02, 19.53it/s, acc=88.0859375%]
                                                     Epochs:  79%|███████▉  | 198/250 [00:10<00:02, 19.53it/s, loss=0.348]         Epochs:  80%|████████  | 200/250 [00:10<00:02, 19.58it/s, loss=0.348]
    Sample:   0%|          | 0/8 [00:00<?, ?it/s]    Epochs:  80%|████████  | 200/250 [00:10<00:02, 19.58it/s, acc=88.0859375%]    Epochs:  80%|████████  | 200/250 [00:10<00:02, 19.58it/s, acc=88.0859375%]    Epochs:  80%|████████  | 200/250 [00:10<00:02, 19.58it/s, acc=88.0859375%]    Epochs:  80%|████████  | 200/250 [00:10<00:02, 19.58it/s, acc=88.0859375%]    Epochs:  80%|████████  | 200/250 [00:10<00:02, 19.58it/s, acc=88.0859375%]    Epochs:  80%|████████  | 200/250 [00:10<00:02, 19.58it/s, acc=88.0859375%]    Epochs:  80%|████████  | 200/250 [00:10<00:02, 19.58it/s, acc=88.0859375%]    Epochs:  80%|████████  | 200/250 [00:10<00:02, 19.58it/s, acc=88.0859375%]
                                                     Epochs:  80%|████████  | 200/250 [00:10<00:02, 19.58it/s, loss=0.347]     
    Sample:   0%|          | 0/8 [00:00<?, ?it/s]    Epochs:  80%|████████  | 200/250 [00:10<00:02, 19.58it/s, acc=88.0859375%]    Epochs:  80%|████████  | 200/250 [00:10<00:02, 19.58it/s, acc=88.0859375%]    Epochs:  80%|████████  | 200/250 [00:10<00:02, 19.58it/s, acc=88.0859375%]    Epochs:  80%|████████  | 200/250 [00:10<00:02, 19.58it/s, acc=88.0859375%]    Epochs:  80%|████████  | 200/250 [00:10<00:02, 19.58it/s, acc=88.0859375%]    Epochs:  80%|████████  | 200/250 [00:10<00:02, 19.58it/s, acc=88.0859375%]    Epochs:  80%|████████  | 200/250 [00:10<00:02, 19.58it/s, acc=88.0859375%]    Epochs:  80%|████████  | 200/250 [00:10<00:02, 19.58it/s, acc=88.0859375%]
                                                     Epochs:  80%|████████  | 200/250 [00:10<00:02, 19.58it/s, loss=0.346]         Epochs:  81%|████████  | 202/250 [00:10<00:02, 19.61it/s, loss=0.346]
    Sample:   0%|          | 0/8 [00:00<?, ?it/s]    Epochs:  81%|████████  | 202/250 [00:10<00:02, 19.61it/s, acc=88.0859375%]    Epochs:  81%|████████  | 202/250 [00:10<00:02, 19.61it/s, acc=88.0859375%]    Epochs:  81%|████████  | 202/250 [00:10<00:02, 19.61it/s, acc=88.0859375%]    Epochs:  81%|████████  | 202/250 [00:10<00:02, 19.61it/s, acc=88.0859375%]    Epochs:  81%|████████  | 202/250 [00:10<00:02, 19.61it/s, acc=88.0859375%]    Epochs:  81%|████████  | 202/250 [00:10<00:02, 19.61it/s, acc=88.0859375%]    Epochs:  81%|████████  | 202/250 [00:10<00:02, 19.61it/s, acc=88.0859375%]    Epochs:  81%|████████  | 202/250 [00:10<00:02, 19.61it/s, acc=88.0859375%]
                                                     Epochs:  81%|████████  | 202/250 [00:10<00:02, 19.61it/s, loss=0.346]     
    Sample:   0%|          | 0/8 [00:00<?, ?it/s]    Epochs:  81%|████████  | 202/250 [00:10<00:02, 19.61it/s, acc=88.0859375%]    Epochs:  81%|████████  | 202/250 [00:10<00:02, 19.61it/s, acc=88.0859375%]    Epochs:  81%|████████  | 202/250 [00:10<00:02, 19.61it/s, acc=88.0859375%]    Epochs:  81%|████████  | 202/250 [00:10<00:02, 19.61it/s, acc=88.0859375%]    Epochs:  81%|████████  | 202/250 [00:10<00:02, 19.61it/s, acc=88.0859375%]    Epochs:  81%|████████  | 202/250 [00:10<00:02, 19.61it/s, acc=88.0859375%]    Epochs:  81%|████████  | 202/250 [00:10<00:02, 19.61it/s, acc=88.0859375%]    Epochs:  81%|████████  | 202/250 [00:10<00:02, 19.61it/s, acc=88.0859375%]
                                                     Epochs:  81%|████████  | 202/250 [00:10<00:02, 19.61it/s, loss=0.345]         Epochs:  82%|████████▏ | 204/250 [00:10<00:02, 19.52it/s, loss=0.345]
    Sample:   0%|          | 0/8 [00:00<?, ?it/s]    Epochs:  82%|████████▏ | 204/250 [00:10<00:02, 19.52it/s, acc=88.0859375%]    Epochs:  82%|████████▏ | 204/250 [00:10<00:02, 19.52it/s, acc=88.0859375%]    Epochs:  82%|████████▏ | 204/250 [00:10<00:02, 19.52it/s, acc=88.0859375%]    Epochs:  82%|████████▏ | 204/250 [00:10<00:02, 19.52it/s, acc=88.0859375%]    Epochs:  82%|████████▏ | 204/250 [00:10<00:02, 19.52it/s, acc=88.0859375%]    Epochs:  82%|████████▏ | 204/250 [00:10<00:02, 19.52it/s, acc=88.0859375%]    Epochs:  82%|████████▏ | 204/250 [00:10<00:02, 19.52it/s, acc=88.0859375%]    Epochs:  82%|████████▏ | 204/250 [00:10<00:02, 19.52it/s, acc=88.0859375%]
                                                     Epochs:  82%|████████▏ | 204/250 [00:10<00:02, 19.52it/s, loss=0.345]     
    Sample:   0%|          | 0/8 [00:00<?, ?it/s]    Epochs:  82%|████████▏ | 204/250 [00:10<00:02, 19.52it/s, acc=88.0859375%]    Epochs:  82%|████████▏ | 204/250 [00:10<00:02, 19.52it/s, acc=88.0859375%]    Epochs:  82%|████████▏ | 204/250 [00:10<00:02, 19.52it/s, acc=88.0859375%]    Epochs:  82%|████████▏ | 204/250 [00:10<00:02, 19.52it/s, acc=88.0859375%]    Epochs:  82%|████████▏ | 204/250 [00:10<00:02, 19.52it/s, acc=88.0859375%]    Epochs:  82%|████████▏ | 204/250 [00:10<00:02, 19.52it/s, acc=88.0859375%]    Epochs:  82%|████████▏ | 204/250 [00:10<00:02, 19.52it/s, acc=88.0859375%]    Epochs:  82%|████████▏ | 204/250 [00:10<00:02, 19.52it/s, acc=88.0859375%]
                                                     Epochs:  82%|████████▏ | 204/250 [00:10<00:02, 19.52it/s, loss=0.344]         Epochs:  82%|████████▏ | 206/250 [00:10<00:02, 19.50it/s, loss=0.344]
    Sample:   0%|          | 0/8 [00:00<?, ?it/s]    Epochs:  82%|████████▏ | 206/250 [00:10<00:02, 19.50it/s, acc=88.0859375%]    Epochs:  82%|████████▏ | 206/250 [00:10<00:02, 19.50it/s, acc=88.0859375%]    Epochs:  82%|████████▏ | 206/250 [00:10<00:02, 19.50it/s, acc=88.0859375%]    Epochs:  82%|████████▏ | 206/250 [00:10<00:02, 19.50it/s, acc=88.0859375%]    Epochs:  82%|████████▏ | 206/250 [00:10<00:02, 19.50it/s, acc=88.0859375%]    Epochs:  82%|████████▏ | 206/250 [00:10<00:02, 19.50it/s, acc=88.0859375%]    Epochs:  82%|████████▏ | 206/250 [00:10<00:02, 19.50it/s, acc=88.0859375%]    Epochs:  82%|████████▏ | 206/250 [00:10<00:02, 19.50it/s, acc=88.0859375%]
                                                     Epochs:  82%|████████▏ | 206/250 [00:10<00:02, 19.50it/s, loss=0.343]     
    Sample:   0%|          | 0/8 [00:00<?, ?it/s]    Epochs:  82%|████████▏ | 206/250 [00:10<00:02, 19.50it/s, acc=88.0859375%]    Epochs:  82%|████████▏ | 206/250 [00:10<00:02, 19.50it/s, acc=88.0859375%]    Epochs:  82%|████████▏ | 206/250 [00:10<00:02, 19.50it/s, acc=88.0859375%]    Epochs:  82%|████████▏ | 206/250 [00:10<00:02, 19.50it/s, acc=88.0859375%]    Epochs:  82%|████████▏ | 206/250 [00:10<00:02, 19.50it/s, acc=88.0859375%]    Epochs:  82%|████████▏ | 206/250 [00:10<00:02, 19.50it/s, acc=88.0859375%]    Epochs:  82%|████████▏ | 206/250 [00:10<00:02, 19.50it/s, acc=88.0859375%]    Epochs:  82%|████████▏ | 206/250 [00:10<00:02, 19.50it/s, acc=88.0859375%]
                                                     Epochs:  82%|████████▏ | 206/250 [00:10<00:02, 19.50it/s, loss=0.343]         Epochs:  83%|████████▎ | 208/250 [00:10<00:02, 19.57it/s, loss=0.343]
    Sample:   0%|          | 0/8 [00:00<?, ?it/s]    Epochs:  83%|████████▎ | 208/250 [00:10<00:02, 19.57it/s, acc=88.0859375%]    Epochs:  83%|████████▎ | 208/250 [00:10<00:02, 19.57it/s, acc=88.0859375%]    Epochs:  83%|████████▎ | 208/250 [00:10<00:02, 19.57it/s, acc=88.0859375%]    Epochs:  83%|████████▎ | 208/250 [00:10<00:02, 19.57it/s, acc=88.0859375%]    Epochs:  83%|████████▎ | 208/250 [00:10<00:02, 19.57it/s, acc=88.0859375%]    Epochs:  83%|████████▎ | 208/250 [00:10<00:02, 19.57it/s, acc=88.0859375%]    Epochs:  83%|████████▎ | 208/250 [00:10<00:02, 19.57it/s, acc=88.0859375%]    Epochs:  83%|████████▎ | 208/250 [00:10<00:02, 19.57it/s, acc=88.0859375%]
                                                     Epochs:  83%|████████▎ | 208/250 [00:10<00:02, 19.57it/s, loss=0.342]     
    Sample:   0%|          | 0/8 [00:00<?, ?it/s]    Epochs:  83%|████████▎ | 208/250 [00:10<00:02, 19.57it/s, acc=88.0859375%]    Epochs:  83%|████████▎ | 208/250 [00:10<00:02, 19.57it/s, acc=88.0859375%]    Epochs:  83%|████████▎ | 208/250 [00:10<00:02, 19.57it/s, acc=88.0859375%]    Epochs:  83%|████████▎ | 208/250 [00:10<00:02, 19.57it/s, acc=88.0859375%]    Epochs:  83%|████████▎ | 208/250 [00:10<00:02, 19.57it/s, acc=88.0859375%]    Epochs:  83%|████████▎ | 208/250 [00:10<00:02, 19.57it/s, acc=88.0859375%]    Epochs:  83%|████████▎ | 208/250 [00:10<00:02, 19.57it/s, acc=88.0859375%]    Epochs:  83%|████████▎ | 208/250 [00:10<00:02, 19.57it/s, acc=88.0859375%]
                                                     Epochs:  83%|████████▎ | 208/250 [00:10<00:02, 19.57it/s, loss=0.341]         Epochs:  84%|████████▍ | 210/250 [00:10<00:02, 19.61it/s, loss=0.341]
    Sample:   0%|          | 0/8 [00:00<?, ?it/s]    Epochs:  84%|████████▍ | 210/250 [00:10<00:02, 19.61it/s, acc=88.0859375%]    Epochs:  84%|████████▍ | 210/250 [00:10<00:02, 19.61it/s, acc=88.0859375%]    Epochs:  84%|████████▍ | 210/250 [00:10<00:02, 19.61it/s, acc=88.0859375%]    Epochs:  84%|████████▍ | 210/250 [00:10<00:02, 19.61it/s, acc=88.0859375%]    Epochs:  84%|████████▍ | 210/250 [00:10<00:02, 19.61it/s, acc=88.0859375%]    Epochs:  84%|████████▍ | 210/250 [00:10<00:02, 19.61it/s, acc=88.0859375%]    Epochs:  84%|████████▍ | 210/250 [00:10<00:02, 19.61it/s, acc=88.0859375%]    Epochs:  84%|████████▍ | 210/250 [00:10<00:02, 19.61it/s, acc=88.0859375%]
                                                     Epochs:  84%|████████▍ | 210/250 [00:10<00:02, 19.61it/s, loss=0.341]     
    Sample:   0%|          | 0/8 [00:00<?, ?it/s]    Epochs:  84%|████████▍ | 210/250 [00:10<00:02, 19.61it/s, acc=88.0859375%]    Epochs:  84%|████████▍ | 210/250 [00:10<00:02, 19.61it/s, acc=88.0859375%]    Epochs:  84%|████████▍ | 210/250 [00:10<00:02, 19.61it/s, acc=88.0859375%]    Epochs:  84%|████████▍ | 210/250 [00:10<00:02, 19.61it/s, acc=88.0859375%]    Epochs:  84%|████████▍ | 210/250 [00:10<00:02, 19.61it/s, acc=87.890625%]     Epochs:  84%|████████▍ | 210/250 [00:10<00:02, 19.61it/s, acc=87.6953125%]    Epochs:  84%|████████▍ | 210/250 [00:10<00:02, 19.61it/s, acc=87.890625%]     Epochs:  84%|████████▍ | 210/250 [00:10<00:02, 19.61it/s, acc=87.890625%]
                                                     Epochs:  84%|████████▍ | 210/250 [00:10<00:02, 19.61it/s, loss=0.34]         Epochs:  85%|████████▍ | 212/250 [00:10<00:01, 19.58it/s, loss=0.34]
    Sample:   0%|          | 0/8 [00:00<?, ?it/s]    Epochs:  85%|████████▍ | 212/250 [00:10<00:01, 19.58it/s, acc=87.890625%]    Epochs:  85%|████████▍ | 212/250 [00:10<00:01, 19.58it/s, acc=87.890625%]    Epochs:  85%|████████▍ | 212/250 [00:10<00:01, 19.58it/s, acc=87.890625%]    Epochs:  85%|████████▍ | 212/250 [00:10<00:01, 19.58it/s, acc=87.890625%]    Epochs:  85%|████████▍ | 212/250 [00:10<00:01, 19.58it/s, acc=87.6953125%]    Epochs:  85%|████████▍ | 212/250 [00:10<00:01, 19.58it/s, acc=87.5%]          Epochs:  85%|████████▍ | 212/250 [00:10<00:01, 19.58it/s, acc=87.6953125%]    Epochs:  85%|████████▍ | 212/250 [00:10<00:01, 19.58it/s, acc=87.6953125%]
                                                     Epochs:  85%|████████▍ | 212/250 [00:10<00:01, 19.58it/s, loss=0.34]      
    Sample:   0%|          | 0/8 [00:00<?, ?it/s]    Epochs:  85%|████████▍ | 212/250 [00:10<00:01, 19.58it/s, acc=87.6953125%]    Epochs:  85%|████████▍ | 212/250 [00:10<00:01, 19.58it/s, acc=87.6953125%]    Epochs:  85%|████████▍ | 212/250 [00:10<00:01, 19.58it/s, acc=87.6953125%]    Epochs:  85%|████████▍ | 212/250 [00:10<00:01, 19.58it/s, acc=87.6953125%]    Epochs:  85%|████████▍ | 212/250 [00:10<00:01, 19.58it/s, acc=87.5%]          Epochs:  85%|████████▍ | 212/250 [00:10<00:01, 19.58it/s, acc=87.5%]    Epochs:  85%|████████▍ | 212/250 [00:10<00:01, 19.58it/s, acc=87.5%]    Epochs:  85%|████████▍ | 212/250 [00:10<00:01, 19.58it/s, acc=87.5%]
                                                     Epochs:  85%|████████▍ | 212/250 [00:10<00:01, 19.58it/s, loss=0.339]    Epochs:  86%|████████▌ | 214/250 [00:10<00:01, 19.60it/s, loss=0.339]
    Sample:   0%|          | 0/8 [00:00<?, ?it/s]    Epochs:  86%|████████▌ | 214/250 [00:10<00:01, 19.60it/s, acc=87.5%]     Epochs:  86%|████████▌ | 214/250 [00:10<00:01, 19.60it/s, acc=87.5%]    Epochs:  86%|████████▌ | 214/250 [00:10<00:01, 19.60it/s, acc=87.5%]    Epochs:  86%|████████▌ | 214/250 [00:10<00:01, 19.60it/s, acc=87.5%]    Epochs:  86%|████████▌ | 214/250 [00:10<00:01, 19.60it/s, acc=87.5%]    Epochs:  86%|████████▌ | 214/250 [00:10<00:01, 19.60it/s, acc=87.5%]    Epochs:  86%|████████▌ | 214/250 [00:10<00:01, 19.60it/s, acc=87.5%]    Epochs:  86%|████████▌ | 214/250 [00:10<00:01, 19.60it/s, acc=87.5%]
                                                     Epochs:  86%|████████▌ | 214/250 [00:10<00:01, 19.60it/s, loss=0.339]
    Sample:   0%|          | 0/8 [00:00<?, ?it/s]    Epochs:  86%|████████▌ | 214/250 [00:10<00:01, 19.60it/s, acc=87.5%]     Epochs:  86%|████████▌ | 214/250 [00:10<00:01, 19.60it/s, acc=87.5%]    Epochs:  86%|████████▌ | 214/250 [00:10<00:01, 19.60it/s, acc=87.5%]    Epochs:  86%|████████▌ | 214/250 [00:10<00:01, 19.60it/s, acc=87.5%]    Epochs:  86%|████████▌ | 214/250 [00:11<00:01, 19.60it/s, acc=87.5%]    Epochs:  86%|████████▌ | 214/250 [00:11<00:01, 19.60it/s, acc=87.5%]    Epochs:  86%|████████▌ | 214/250 [00:11<00:01, 19.60it/s, acc=87.5%]    Epochs:  86%|████████▌ | 214/250 [00:11<00:01, 19.60it/s, acc=87.5%]
                                                     Epochs:  86%|████████▌ | 214/250 [00:11<00:01, 19.60it/s, loss=0.338]    Epochs:  86%|████████▋ | 216/250 [00:11<00:01, 19.62it/s, loss=0.338]
    Sample:   0%|          | 0/8 [00:00<?, ?it/s]    Epochs:  86%|████████▋ | 216/250 [00:11<00:01, 19.62it/s, acc=87.5%]     Epochs:  86%|████████▋ | 216/250 [00:11<00:01, 19.62it/s, acc=87.5%]    Epochs:  86%|████████▋ | 216/250 [00:11<00:01, 19.62it/s, acc=87.5%]    Epochs:  86%|████████▋ | 216/250 [00:11<00:01, 19.62it/s, acc=87.5%]    Epochs:  86%|████████▋ | 216/250 [00:11<00:01, 19.62it/s, acc=87.5%]    Epochs:  86%|████████▋ | 216/250 [00:11<00:01, 19.62it/s, acc=87.5%]    Epochs:  86%|████████▋ | 216/250 [00:11<00:01, 19.62it/s, acc=87.5%]    Epochs:  86%|████████▋ | 216/250 [00:11<00:01, 19.62it/s, acc=87.5%]
                                                     Epochs:  86%|████████▋ | 216/250 [00:11<00:01, 19.62it/s, loss=0.337]
    Sample:   0%|          | 0/8 [00:00<?, ?it/s]    Epochs:  86%|████████▋ | 216/250 [00:11<00:01, 19.62it/s, acc=87.5%]     Epochs:  86%|████████▋ | 216/250 [00:11<00:01, 19.62it/s, acc=87.5%]    Epochs:  86%|████████▋ | 216/250 [00:11<00:01, 19.62it/s, acc=87.5%]    Epochs:  86%|████████▋ | 216/250 [00:11<00:01, 19.62it/s, acc=87.5%]    Epochs:  86%|████████▋ | 216/250 [00:11<00:01, 19.62it/s, acc=87.5%]    Epochs:  86%|████████▋ | 216/250 [00:11<00:01, 19.62it/s, acc=87.6953125%]    Epochs:  86%|████████▋ | 216/250 [00:11<00:01, 19.62it/s, acc=87.5%]          Epochs:  86%|████████▋ | 216/250 [00:11<00:01, 19.62it/s, acc=87.5%]
                                                     Epochs:  86%|████████▋ | 216/250 [00:11<00:01, 19.62it/s, loss=0.337]    Epochs:  87%|████████▋ | 218/250 [00:11<00:01, 19.66it/s, loss=0.337]
    Sample:   0%|          | 0/8 [00:00<?, ?it/s]    Epochs:  87%|████████▋ | 218/250 [00:11<00:01, 19.66it/s, acc=87.5%]     Epochs:  87%|████████▋ | 218/250 [00:11<00:01, 19.66it/s, acc=87.5%]    Epochs:  87%|████████▋ | 218/250 [00:11<00:01, 19.66it/s, acc=87.5%]    Epochs:  87%|████████▋ | 218/250 [00:11<00:01, 19.66it/s, acc=87.5%]    Epochs:  87%|████████▋ | 218/250 [00:11<00:01, 19.66it/s, acc=87.5%]    Epochs:  87%|████████▋ | 218/250 [00:11<00:01, 19.66it/s, acc=87.6953125%]    Epochs:  87%|████████▋ | 218/250 [00:11<00:01, 19.66it/s, acc=87.6953125%]    Epochs:  87%|████████▋ | 218/250 [00:11<00:01, 19.66it/s, acc=87.5%]      
                                                     Epochs:  87%|████████▋ | 218/250 [00:11<00:01, 19.66it/s, loss=0.336]
    Sample:   0%|          | 0/8 [00:00<?, ?it/s]    Epochs:  87%|████████▋ | 218/250 [00:11<00:01, 19.66it/s, acc=87.6953125%]    Epochs:  87%|████████▋ | 218/250 [00:11<00:01, 19.66it/s, acc=87.5%]          Epochs:  87%|████████▋ | 218/250 [00:11<00:01, 19.66it/s, acc=87.5%]    Epochs:  87%|████████▋ | 218/250 [00:11<00:01, 19.66it/s, acc=87.5%]    Epochs:  87%|████████▋ | 218/250 [00:11<00:01, 19.66it/s, acc=87.6953125%]    Epochs:  87%|████████▋ | 218/250 [00:11<00:01, 19.66it/s, acc=87.6953125%]    Epochs:  87%|████████▋ | 218/250 [00:11<00:01, 19.66it/s, acc=87.6953125%]    Epochs:  87%|████████▋ | 218/250 [00:11<00:01, 19.66it/s, acc=87.6953125%]
                                                     Epochs:  87%|████████▋ | 218/250 [00:11<00:01, 19.66it/s, loss=0.336]         Epochs:  88%|████████▊ | 220/250 [00:11<00:01, 19.64it/s, loss=0.336]
    Sample:   0%|          | 0/8 [00:00<?, ?it/s]    Epochs:  88%|████████▊ | 220/250 [00:11<00:01, 19.64it/s, acc=87.6953125%]    Epochs:  88%|████████▊ | 220/250 [00:11<00:01, 19.64it/s, acc=87.6953125%]    Epochs:  88%|████████▊ | 220/250 [00:11<00:01, 19.64it/s, acc=87.6953125%]    Epochs:  88%|████████▊ | 220/250 [00:11<00:01, 19.64it/s, acc=87.6953125%]    Epochs:  88%|████████▊ | 220/250 [00:11<00:01, 19.64it/s, acc=87.6953125%]    Epochs:  88%|████████▊ | 220/250 [00:11<00:01, 19.64it/s, acc=87.6953125%]    Epochs:  88%|████████▊ | 220/250 [00:11<00:01, 19.64it/s, acc=87.6953125%]    Epochs:  88%|████████▊ | 220/250 [00:11<00:01, 19.64it/s, acc=87.6953125%]
                                                     Epochs:  88%|████████▊ | 220/250 [00:11<00:01, 19.64it/s, loss=0.335]     
    Sample:   0%|          | 0/8 [00:00<?, ?it/s]    Epochs:  88%|████████▊ | 220/250 [00:11<00:01, 19.64it/s, acc=87.6953125%]    Epochs:  88%|████████▊ | 220/250 [00:11<00:01, 19.64it/s, acc=87.6953125%]    Epochs:  88%|████████▊ | 220/250 [00:11<00:01, 19.64it/s, acc=87.6953125%]    Epochs:  88%|████████▊ | 220/250 [00:11<00:01, 19.64it/s, acc=87.6953125%]    Epochs:  88%|████████▊ | 220/250 [00:11<00:01, 19.64it/s, acc=87.6953125%]    Epochs:  88%|████████▊ | 220/250 [00:11<00:01, 19.64it/s, acc=87.6953125%]    Epochs:  88%|████████▊ | 220/250 [00:11<00:01, 19.64it/s, acc=87.6953125%]    Epochs:  88%|████████▊ | 220/250 [00:11<00:01, 19.64it/s, acc=87.6953125%]
                                                     Epochs:  88%|████████▊ | 220/250 [00:11<00:01, 19.64it/s, loss=0.335]         Epochs:  89%|████████▉ | 222/250 [00:11<00:01, 19.66it/s, loss=0.335]
    Sample:   0%|          | 0/8 [00:00<?, ?it/s]    Epochs:  89%|████████▉ | 222/250 [00:11<00:01, 19.66it/s, acc=87.6953125%]    Epochs:  89%|████████▉ | 222/250 [00:11<00:01, 19.66it/s, acc=87.6953125%]    Epochs:  89%|████████▉ | 222/250 [00:11<00:01, 19.66it/s, acc=87.6953125%]    Epochs:  89%|████████▉ | 222/250 [00:11<00:01, 19.66it/s, acc=87.6953125%]    Epochs:  89%|████████▉ | 222/250 [00:11<00:01, 19.66it/s, acc=87.6953125%]    Epochs:  89%|████████▉ | 222/250 [00:11<00:01, 19.66it/s, acc=87.6953125%]    Epochs:  89%|████████▉ | 222/250 [00:11<00:01, 19.66it/s, acc=87.6953125%]    Epochs:  89%|████████▉ | 222/250 [00:11<00:01, 19.66it/s, acc=87.6953125%]
                                                     Epochs:  89%|████████▉ | 222/250 [00:11<00:01, 19.66it/s, loss=0.334]     
    Sample:   0%|          | 0/8 [00:00<?, ?it/s]    Epochs:  89%|████████▉ | 222/250 [00:11<00:01, 19.66it/s, acc=87.6953125%]    Epochs:  89%|████████▉ | 222/250 [00:11<00:01, 19.66it/s, acc=87.6953125%]    Epochs:  89%|████████▉ | 222/250 [00:11<00:01, 19.66it/s, acc=87.6953125%]    Epochs:  89%|████████▉ | 222/250 [00:11<00:01, 19.66it/s, acc=87.6953125%]    Epochs:  89%|████████▉ | 222/250 [00:11<00:01, 19.66it/s, acc=87.6953125%]    Epochs:  89%|████████▉ | 222/250 [00:11<00:01, 19.66it/s, acc=87.6953125%]    Epochs:  89%|████████▉ | 222/250 [00:11<00:01, 19.66it/s, acc=87.6953125%]    Epochs:  89%|████████▉ | 222/250 [00:11<00:01, 19.66it/s, acc=87.6953125%]
                                                     Epochs:  89%|████████▉ | 222/250 [00:11<00:01, 19.66it/s, loss=0.334]         Epochs:  90%|████████▉ | 224/250 [00:11<00:01, 19.67it/s, loss=0.334]
    Sample:   0%|          | 0/8 [00:00<?, ?it/s]    Epochs:  90%|████████▉ | 224/250 [00:11<00:01, 19.67it/s, acc=87.6953125%]    Epochs:  90%|████████▉ | 224/250 [00:11<00:01, 19.67it/s, acc=87.6953125%]    Epochs:  90%|████████▉ | 224/250 [00:11<00:01, 19.67it/s, acc=87.6953125%]    Epochs:  90%|████████▉ | 224/250 [00:11<00:01, 19.67it/s, acc=87.6953125%]    Epochs:  90%|████████▉ | 224/250 [00:11<00:01, 19.67it/s, acc=87.6953125%]    Epochs:  90%|████████▉ | 224/250 [00:11<00:01, 19.67it/s, acc=87.6953125%]    Epochs:  90%|████████▉ | 224/250 [00:11<00:01, 19.67it/s, acc=87.6953125%]    Epochs:  90%|████████▉ | 224/250 [00:11<00:01, 19.67it/s, acc=87.6953125%]
                                                     Epochs:  90%|████████▉ | 224/250 [00:11<00:01, 19.67it/s, loss=0.333]     
    Sample:   0%|          | 0/8 [00:00<?, ?it/s]    Epochs:  90%|████████▉ | 224/250 [00:11<00:01, 19.67it/s, acc=87.6953125%]    Epochs:  90%|████████▉ | 224/250 [00:11<00:01, 19.67it/s, acc=87.6953125%]    Epochs:  90%|████████▉ | 224/250 [00:11<00:01, 19.67it/s, acc=87.6953125%]    Epochs:  90%|████████▉ | 224/250 [00:11<00:01, 19.67it/s, acc=87.6953125%]    Epochs:  90%|████████▉ | 224/250 [00:11<00:01, 19.67it/s, acc=87.6953125%]    Epochs:  90%|████████▉ | 224/250 [00:11<00:01, 19.67it/s, acc=87.6953125%]    Epochs:  90%|████████▉ | 224/250 [00:11<00:01, 19.67it/s, acc=87.6953125%]    Epochs:  90%|████████▉ | 224/250 [00:11<00:01, 19.67it/s, acc=87.6953125%]
                                                     Epochs:  90%|████████▉ | 224/250 [00:11<00:01, 19.67it/s, loss=0.333]         Epochs:  90%|█████████ | 226/250 [00:11<00:01, 19.56it/s, loss=0.333]
    Sample:   0%|          | 0/8 [00:00<?, ?it/s]    Epochs:  90%|█████████ | 226/250 [00:11<00:01, 19.56it/s, acc=87.6953125%]    Epochs:  90%|█████████ | 226/250 [00:11<00:01, 19.56it/s, acc=87.6953125%]    Epochs:  90%|█████████ | 226/250 [00:11<00:01, 19.56it/s, acc=87.6953125%]    Epochs:  90%|█████████ | 226/250 [00:11<00:01, 19.56it/s, acc=87.6953125%]    Epochs:  90%|█████████ | 226/250 [00:11<00:01, 19.56it/s, acc=87.6953125%]    Epochs:  90%|█████████ | 226/250 [00:11<00:01, 19.56it/s, acc=87.6953125%]    Epochs:  90%|█████████ | 226/250 [00:11<00:01, 19.56it/s, acc=87.6953125%]    Epochs:  90%|█████████ | 226/250 [00:11<00:01, 19.56it/s, acc=87.6953125%]
                                                     Epochs:  90%|█████████ | 226/250 [00:11<00:01, 19.56it/s, loss=0.332]     
    Sample:   0%|          | 0/8 [00:00<?, ?it/s]    Epochs:  90%|█████████ | 226/250 [00:11<00:01, 19.56it/s, acc=87.6953125%]    Epochs:  90%|█████████ | 226/250 [00:11<00:01, 19.56it/s, acc=87.6953125%]    Epochs:  90%|█████████ | 226/250 [00:11<00:01, 19.56it/s, acc=87.6953125%]    Epochs:  90%|█████████ | 226/250 [00:11<00:01, 19.56it/s, acc=87.6953125%]    Epochs:  90%|█████████ | 226/250 [00:11<00:01, 19.56it/s, acc=87.6953125%]    Epochs:  90%|█████████ | 226/250 [00:11<00:01, 19.56it/s, acc=87.6953125%]    Epochs:  90%|█████████ | 226/250 [00:11<00:01, 19.56it/s, acc=87.6953125%]    Epochs:  90%|█████████ | 226/250 [00:11<00:01, 19.56it/s, acc=87.6953125%]
                                                     Epochs:  90%|█████████ | 226/250 [00:11<00:01, 19.56it/s, loss=0.332]         Epochs:  91%|█████████ | 228/250 [00:11<00:01, 19.53it/s, loss=0.332]
    Sample:   0%|          | 0/8 [00:00<?, ?it/s]    Epochs:  91%|█████████ | 228/250 [00:11<00:01, 19.53it/s, acc=87.6953125%]    Epochs:  91%|█████████ | 228/250 [00:11<00:01, 19.53it/s, acc=87.6953125%]    Epochs:  91%|█████████ | 228/250 [00:11<00:01, 19.53it/s, acc=87.6953125%]    Epochs:  91%|█████████ | 228/250 [00:11<00:01, 19.53it/s, acc=87.6953125%]    Epochs:  91%|█████████ | 228/250 [00:11<00:01, 19.53it/s, acc=87.6953125%]    Epochs:  91%|█████████ | 228/250 [00:11<00:01, 19.53it/s, acc=87.6953125%]    Epochs:  91%|█████████ | 228/250 [00:11<00:01, 19.53it/s, acc=87.6953125%]    Epochs:  91%|█████████ | 228/250 [00:11<00:01, 19.53it/s, acc=87.6953125%]
                                                     Epochs:  91%|█████████ | 228/250 [00:11<00:01, 19.53it/s, loss=0.331]     
    Sample:   0%|          | 0/8 [00:00<?, ?it/s]    Epochs:  91%|█████████ | 228/250 [00:11<00:01, 19.53it/s, acc=87.6953125%]    Epochs:  91%|█████████ | 228/250 [00:11<00:01, 19.53it/s, acc=87.6953125%]    Epochs:  91%|█████████ | 228/250 [00:11<00:01, 19.53it/s, acc=87.6953125%]    Epochs:  91%|█████████ | 228/250 [00:11<00:01, 19.53it/s, acc=87.6953125%]    Epochs:  91%|█████████ | 228/250 [00:11<00:01, 19.53it/s, acc=87.6953125%]    Epochs:  91%|█████████ | 228/250 [00:11<00:01, 19.53it/s, acc=87.6953125%]    Epochs:  91%|█████████ | 228/250 [00:11<00:01, 19.53it/s, acc=87.6953125%]    Epochs:  91%|█████████ | 228/250 [00:11<00:01, 19.53it/s, acc=87.6953125%]
                                                     Epochs:  91%|█████████ | 228/250 [00:11<00:01, 19.53it/s, loss=0.331]         Epochs:  92%|█████████▏| 230/250 [00:11<00:01, 19.52it/s, loss=0.331]
    Sample:   0%|          | 0/8 [00:00<?, ?it/s]    Epochs:  92%|█████████▏| 230/250 [00:11<00:01, 19.52it/s, acc=87.6953125%]    Epochs:  92%|█████████▏| 230/250 [00:11<00:01, 19.52it/s, acc=87.6953125%]    Epochs:  92%|█████████▏| 230/250 [00:11<00:01, 19.52it/s, acc=87.6953125%]    Epochs:  92%|█████████▏| 230/250 [00:11<00:01, 19.52it/s, acc=87.6953125%]    Epochs:  92%|█████████▏| 230/250 [00:11<00:01, 19.52it/s, acc=87.6953125%]    Epochs:  92%|█████████▏| 230/250 [00:11<00:01, 19.52it/s, acc=87.6953125%]    Epochs:  92%|█████████▏| 230/250 [00:11<00:01, 19.52it/s, acc=87.6953125%]    Epochs:  92%|█████████▏| 230/250 [00:11<00:01, 19.52it/s, acc=87.6953125%]
                                                     Epochs:  92%|█████████▏| 230/250 [00:11<00:01, 19.52it/s, loss=0.33]      
    Sample:   0%|          | 0/8 [00:00<?, ?it/s]    Epochs:  92%|█████████▏| 230/250 [00:11<00:01, 19.52it/s, acc=87.6953125%]    Epochs:  92%|█████████▏| 230/250 [00:11<00:01, 19.52it/s, acc=87.6953125%]    Epochs:  92%|█████████▏| 230/250 [00:11<00:01, 19.52it/s, acc=87.6953125%]    Epochs:  92%|█████████▏| 230/250 [00:11<00:01, 19.52it/s, acc=87.6953125%]    Epochs:  92%|█████████▏| 230/250 [00:11<00:01, 19.52it/s, acc=87.6953125%]    Epochs:  92%|█████████▏| 230/250 [00:11<00:01, 19.52it/s, acc=87.6953125%]    Epochs:  92%|█████████▏| 230/250 [00:11<00:01, 19.52it/s, acc=87.6953125%]    Epochs:  92%|█████████▏| 230/250 [00:11<00:01, 19.52it/s, acc=87.6953125%]
                                                     Epochs:  92%|█████████▏| 230/250 [00:11<00:01, 19.52it/s, loss=0.33]          Epochs:  93%|█████████▎| 232/250 [00:11<00:00, 19.58it/s, loss=0.33]
    Sample:   0%|          | 0/8 [00:00<?, ?it/s]    Epochs:  93%|█████████▎| 232/250 [00:11<00:00, 19.58it/s, acc=87.6953125%]    Epochs:  93%|█████████▎| 232/250 [00:11<00:00, 19.58it/s, acc=87.6953125%]    Epochs:  93%|█████████▎| 232/250 [00:11<00:00, 19.58it/s, acc=87.6953125%]    Epochs:  93%|█████████▎| 232/250 [00:11<00:00, 19.58it/s, acc=87.6953125%]    Epochs:  93%|█████████▎| 232/250 [00:11<00:00, 19.58it/s, acc=87.6953125%]    Epochs:  93%|█████████▎| 232/250 [00:11<00:00, 19.58it/s, acc=87.6953125%]    Epochs:  93%|█████████▎| 232/250 [00:11<00:00, 19.58it/s, acc=87.6953125%]    Epochs:  93%|█████████▎| 232/250 [00:11<00:00, 19.58it/s, acc=87.6953125%]
                                                     Epochs:  93%|█████████▎| 232/250 [00:11<00:00, 19.58it/s, loss=0.33]      
    Sample:   0%|          | 0/8 [00:00<?, ?it/s]    Epochs:  93%|█████████▎| 232/250 [00:11<00:00, 19.58it/s, acc=87.6953125%]    Epochs:  93%|█████████▎| 232/250 [00:11<00:00, 19.58it/s, acc=87.6953125%]    Epochs:  93%|█████████▎| 232/250 [00:11<00:00, 19.58it/s, acc=87.6953125%]    Epochs:  93%|█████████▎| 232/250 [00:11<00:00, 19.58it/s, acc=87.6953125%]    Epochs:  93%|█████████▎| 232/250 [00:11<00:00, 19.58it/s, acc=87.6953125%]    Epochs:  93%|█████████▎| 232/250 [00:11<00:00, 19.58it/s, acc=87.6953125%]    Epochs:  93%|█████████▎| 232/250 [00:11<00:00, 19.58it/s, acc=87.6953125%]    Epochs:  93%|█████████▎| 232/250 [00:11<00:00, 19.58it/s, acc=87.6953125%]
                                                     Epochs:  93%|█████████▎| 232/250 [00:11<00:00, 19.58it/s, loss=0.329]         Epochs:  94%|█████████▎| 234/250 [00:11<00:00, 19.63it/s, loss=0.329]
    Sample:   0%|          | 0/8 [00:00<?, ?it/s]    Epochs:  94%|█████████▎| 234/250 [00:11<00:00, 19.63it/s, acc=87.6953125%]    Epochs:  94%|█████████▎| 234/250 [00:11<00:00, 19.63it/s, acc=87.6953125%]    Epochs:  94%|█████████▎| 234/250 [00:11<00:00, 19.63it/s, acc=87.6953125%]    Epochs:  94%|█████████▎| 234/250 [00:11<00:00, 19.63it/s, acc=87.6953125%]    Epochs:  94%|█████████▎| 234/250 [00:11<00:00, 19.63it/s, acc=87.6953125%]    Epochs:  94%|█████████▎| 234/250 [00:11<00:00, 19.63it/s, acc=87.6953125%]    Epochs:  94%|█████████▎| 234/250 [00:11<00:00, 19.63it/s, acc=87.6953125%]    Epochs:  94%|█████████▎| 234/250 [00:11<00:00, 19.63it/s, acc=87.6953125%]
                                                     Epochs:  94%|█████████▎| 234/250 [00:11<00:00, 19.63it/s, loss=0.329]     
    Sample:   0%|          | 0/8 [00:00<?, ?it/s]    Epochs:  94%|█████████▎| 234/250 [00:11<00:00, 19.63it/s, acc=87.6953125%]    Epochs:  94%|█████████▎| 234/250 [00:12<00:00, 19.63it/s, acc=87.6953125%]    Epochs:  94%|█████████▎| 234/250 [00:12<00:00, 19.63it/s, acc=87.6953125%]    Epochs:  94%|█████████▎| 234/250 [00:12<00:00, 19.63it/s, acc=87.6953125%]    Epochs:  94%|█████████▎| 234/250 [00:12<00:00, 19.63it/s, acc=87.6953125%]    Epochs:  94%|█████████▎| 234/250 [00:12<00:00, 19.63it/s, acc=87.6953125%]    Epochs:  94%|█████████▎| 234/250 [00:12<00:00, 19.63it/s, acc=87.6953125%]    Epochs:  94%|█████████▎| 234/250 [00:12<00:00, 19.63it/s, acc=87.6953125%]
                                                     Epochs:  94%|█████████▎| 234/250 [00:12<00:00, 19.63it/s, loss=0.328]         Epochs:  94%|█████████▍| 236/250 [00:12<00:00, 19.55it/s, loss=0.328]
    Sample:   0%|          | 0/8 [00:00<?, ?it/s]    Epochs:  94%|█████████▍| 236/250 [00:12<00:00, 19.55it/s, acc=87.6953125%]    Epochs:  94%|█████████▍| 236/250 [00:12<00:00, 19.55it/s, acc=87.6953125%]    Epochs:  94%|█████████▍| 236/250 [00:12<00:00, 19.55it/s, acc=87.6953125%]    Epochs:  94%|█████████▍| 236/250 [00:12<00:00, 19.55it/s, acc=87.6953125%]    Epochs:  94%|█████████▍| 236/250 [00:12<00:00, 19.55it/s, acc=87.6953125%]    Epochs:  94%|█████████▍| 236/250 [00:12<00:00, 19.55it/s, acc=87.6953125%]    Epochs:  94%|█████████▍| 236/250 [00:12<00:00, 19.55it/s, acc=87.6953125%]    Epochs:  94%|█████████▍| 236/250 [00:12<00:00, 19.55it/s, acc=87.6953125%]
                                                     Epochs:  94%|█████████▍| 236/250 [00:12<00:00, 19.55it/s, loss=0.328]     
    Sample:   0%|          | 0/8 [00:00<?, ?it/s]    Epochs:  94%|█████████▍| 236/250 [00:12<00:00, 19.55it/s, acc=87.6953125%]    Epochs:  94%|█████████▍| 236/250 [00:12<00:00, 19.55it/s, acc=87.6953125%]    Epochs:  94%|█████████▍| 236/250 [00:12<00:00, 19.55it/s, acc=87.6953125%]    Epochs:  94%|█████████▍| 236/250 [00:12<00:00, 19.55it/s, acc=87.6953125%]    Epochs:  94%|█████████▍| 236/250 [00:12<00:00, 19.55it/s, acc=87.6953125%]    Epochs:  94%|█████████▍| 236/250 [00:12<00:00, 19.55it/s, acc=87.6953125%]    Epochs:  94%|█████████▍| 236/250 [00:12<00:00, 19.55it/s, acc=87.6953125%]    Epochs:  94%|█████████▍| 236/250 [00:12<00:00, 19.55it/s, acc=87.6953125%]
                                                     Epochs:  94%|█████████▍| 236/250 [00:12<00:00, 19.55it/s, loss=0.327]         Epochs:  95%|█████████▌| 238/250 [00:12<00:00, 19.55it/s, loss=0.327]
    Sample:   0%|          | 0/8 [00:00<?, ?it/s]    Epochs:  95%|█████████▌| 238/250 [00:12<00:00, 19.55it/s, acc=87.6953125%]    Epochs:  95%|█████████▌| 238/250 [00:12<00:00, 19.55it/s, acc=87.6953125%]    Epochs:  95%|█████████▌| 238/250 [00:12<00:00, 19.55it/s, acc=87.6953125%]    Epochs:  95%|█████████▌| 238/250 [00:12<00:00, 19.55it/s, acc=87.6953125%]    Epochs:  95%|█████████▌| 238/250 [00:12<00:00, 19.55it/s, acc=87.6953125%]    Epochs:  95%|█████████▌| 238/250 [00:12<00:00, 19.55it/s, acc=87.6953125%]    Epochs:  95%|█████████▌| 238/250 [00:12<00:00, 19.55it/s, acc=87.6953125%]    Epochs:  95%|█████████▌| 238/250 [00:12<00:00, 19.55it/s, acc=87.6953125%]
                                                     Epochs:  95%|█████████▌| 238/250 [00:12<00:00, 19.55it/s, loss=0.327]     
    Sample:   0%|          | 0/8 [00:00<?, ?it/s]    Epochs:  95%|█████████▌| 238/250 [00:12<00:00, 19.55it/s, acc=87.6953125%]    Epochs:  95%|█████████▌| 238/250 [00:12<00:00, 19.55it/s, acc=87.6953125%]    Epochs:  95%|█████████▌| 238/250 [00:12<00:00, 19.55it/s, acc=87.6953125%]    Epochs:  95%|█████████▌| 238/250 [00:12<00:00, 19.55it/s, acc=87.6953125%]    Epochs:  95%|█████████▌| 238/250 [00:12<00:00, 19.55it/s, acc=87.6953125%]    Epochs:  95%|█████████▌| 238/250 [00:12<00:00, 19.55it/s, acc=87.6953125%]    Epochs:  95%|█████████▌| 238/250 [00:12<00:00, 19.55it/s, acc=87.6953125%]    Epochs:  95%|█████████▌| 238/250 [00:12<00:00, 19.55it/s, acc=87.6953125%]
                                                     Epochs:  95%|█████████▌| 238/250 [00:12<00:00, 19.55it/s, loss=0.326]         Epochs:  96%|█████████▌| 240/250 [00:12<00:00, 19.59it/s, loss=0.326]
    Sample:   0%|          | 0/8 [00:00<?, ?it/s]    Epochs:  96%|█████████▌| 240/250 [00:12<00:00, 19.59it/s, acc=87.6953125%]    Epochs:  96%|█████████▌| 240/250 [00:12<00:00, 19.59it/s, acc=87.6953125%]    Epochs:  96%|█████████▌| 240/250 [00:12<00:00, 19.59it/s, acc=87.6953125%]    Epochs:  96%|█████████▌| 240/250 [00:12<00:00, 19.59it/s, acc=87.6953125%]    Epochs:  96%|█████████▌| 240/250 [00:12<00:00, 19.59it/s, acc=87.6953125%]    Epochs:  96%|█████████▌| 240/250 [00:12<00:00, 19.59it/s, acc=87.6953125%]    Epochs:  96%|█████████▌| 240/250 [00:12<00:00, 19.59it/s, acc=87.6953125%]    Epochs:  96%|█████████▌| 240/250 [00:12<00:00, 19.59it/s, acc=87.6953125%]
                                                     Epochs:  96%|█████████▌| 240/250 [00:12<00:00, 19.59it/s, loss=0.326]     
    Sample:   0%|          | 0/8 [00:00<?, ?it/s]    Epochs:  96%|█████████▌| 240/250 [00:12<00:00, 19.59it/s, acc=87.6953125%]    Epochs:  96%|█████████▌| 240/250 [00:12<00:00, 19.59it/s, acc=87.6953125%]    Epochs:  96%|█████████▌| 240/250 [00:12<00:00, 19.59it/s, acc=87.6953125%]    Epochs:  96%|█████████▌| 240/250 [00:12<00:00, 19.59it/s, acc=87.6953125%]    Epochs:  96%|█████████▌| 240/250 [00:12<00:00, 19.59it/s, acc=87.6953125%]    Epochs:  96%|█████████▌| 240/250 [00:12<00:00, 19.59it/s, acc=87.6953125%]    Epochs:  96%|█████████▌| 240/250 [00:12<00:00, 19.59it/s, acc=87.6953125%]    Epochs:  96%|█████████▌| 240/250 [00:12<00:00, 19.59it/s, acc=87.6953125%]
                                                     Epochs:  96%|█████████▌| 240/250 [00:12<00:00, 19.59it/s, loss=0.326]         Epochs:  97%|█████████▋| 242/250 [00:12<00:00, 19.43it/s, loss=0.326]
    Sample:   0%|          | 0/8 [00:00<?, ?it/s]    Epochs:  97%|█████████▋| 242/250 [00:12<00:00, 19.43it/s, acc=87.6953125%]    Epochs:  97%|█████████▋| 242/250 [00:12<00:00, 19.43it/s, acc=87.6953125%]    Epochs:  97%|█████████▋| 242/250 [00:12<00:00, 19.43it/s, acc=87.6953125%]    Epochs:  97%|█████████▋| 242/250 [00:12<00:00, 19.43it/s, acc=87.6953125%]    Epochs:  97%|█████████▋| 242/250 [00:12<00:00, 19.43it/s, acc=87.6953125%]    Epochs:  97%|█████████▋| 242/250 [00:12<00:00, 19.43it/s, acc=87.6953125%]    Epochs:  97%|█████████▋| 242/250 [00:12<00:00, 19.43it/s, acc=87.6953125%]    Epochs:  97%|█████████▋| 242/250 [00:12<00:00, 19.43it/s, acc=87.6953125%]
                                                     Epochs:  97%|█████████▋| 242/250 [00:12<00:00, 19.43it/s, loss=0.325]     
    Sample:   0%|          | 0/8 [00:00<?, ?it/s]    Epochs:  97%|█████████▋| 242/250 [00:12<00:00, 19.43it/s, acc=87.6953125%]    Epochs:  97%|█████████▋| 242/250 [00:12<00:00, 19.43it/s, acc=87.6953125%]    Epochs:  97%|█████████▋| 242/250 [00:12<00:00, 19.43it/s, acc=87.6953125%]    Epochs:  97%|█████████▋| 242/250 [00:12<00:00, 19.43it/s, acc=87.6953125%]    Epochs:  97%|█████████▋| 242/250 [00:12<00:00, 19.43it/s, acc=87.6953125%]    Epochs:  97%|█████████▋| 242/250 [00:12<00:00, 19.43it/s, acc=87.6953125%]    Epochs:  97%|█████████▋| 242/250 [00:12<00:00, 19.43it/s, acc=87.6953125%]    Epochs:  97%|█████████▋| 242/250 [00:12<00:00, 19.43it/s, acc=87.6953125%]
                                                     Epochs:  97%|█████████▋| 242/250 [00:12<00:00, 19.43it/s, loss=0.325]         Epochs:  98%|█████████▊| 244/250 [00:12<00:00, 19.38it/s, loss=0.325]
    Sample:   0%|          | 0/8 [00:00<?, ?it/s]    Epochs:  98%|█████████▊| 244/250 [00:12<00:00, 19.38it/s, acc=87.6953125%]    Epochs:  98%|█████████▊| 244/250 [00:12<00:00, 19.38it/s, acc=87.6953125%]    Epochs:  98%|█████████▊| 244/250 [00:12<00:00, 19.38it/s, acc=87.6953125%]    Epochs:  98%|█████████▊| 244/250 [00:12<00:00, 19.38it/s, acc=87.6953125%]    Epochs:  98%|█████████▊| 244/250 [00:12<00:00, 19.38it/s, acc=87.6953125%]    Epochs:  98%|█████████▊| 244/250 [00:12<00:00, 19.38it/s, acc=87.6953125%]    Epochs:  98%|█████████▊| 244/250 [00:12<00:00, 19.38it/s, acc=87.6953125%]    Epochs:  98%|█████████▊| 244/250 [00:12<00:00, 19.38it/s, acc=87.6953125%]
                                                     Epochs:  98%|█████████▊| 244/250 [00:12<00:00, 19.38it/s, loss=0.324]     
    Sample:   0%|          | 0/8 [00:00<?, ?it/s]    Epochs:  98%|█████████▊| 244/250 [00:12<00:00, 19.38it/s, acc=87.6953125%]    Epochs:  98%|█████████▊| 244/250 [00:12<00:00, 19.38it/s, acc=87.6953125%]    Epochs:  98%|█████████▊| 244/250 [00:12<00:00, 19.38it/s, acc=87.6953125%]    Epochs:  98%|█████████▊| 244/250 [00:12<00:00, 19.38it/s, acc=87.6953125%]    Epochs:  98%|█████████▊| 244/250 [00:12<00:00, 19.38it/s, acc=87.6953125%]    Epochs:  98%|█████████▊| 244/250 [00:12<00:00, 19.38it/s, acc=87.6953125%]    Epochs:  98%|█████████▊| 244/250 [00:12<00:00, 19.38it/s, acc=87.6953125%]    Epochs:  98%|█████████▊| 244/250 [00:12<00:00, 19.38it/s, acc=87.6953125%]
                                                     Epochs:  98%|█████████▊| 244/250 [00:12<00:00, 19.38it/s, loss=0.324]         Epochs:  98%|█████████▊| 246/250 [00:12<00:00, 19.36it/s, loss=0.324]
    Sample:   0%|          | 0/8 [00:00<?, ?it/s]    Epochs:  98%|█████████▊| 246/250 [00:12<00:00, 19.36it/s, acc=87.6953125%]    Epochs:  98%|█████████▊| 246/250 [00:12<00:00, 19.36it/s, acc=87.6953125%]    Epochs:  98%|█████████▊| 246/250 [00:12<00:00, 19.36it/s, acc=87.6953125%]    Epochs:  98%|█████████▊| 246/250 [00:12<00:00, 19.36it/s, acc=87.6953125%]    Epochs:  98%|█████████▊| 246/250 [00:12<00:00, 19.36it/s, acc=87.6953125%]    Epochs:  98%|█████████▊| 246/250 [00:12<00:00, 19.36it/s, acc=87.6953125%]    Epochs:  98%|█████████▊| 246/250 [00:12<00:00, 19.36it/s, acc=87.6953125%]    Epochs:  98%|█████████▊| 246/250 [00:12<00:00, 19.36it/s, acc=87.6953125%]
                                                     Epochs:  98%|█████████▊| 246/250 [00:12<00:00, 19.36it/s, loss=0.324]     
    Sample:   0%|          | 0/8 [00:00<?, ?it/s]    Epochs:  98%|█████████▊| 246/250 [00:12<00:00, 19.36it/s, acc=87.6953125%]    Epochs:  98%|█████████▊| 246/250 [00:12<00:00, 19.36it/s, acc=87.6953125%]    Epochs:  98%|█████████▊| 246/250 [00:12<00:00, 19.36it/s, acc=87.6953125%]    Epochs:  98%|█████████▊| 246/250 [00:12<00:00, 19.36it/s, acc=87.6953125%]    Epochs:  98%|█████████▊| 246/250 [00:12<00:00, 19.36it/s, acc=87.6953125%]    Epochs:  98%|█████████▊| 246/250 [00:12<00:00, 19.36it/s, acc=87.6953125%]    Epochs:  98%|█████████▊| 246/250 [00:12<00:00, 19.36it/s, acc=87.6953125%]    Epochs:  98%|█████████▊| 246/250 [00:12<00:00, 19.36it/s, acc=87.6953125%]
                                                     Epochs:  98%|█████████▊| 246/250 [00:12<00:00, 19.36it/s, loss=0.323]         Epochs:  99%|█████████▉| 248/250 [00:12<00:00, 19.46it/s, loss=0.323]
    Sample:   0%|          | 0/8 [00:00<?, ?it/s]    Epochs:  99%|█████████▉| 248/250 [00:12<00:00, 19.46it/s, acc=87.6953125%]    Epochs:  99%|█████████▉| 248/250 [00:12<00:00, 19.46it/s, acc=87.6953125%]    Epochs:  99%|█████████▉| 248/250 [00:12<00:00, 19.46it/s, acc=87.6953125%]    Epochs:  99%|█████████▉| 248/250 [00:12<00:00, 19.46it/s, acc=87.6953125%]    Epochs:  99%|█████████▉| 248/250 [00:12<00:00, 19.46it/s, acc=87.6953125%]    Epochs:  99%|█████████▉| 248/250 [00:12<00:00, 19.46it/s, acc=87.6953125%]    Epochs:  99%|█████████▉| 248/250 [00:12<00:00, 19.46it/s, acc=87.6953125%]    Epochs:  99%|█████████▉| 248/250 [00:12<00:00, 19.46it/s, acc=87.6953125%]
                                                     Epochs:  99%|█████████▉| 248/250 [00:12<00:00, 19.46it/s, loss=0.323]     
    Sample:   0%|          | 0/8 [00:00<?, ?it/s]    Epochs:  99%|█████████▉| 248/250 [00:12<00:00, 19.46it/s, acc=87.6953125%]    Epochs:  99%|█████████▉| 248/250 [00:12<00:00, 19.46it/s, acc=87.6953125%]    Epochs:  99%|█████████▉| 248/250 [00:12<00:00, 19.46it/s, acc=87.6953125%]    Epochs:  99%|█████████▉| 248/250 [00:12<00:00, 19.46it/s, acc=87.6953125%]    Epochs:  99%|█████████▉| 248/250 [00:12<00:00, 19.46it/s, acc=87.6953125%]    Epochs:  99%|█████████▉| 248/250 [00:12<00:00, 19.46it/s, acc=87.6953125%]    Epochs:  99%|█████████▉| 248/250 [00:12<00:00, 19.46it/s, acc=87.6953125%]    Epochs:  99%|█████████▉| 248/250 [00:12<00:00, 19.46it/s, acc=87.6953125%]
                                                     Epochs:  99%|█████████▉| 248/250 [00:12<00:00, 19.46it/s, loss=0.323]         Epochs: 100%|██████████| 250/250 [00:12<00:00, 19.51it/s, loss=0.323]                                                                     


.. GENERATED FROM PYTHON SOURCE LINES 172-174

Visuals
~~~~~~~

.. GENERATED FROM PYTHON SOURCE LINES 174-192

.. code-block:: Python


    # Plot decision boundaries for training and test sets
    plt.figure(figsize=(12, 6))

    plt.subplot(2, 2, 1)
    plt.title("Train")
    plot_decision_boundary(model, full_batch_x, full_batch_y)

    plt.subplot(2, 2, 2)
    plt.title("Test")
    plot_decision_boundary(model, batch_x_test, batch_y_test)

    plt.subplot(2, 1, 2)
    plt.title("Test loss through epochs")
    plt.plot(losses)
    plt.yscale('log')

    plt.show()


.. image-sg:: /examples/Custom/images/sphx_glr_neural_net_002.png
   :alt: Train, Test, Test loss through epochs
   :srcset: /examples/Custom/images/sphx_glr_neural_net_002.png
   :class: sphx-glr-single-img


.. rst-class:: sphx-glr-timing

   **Total running time of the script:** (0 minutes 13.078 seconds)


.. _sphx_glr_download_examples_Custom_neural_net.py:

.. only:: html

  .. container:: sphx-glr-footer sphx-glr-footer-example

    .. container:: sphx-glr-download sphx-glr-download-jupyter

      :download:`Download Jupyter notebook: neural_net.ipynb <neural_net.ipynb>`

    .. container:: sphx-glr-download sphx-glr-download-python

      :download:`Download Python source code: neural_net.py <neural_net.py>`

    .. container:: sphx-glr-download sphx-glr-download-zip

      :download:`Download zipped: neural_net.zip <neural_net.zip>`


.. only:: html

 .. rst-class:: sphx-glr-signature

    `Gallery generated by Sphinx-Gallery <https://sphinx-gallery.github.io>`_