import matplotlib.pyplot as plt
import numpy as np
import pandas as pd
import seaborn as sns
import tensorflow as tf
from sklearn.model_selection import train_test_split
from sklearn.preprocessing import MinMaxScaler, StandardScaler
from tensorflow.keras.losses import MeanAbsolutePercentageError
from tensorflow.keras.optimizers import SGD

# Import this module's functions
from functions import (
    SuperHighVariationScaler,
    early_stopper,
    map_num_to_string,
    map_string_to_num,
    sparse_array,
)


file_name_all_data = "data/_nanocomposite_data.csv"
all_data = pd.read_csv(file_name_all_data, index_col=None, header=0)
# Drop columns which are not used for now
all_data_clean = all_data.drop(
    ["polymer_p2", "ratio_1_2", "filler_2", "wt_l2", "owner", "foaming"],
    axis=1,
)
all_data_clean = map_string_to_num(all_data_clean)


X_scaler = MinMaxScaler(feature_range=(0, 1))
Y_scaler = SuperHighVariationScaler()


training_data, testing_data = train_test_split(all_data_clean, test_size=0.2, random_state=25)


# Split into input features (X) and output labels (Y) variables
X_training = training_data.drop('conductivity', axis=1).values
Y_training = training_data[['conductivity']].values

# Pull out columns for X (data to train with) and Y (value to predict)
X_testing = testing_data.drop('conductivity', axis=1).values
Y_testing = testing_data[['conductivity']].values

# Scale both the training inputs and outputs
X_scaled_training = X_scaler.fit_transform(X_training)
Y_scaled_training = Y_scaler.fit_transform(Y_training)

# The training and test data are scaled with the same scaler.
X_scaled_testing = X_scaler.transform(X_testing)
Y_scaled_testing = Y_scaler.transform(Y_testing)


# Create model
model = tf.keras.models.Sequential()
model.add(tf.keras.layers.Dense(256, activation="relu", input_dim=3))
model.add(tf.keras.layers.Dense(128, activation="relu"))
model.add(tf.keras.layers.Dense(32, activation="relu"))
model.add(tf.keras.layers.Dense(8, activation="relu"))
model.add(tf.keras.layers.Dense(1, activation="linear"))

# tf.keras.optimizers.schedules.InverseTimeDecay => Does not work well
lr_schedule = tf.keras.optimizers.schedules.CosineDecay(
    initial_learning_rate=0.00001, decay_steps=100000
)

model.compile(
    loss=MeanAbsolutePercentageError(),
    optimizer=SGD(learning_rate=lr_schedule),
)


history = model.fit(
    X_scaled_training,
    Y_scaled_training,
    validation_data=(X_scaled_testing, Y_scaled_testing),
    epochs=1000,
    batch_size=64,
    verbose=0,
    callbacks=[
        early_stopper(
            monitor="val_loss",
            patience=100,
            verbose=0,
        )
    ],
)


# Calculate predictions
predicted_values = model.predict(X_scaled_testing)
predicted_values = Y_scaler.inverse_transform(predicted_values)

complete_data = testing_data.copy()
complete_data = map_num_to_string(complete_data)

complete_data["labels"] = (
    complete_data["polymer_1"] + "-" + complete_data["filler_1"]
)
complete_data["type"] = "Experiment"
other_data = complete_data.copy()
other_data["type"] = "Predicted"
other_data["conductivity"] = predicted_values

complete_data = pd.concat([complete_data, other_data], ignore_index=True)

g = sns.relplot(
    data=complete_data,
    x="wt_l1",
    y="conductivity",
    hue="type",
    col="labels",
    kind="scatter",
    col_wrap=3,
)
g.set_xlabels("weight fraction (%)")
g.set_ylabels("conductivity (S/m)")
g.set(yscale="log")

<seaborn.axisgrid.FacetGrid at 0x26502ebf580>


file_name_unknown_data_7 = "data-evaluation/HDPE_SWCNT_data-set-7.csv"
unknown_data_7 = pd.read_csv(
    file_name_unknown_data_7, index_col=None, header=0
)
unknown_data_7.drop(
    ["polymer_p2", "ratio_1_2", "filler_2", "wt_l2", "owner", "foaming"],
    axis=1,
    inplace=True,
)
unknowndata7_clean = unknown_data_7.copy()
unknowndata7_clean = map_string_to_num(unknowndata7_clean)
# Pull out columns for X (data to train with) and Y (value to predict)
X_unknown_data_7 = unknowndata7_clean.drop("conductivity", axis=1).values
X_scaled_unknowndata7 = X_scaler.transform(X_unknown_data_7)
# Calculate predictions
predicted_unknown_data_7 = model.predict(X_scaled_unknowndata7)
predicted_unknown_data_7 = Y_scaler.inverse_transform(predicted_unknown_data_7)
complete_data = unknown_data_7.copy()
complete_data["labels"] = (
    complete_data["polymer_1"]
    + "-"
    + complete_data["filler_1"]
    + "_predicted_unknown"
)
complete_data["conductivity"] = predicted_unknown_data_7

file_name_data_8 = "data-evaluation/HDPE_SWCNT_data-set-8.csv"
data8 = pd.read_csv(file_name_data_8, index_col=None, header=0)
data8["labels"] = data8["polymer_1"] + "-" + data8["filler_1"] + "_actual_data"

complete_data = pd.concat([complete_data, data8], ignore_index=True)

labels = complete_data["labels"].unique()  # get 2 labels in data set.

fig_dims = (15, 6)
fig, ax = plt.subplots(figsize=fig_dims)
plt.xlabel("weight fraction (%)")
plt.ylabel("conductivity (S/m)")
plt.yscale("log")
g = sns.scatterplot(
    data=complete_data,
    x="wt_l1",
    y="conductivity",
    hue="labels",
    style="labels",
    ax=ax,
    markers={labels[0]: "s", labels[1]: "X"},
)
plt.show()

model.compile(loss=tf.keras.losses.MeanAbsolutePercentageError(), 
                      optimizer=tf.keras.optimizers.SGD(learning_rate=0.0001, decay=1e-6) )

Optimizing Model¶

Optimizer Algorithms and Learning Rate¶

Gradient descent vs Adaptive¶

Import data¶

Prepare Dataset for TensorFlow¶

Scaling X and Y data¶

Splitting data to training and testing sets¶

Model build with `SGD` optimizer¶

Plotting predicting vs testing data¶

Extrapolation: Estimate higher wt (>25%)¶

Conclusion¶

Alternative optimizers¶

`SGD`¶

`Adagrad`¶

`Adadelta`¶

Learning schedules¶

In cases of `SGD` these are best fit¶

Loss function¶

Optimizing Model¶

Optimizer Algorithms and Learning Rate¶

Gradient descent vs Adaptive¶

Import data¶

Prepare Dataset for TensorFlow¶

Scaling X and Y data¶

Splitting data to training and testing sets¶

Model build with SGD optimizer¶

Plotting predicting vs testing data¶

Extrapolation: Estimate higher wt (>25%)¶

Conclusion¶

Alternative optimizers¶

SGD¶

Adagrad¶

Adadelta¶

Learning schedules¶

In cases of SGD these are best fit¶

Loss function¶

Model build with `SGD` optimizer¶

`SGD`¶

`Adagrad`¶

`Adadelta`¶

In cases of `SGD` these are best fit¶