4 лет назад · 4c4172b689
--- a/models/data.py
+++ b/models/data.py
@@ -1,5 +1,8 @@
 
																 import tensorflow as tf
															
 
																 from tensorflow.keras.utils import Sequence
															
 
																+from sklearn.preprocessing import OneHotEncoder
															
 
																+
															
 
																+import numpy as np
															
 
																 # This creates pool of cpu resources
															
 
																 # physical_devices = tf.config.experimental.list_physical_devices("CPU")
															
@@ -32,6 +35,36 @@ class BinaryOneHotGenerator(Sequence):
 
																         return self.x, self.x
															
 
																+class BinaryTimeDistributedOneHotGenerator(Sequence):
															
 
																+    def __init__(self, size=1e5, cardinality=32, blocks=9):
															
 
																+        self.size = int(size)
															
 
																+        self.cardinality = cardinality
															
 
																+        self.x = None
															
 
																+        self.encoder = OneHotEncoder(
															
 
																+            handle_unknown='ignore',
															
 
																+            sparse=False,
															
 
																+            categories=[np.arange(self.cardinality)]
															
 
																+        )
															
 
																+        self.middle = int((blocks - 1) / 2)
															
 
																+        self.blocks = blocks
															
 
																+        self.on_epoch_end()
															
 
																+
															
 
																+    def on_epoch_end(self):
															
 
																+        rand_int = np.random.randint(self.cardinality, size=(self.size * self.blocks, 1))
															
 
																+        out = self.encoder.fit_transform(rand_int)
															
 
																+        self.x = np.reshape(out, (self.size, self.blocks, self.cardinality))
															
 
																+
															
 
																+    def __len__(self):
															
 
																+        return self.size
															
 
																+
															
 
																+    @property
															
 
																+    def y(self):
															
 
																+        return self.x[:, self.middle, :]
															
 
																+
															
 
																+    def __getitem__(self, idx):
															
 
																+        return self.x, self.y
															
 
																+
															
 
																+
															
 
																 class BinaryGenerator(Sequence):
															
 
																     def __init__(self, size=1e5, shape=2, dtype=tf.bool):
															
 
																         size = int(size)
															
--- a/models/end_to_end.py
+++ b/models/end_to_end.py
@@ -8,7 +8,12 @@ import matplotlib.pyplot as plt
 
																 from sklearn.metrics import accuracy_score
															
 
																 from sklearn.preprocessing import OneHotEncoder
															
 
																 from tensorflow.keras import layers, losses
															
 
																+
															
 
																+from models.data import BinaryTimeDistributedOneHotGenerator
															
 
																 from models.layers import ExtractCentralMessage, OpticalChannel, DigitizationLayer, BitsToSymbols, SymbolsToBits
															
 
																+import tensorflow_model_optimization as tfmot
															
 
																+
															
 
																+import graphs
															
 
																 class EndToEndAutoencoder(tf.keras.Model):
															
@@ -17,7 +22,9 @@ class EndToEndAutoencoder(tf.keras.Model):
 
																                  samples_per_symbol,
															
 
																                  messages_per_block,
															
 
																                  channel,
															
 
																-                 custom_loss_fn=False):
															
 
																+                 custom_loss_fn=False,
															
 
																+                 quantize=False,
															
 
																+                 alpha=1):
															
 
																         """
															
 
																         The autoencoder that aims to find a encoding of the input messages. It should be noted that a "block" consists
															
 
																         of multiple "messages" to introduce memory into the simulation as this is essential for modelling inter-symbol
															
@@ -27,6 +34,7 @@ class EndToEndAutoencoder(tf.keras.Model):
 
																         :param samples_per_symbol: Number of samples per transmitted symbol
															
 
																         :param messages_per_block: Total number of messages in transmission block
															
 
																         :param channel: Channel Layer object. Must be a subclass of keras.layers.Layer with an implemented forward pass
															
 
																+        :param alpha: Alpha value for in loss function
															
 
																         """
															
 
																         super(EndToEndAutoencoder, self).__init__()
															
@@ -36,6 +44,7 @@ class EndToEndAutoencoder(tf.keras.Model):
 
																         # Labelled n in paper
															
 
																         self.samples_per_symbol = samples_per_symbol
															
 
																+        self.alpha = alpha
															
 
																         # Labelled N in paper - conditional +=1 to ensure odd value
															
 
																         if messages_per_block % 2 == 0:
															
@@ -79,13 +88,14 @@ class EndToEndAutoencoder(tf.keras.Model):
 
																         # Decoding Neural Network
															
 
																         self.decoder = tf.keras.Sequential([
															
 
																             layers.Dense(2 * self.cardinality),
															
 
																-            layers.LeakyReLU(alpha=leaky_relu_alpha),
															
 
																+            layers.ReLU(),
															
 
																             layers.Dense(2 * self.cardinality),
															
 
																-            layers.LeakyReLU(alpha=leaky_relu_alpha),
															
 
																+            layers.ReLU(),
															
 
																             layers.Dense(self.cardinality, activation='softmax')
															
 
																         ], name="decoding_model")
															
 
																+        self.decoder.build((1, self.samples_per_symbol))
															
 
																-    def save_end_to_end(self):
															
 
																+    def save_end_to_end(self, name):
															
 
																         # extract all params and save
															
 
																         params = {"fs": self.channel.layers[1].fs,
															
@@ -101,7 +111,10 @@ class EndToEndAutoencoder(tf.keras.Model):
 
																                   "enob": self.channel.layers[1].enob,
															
 
																                   "custom_loss_fn": self.custom_loss_fn
															
 
																                   }
															
 
																-        dir_str = os.path.join("exports", dt.utcnow().strftime("%Y%m%d-%H%M%S"))
															
 
																+
															
 
																+        if not name:
															
 
																+            name = dt.utcnow().strftime("%Y%m%d-%H%M%S")
															
 
																+        dir_str = os.path.join("exports", name)
															
 
																         if not os.path.exists(dir_str):
															
 
																             os.makedirs(dir_str)
															
@@ -167,10 +180,7 @@ class EndToEndAutoencoder(tf.keras.Model):
 
																         y_bits_pred = SymbolsToBits(self.cardinality)(y_pred)
															
 
																         bit_cost = losses.BinaryCrossentropy()(y_bits_true, y_bits_pred)
															
 
																-
															
 
																-        a = 1
															
 
																-
															
 
																-        return symbol_cost + a * bit_cost
															
 
																+        return symbol_cost + self.alpha * bit_cost
															
 
																     def generate_random_inputs(self, num_of_blocks, return_vals=False):
															
 
																         """
															
@@ -198,7 +208,7 @@ class EndToEndAutoencoder(tf.keras.Model):
 
																         return out_arr, out_arr[:, mid_idx, :]
															
 
																-    def train(self, num_of_blocks=1e6, epochs=1, batch_size=None, train_size=0.8, lr=1e-3):
															
 
																+    def train(self, num_of_blocks=1e6, epochs=1, batch_size=None, train_size=0.8, lr=1e-3, **kwargs):
															
 
																         """
															
 
																         Method to train the autoencoder. Further configuration to the loss function, optimizer etc. can be made in here.
															
@@ -207,8 +217,13 @@ class EndToEndAutoencoder(tf.keras.Model):
 
																         :param train_size: Float less than 1 representing the proportion of the dataset to use for training
															
 
																         :param lr: The learning rate of the optimizer. Defines how quickly the algorithm converges
															
 
																         """
															
 
																-        X_train, y_train = self.generate_random_inputs(int(num_of_blocks * train_size))
															
 
																-        X_test, y_test = self.generate_random_inputs(int(num_of_blocks * (1 - train_size)))
															
 
																+        # X_train, y_train = self.generate_random_inputs(int(num_of_blocks * train_size))
															
 
																+        # X_test, y_test = self.generate_random_inputs(int(num_of_blocks * (1 - train_size)))
															
 
																+
															
 
																+        train_data = BinaryTimeDistributedOneHotGenerator(
															
 
																+            num_of_blocks, cardinality=self.cardinality, blocks=self.messages_per_block)
															
 
																+        test_data = BinaryTimeDistributedOneHotGenerator(
															
 
																+            num_of_blocks * .3, cardinality=self.cardinality, blocks=self.messages_per_block)
															
 
																         opt = tf.keras.optimizers.Adam(learning_rate=lr)
															
@@ -225,28 +240,42 @@ class EndToEndAutoencoder(tf.keras.Model):
 
																                      run_eagerly=False
															
 
																                      )
															
 
																-        self.fit(x=X_train,
															
 
																-                 y=y_train,
															
 
																-                 batch_size=batch_size,
															
 
																-                 epochs=epochs,
															
 
																-                 shuffle=True,
															
 
																-                 validation_data=(X_test, y_test)
															
 
																-                 )
															
 
																+        return self.fit(
															
 
																+            train_data,
															
 
																+            epochs=epochs,
															
 
																+            shuffle=True,
															
 
																+            validation_data=test_data,
															
 
																+            **kwargs
															
 
																+        )
															
 
																-    def test(self, num_of_blocks=1e4, length_plot=False, plt_show=True):
															
 
																-        X_test, y_test = self.generate_random_inputs(int(num_of_blocks))
															
 
																+    def test(self, num_of_blocks=1e4, length_plot=False, plt_show=True, distance=None):
															
 
																+        # X_test, y_test = self.generate_random_inputs(int(num_of_blocks))
															
 
																+        test_data = BinaryTimeDistributedOneHotGenerator(
															
 
																+            1000, cardinality=self.cardinality, blocks=self.messages_per_block)
															
 
																-        y_out = self.call(X_test)
															
 
																+        num_of_blocks = int(num_of_blocks / 1000)
															
 
																+        if num_of_blocks <= 0:
															
 
																+            num_of_blocks = 1
															
 
																-        y_pred = tf.argmax(y_out, axis=1)
															
 
																-        y_true = tf.argmax(y_test, axis=1)
															
 
																+        ber = []
															
 
																+        ser = []
															
 
																-        self.symbol_error_rate = 1 - accuracy_score(y_true, y_pred)
															
 
																+        for i in range(num_of_blocks):
															
 
																+            y_out = self.call(test_data.x)
															
 
																-        bits_pred = SymbolsToBits(self.cardinality)(tf.one_hot(y_pred, self.cardinality)).numpy().flatten()
															
 
																-        bits_true = SymbolsToBits(self.cardinality)(y_test).numpy().flatten()
															
 
																+            y_pred = tf.argmax(y_out, axis=1)
															
 
																+            y_true = tf.argmax(test_data.y, axis=1)
															
 
																+            ser.append(1 - accuracy_score(y_true, y_pred))
															
 
																-        self.bit_error_rate = 1 - accuracy_score(bits_true, bits_pred)
															
 
																+            bits_pred = SymbolsToBits(self.cardinality)(tf.one_hot(y_pred, self.cardinality)).numpy().flatten()
															
 
																+            bits_true = SymbolsToBits(self.cardinality)(test_data.y).numpy().flatten()
															
 
																+            ber.append(1 - accuracy_score(bits_true, bits_pred))
															
 
																+            test_data.on_epoch_end()
															
 
																+            print(f"\rTested {i + 1} of {num_of_blocks} blocks", end="")
															
 
																+
															
 
																+        print(f"\rTested all {num_of_blocks} blocks")
															
 
																+        self.symbol_error_rate = sum(ser) / len(ser)
															
 
																+        self.bit_error_rate = sum(ber) / len(ber)
															
 
																         if length_plot:
															
@@ -289,10 +318,9 @@ class EndToEndAutoencoder(tf.keras.Model):
 
																             if plt_show:
															
 
																                 plt.show()
															
 
																-        print("SYMBOL ERROR RATE: {}".format(self.symbol_error_rate))
															
 
																-        print("BIT ERROR RATE: {}".format(self.bit_error_rate))
															
 
																-
															
 
																-        pass
															
 
																+        print("SYMBOL ERROR RATE: {:e}".format(self.symbol_error_rate))
															
 
																+        print("BIT ERROR RATE: {:e}".format(self.bit_error_rate))
															
 
																+        return self.symbol_error_rate, self.bit_error_rate
															
 
																     def view_encoder(self):
															
 
																         '''
															
@@ -435,25 +463,25 @@ def load_model(model_name=None):
 
																     return ae_model, params
															
 
																-if __name__ == '__main__':
															
 
																-
															
 
																-    params = {"fs": 336e9,
															
 
																-              "cardinality": 32,
															
 
																-              "samples_per_symbol": 32,
															
 
																-              "messages_per_block": 9,
															
 
																-              "dispersion_factor": (-21.7 * 1e-24),
															
 
																-              "fiber_length": 50,
															
 
																-              "fiber_length_stddev": 1,
															
 
																-              "lpf_cutoff": 32e9,
															
 
																-              "rx_stddev": 0.01,
															
 
																-              "sig_avg": 0.5,
															
 
																-              "enob": 8,
															
 
																-              "custom_loss_fn": True
															
 
																-              }
															
 
																-
															
 
																-    force_training = False
															
 
																-
															
 
																-    model_save_name = ""
															
 
																+def run_tests(distance=50):
															
 
																+    params = {
															
 
																+        "fs": 336e9,
															
 
																+        "cardinality": 64,
															
 
																+        "samples_per_symbol": 48,
															
 
																+        "messages_per_block": 9,
															
 
																+        "dispersion_factor": (-21.7 * 1e-24),
															
 
																+        "fiber_length": 50,
															
 
																+        "fiber_length_stddev": 1,
															
 
																+        "lpf_cutoff": 32e9,
															
 
																+        "rx_stddev": 0.01,
															
 
																+        "sig_avg": 0.5,
															
 
																+        "enob": 6,
															
 
																+        "custom_loss_fn": True
															
 
																+    }
															
 
																+
															
 
																+    force_training = True
															
 
																+
															
 
																+    model_save_name = f'{params["fiber_length"]}km-{params["cardinality"]}'  # "50km-64"  # "20210401-145416"
															
 
																     param_file_path = os.path.join("exports", model_save_name, "params.json")
															
 
																     if os.path.isfile(param_file_path) and not force_training:
															
@@ -461,27 +489,129 @@ if __name__ == '__main__':
 
																         with open(param_file_path, 'r') as file:
															
 
																             params = json.load(file)
															
 
																-    optical_channel = OpticalChannel(fs=params["fs"],
															
 
																-                                     num_of_samples=params["messages_per_block"] * params["samples_per_symbol"],
															
 
																-                                     dispersion_factor=params["dispersion_factor"],
															
 
																-                                     fiber_length=params["fiber_length"],
															
 
																-                                     fiber_length_stddev=params["fiber_length_stddev"],
															
 
																-                                     lpf_cutoff=params["lpf_cutoff"],
															
 
																-                                     rx_stddev=params["rx_stddev"],
															
 
																-                                     sig_avg=params["sig_avg"],
															
 
																-                                     enob=params["enob"])
															
 
																-
															
 
																-    ae_model = EndToEndAutoencoder(cardinality=params["cardinality"],
															
 
																-                                   samples_per_symbol=params["samples_per_symbol"],
															
 
																-                                   messages_per_block=params["messages_per_block"],
															
 
																-                                   channel=optical_channel,
															
 
																-                                   custom_loss_fn=params["custom_loss_fn"])
															
 
																+    optical_channel = OpticalChannel(
															
 
																+        fs=params["fs"],
															
 
																+        num_of_samples=params["messages_per_block"] * params["samples_per_symbol"],
															
 
																+        dispersion_factor=params["dispersion_factor"],
															
 
																+        fiber_length=params["fiber_length"],
															
 
																+        fiber_length_stddev=params["fiber_length_stddev"],
															
 
																+        lpf_cutoff=params["lpf_cutoff"],
															
 
																+        rx_stddev=params["rx_stddev"],
															
 
																+        sig_avg=params["sig_avg"],
															
 
																+        enob=params["enob"],
															
 
																+    )
															
 
																+
															
 
																+    ae_model = EndToEndAutoencoder(
															
 
																+        cardinality=params["cardinality"],
															
 
																+        samples_per_symbol=params["samples_per_symbol"],
															
 
																+        messages_per_block=params["messages_per_block"],
															
 
																+        channel=optical_channel,
															
 
																+        custom_loss_fn=params["custom_loss_fn"],
															
 
																+        alpha=5,
															
 
																+    )
															
 
																+
															
 
																+    checkpoint_name = f'/tmp/checkpoint/normal_{params["fiber_length"]}km'
															
 
																+    model_checkpoint_callback0 = tf.keras.callbacks.ModelCheckpoint(
															
 
																+        filepath=checkpoint_name,
															
 
																+        save_weights_only=True,
															
 
																+        monitor='val_accuracy',
															
 
																+        mode='max',
															
 
																+        save_best_only=True
															
 
																+    )
															
 
																+
															
 
																+    early_stop = tf.keras.callbacks.EarlyStopping(
															
 
																+        monitor='val_loss', min_delta=1e-2, patience=3, verbose=0,
															
 
																+        mode='auto', baseline=None, restore_best_weights=True
															
 
																+    )
															
 
																+
															
 
																+
															
 
																+    # model_checkpoint_callback1 = tf.keras.callbacks.ModelCheckpoint(
															
 
																+    #     filepath='/tmp/checkpoint/quantised',
															
 
																+    #     save_weights_only=True,
															
 
																+    #     monitor='val_accuracy',
															
 
																+    #     mode='max',
															
 
																+    #     save_best_only=True
															
 
																+    # )
															
 
																+
															
 
																+    # if os.path.isfile(param_file_path) and not force_training:
															
 
																+    #     ae_model.encoder = tf.keras.models.load_model(os.path.join("exports", model_save_name, "encoder"))
															
 
																+    #     ae_model.decoder = tf.keras.models.load_model(os.path.join("exports", model_save_name, "decoder"))
															
 
																+    #     print("Loaded existing model from " + model_save_name)
															
 
																+    # else:
															
 
																+    if not os.path.isfile(checkpoint_name + '.index'):
															
 
																+        history = ae_model.train(num_of_blocks=1e3, epochs=30, callbacks=[model_checkpoint_callback0, early_stop])
															
 
																+        graphs.show_train_history(history, f"Autoencoder training at {params['fiber_length']}km")
															
 
																+        ae_model.save_end_to_end(model_save_name)
															
 
																+
															
 
																+    ae_model.load_weights(checkpoint_name)
															
 
																+    ser, ber = ae_model.test(num_of_blocks=3e6)
															
 
																+    data = [(params["fiber_length"], ser, ber)]
															
 
																+    for l in np.linspace(params["fiber_length"] - 2.5, params["fiber_length"] + 2.5, 6):
															
 
																+        optical_channel = OpticalChannel(
															
 
																+            fs=params["fs"],
															
 
																+            num_of_samples=params["messages_per_block"] * params["samples_per_symbol"],
															
 
																+            dispersion_factor=params["dispersion_factor"],
															
 
																+            fiber_length=l,
															
 
																+            fiber_length_stddev=params["fiber_length_stddev"],
															
 
																+            lpf_cutoff=params["lpf_cutoff"],
															
 
																+            rx_stddev=params["rx_stddev"],
															
 
																+            sig_avg=params["sig_avg"],
															
 
																+            enob=params["enob"],
															
 
																+        )
															
 
																+        ae_model = EndToEndAutoencoder(
															
 
																+            cardinality=params["cardinality"],
															
 
																+            samples_per_symbol=params["samples_per_symbol"],
															
 
																+            messages_per_block=params["messages_per_block"],
															
 
																+            channel=optical_channel,
															
 
																+            custom_loss_fn=params["custom_loss_fn"],
															
 
																+            alpha=5,
															
 
																+        )
															
 
																+        ae_model.load_weights(checkpoint_name)
															
 
																+        print(f"Testing {l}km")
															
 
																+        ser, ber = ae_model.test(num_of_blocks=3e6)
															
 
																+        data.append((l, ser, ber))
															
 
																+    return data
															
 
																-    if os.path.isfile(param_file_path) and not force_training:
															
 
																-        ae_model.encoder = tf.keras.models.load_model(os.path.join("exports", model_save_name, "encoder"))
															
 
																-        ae_model.decoder = tf.keras.models.load_model(os.path.join("exports", model_save_name, "decoder"))
															
 
																-    else:
															
 
																-        ae_model.train(num_of_blocks=1e5, epochs=5)
															
 
																-        ae_model.save_end_to_end()
															
 
																+if __name__ == '__main__':
															
 
																+    data0 = run_tests(90)
															
 
																+    # data1 = run_tests(70)
															
 
																+    # data2 = run_tests(80)
															
 
																+    # print('Results 60: ', data0)
															
 
																+    # print('Results 70: ', data1)
															
 
																+    print('Results 90: ', data0)
															
 
																+
															
 
																+    # ae_model.test(num_of_blocks=3e6)
															
 
																+    # ae_model.load_weights('/tmp/checkpoint/normal')
															
 
																+
															
 
																+    #
															
 
																+    # quantize_model = tfmot.quantization.keras.quantize_model
															
 
																+    # ae_model.decoder = quantize_model(ae_model.decoder)
															
 
																+    #
															
 
																+    # # ae_model.load_weights('/tmp/checkpoint/quantised')
															
 
																+    #
															
 
																+    # history = ae_model.train(num_of_blocks=1e3, epochs=20, callbacks=[model_checkpoint_callback1])
															
 
																+    # graphs.show_train_history(history, f"Autoencoder quantised finetune at {params['fiber_length']}km")
															
 
																+
															
 
																+    # SYMBOL ERROR RATE: 2.039667e-03
															
 
																+    #                    2.358000e-03
															
 
																+    # BIT ERROR RATE: 4.646000e-04
															
 
																+    #                 6.916000e-04
															
 
																+
															
 
																+    # SYMBOL ERROR RATE: 4.146667e-04
															
 
																+    # BIT ERROR RATE: 1.642667e-04
															
 
																+    # ae_model.save_end_to_end("50km-q3+")
															
 
																+    # ae_model.test(num_of_blocks=3e6)
															
 
																+
															
 
																+    # Fibre, SER, BER
															
 
																+    # 50, 2.233333e-05, 5.000000e-06
															
 
																+    # 60, 6.556667e-04, 1.343333e-04
															
 
																+    # 75, 1.570333e-03, 3.144667e-04
															
 
																+    ## 80, 8.061667e-03, 1.612333e-03
															
 
																+    # 85, 7.811333e-03, 1.601600e-03
															
 
																+    # 90, 1.121933e-02, 2.255200e-03
															
 
																+    ## 90, 1.266433e-02, 2.767467e-03
															
 
																+
															
 
																+    # 64 cardinality
															
 
																+    # 50, 5.488000e-03, 1.089000e-03
															
 
																     pass
															
--- a/tests/min_test.py
+++ b/tests/min_test.py
@@ -574,8 +574,21 @@ def _bit_aware_test():
 
																     plt.show()
															
 
																+def _graphs():
															
 
																+
															
 
																+    y = [5.000000e-06, 1.343333e-04, 3.144667e-04, 1.612333e-03, 1.601600e-03, 2.255200e-03, 2.767467e-03]
															
 
																+    x = [50, 60, 75, 80, 85, 90, 90]
															
 
																+    plt.plot(x, y, 'x')
															
 
																+    plt.yscale('log')
															
 
																+    plt.grid()
															
 
																+    plt.xlabel('Fibre length (km)')
															
 
																+    plt.ylabel('BER')
															
 
																+    plt.title("Autoencoder performance")
															
 
																+    plt.show()
															
 
																+
															
 
																 if __name__ == '__main__':
															
 
																-    _bit_aware_test()
															
 
																+    _graphs()
															
 
																+    # _bit_aware_test()
															
 
																     # _test_autoencoder_perf()
															
 
																     # _test_autoencoder_perf_qnn()
															
--- a/tests/results.py
+++ b/tests/results.py