5 vuotta sitten · 3a0e28ed92
--- a/save/objects/Bad/HFL4_mnist_mlp_100_lr[0.01]_C[0.1]_iid[0]_E[1]_B[10].pkl
+++ b/save/objects/Bad/HFL4_mnist_mlp_100_lr[0.01]_C[0.1]_iid[0]_E[1]_B[10].pkl
--- a/save/objects/Bad/HFL4_mnist_mlp_100_lr[0.01]_C[0.1]_iid[1]_E[1]_B[10].pkl
+++ b/save/objects/Bad/HFL4_mnist_mlp_100_lr[0.01]_C[0.1]_iid[1]_E[1]_B[10].pkl
--- a/save/objects/Bad/HFL4_mnist_mlp_100_lr[0.05]_C[0.1]_iid[1]_E[1]_B[10].pkl
+++ b/save/objects/Bad/HFL4_mnist_mlp_100_lr[0.05]_C[0.1]_iid[1]_E[1]_B[10].pkl
--- a/save/objects/Bad/HFL4_mnist_mlp_150_lr[0.01]_C[0.1]_iid[1]_E[1]_B[10].pkl
+++ b/save/objects/Bad/HFL4_mnist_mlp_150_lr[0.01]_C[0.1]_iid[1]_E[1]_B[10].pkl
--- a/save/objects/Bad/clustersize25_HFL4_mnist_mlp_100_lr[0.01]_C[0.1]_iid[1]_E[1]_B[10].pkl
+++ b/save/objects/Bad/clustersize25_HFL4_mnist_mlp_100_lr[0.01]_C[0.1]_iid[1]_E[1]_B[10].pkl
--- a/save/objects/Bad/clustersize25_HFL4_mnist_mlp_100_lr[0.05]_C[0.1]_iid[0]_E[1]_B[10].pkl
+++ b/save/objects/Bad/clustersize25_HFL4_mnist_mlp_100_lr[0.05]_C[0.1]_iid[0]_E[1]_B[10].pkl
--- a/save/objects/FL_mnist_mlp_1196_lr[0.01]_C[0.1]_iid[0]_E[1]_B[10].pkl
+++ b/save/objects/FL_mnist_mlp_1196_lr[0.01]_C[0.1]_iid[0]_E[1]_B[10].pkl
--- a/save/objects/FL_mnist_mlp_141_lr[0.1]_C[0.1]_iid[1]_E[1]_B[10].pkl
+++ b/save/objects/FL_mnist_mlp_141_lr[0.1]_C[0.1]_iid[1]_E[1]_B[10].pkl
--- a/save/objects/FL_mnist_mlp_302_lr[0.1]_C[0.1]_iid[0]_E[1]_B[10].pkl
+++ b/save/objects/FL_mnist_mlp_302_lr[0.1]_C[0.1]_iid[0]_E[1]_B[10].pkl
--- a/save/objects/FL_mnist_mlp_468_C[0.1]_iid[1]_E[1]_B[10].pkl
+++ b/save/objects/FL_mnist_mlp_468_C[0.1]_iid[1]_E[1]_B[10].pkl
--- a/save/objects/HFL2_mnist_mlp_100_lr[0.01]_C[0.1]_iid[1]_E[1]_B[10].pkl
+++ b/save/objects/HFL2_mnist_mlp_100_lr[0.01]_C[0.1]_iid[1]_E[1]_B[10].pkl
--- a/save/objects/HFL4_mnist_mlp_100_lr[0.05]_C[0.1]_iid[0]_E[1]_B[10].pkl
+++ b/save/objects/HFL4_mnist_mlp_100_lr[0.05]_C[0.1]_iid[0]_E[1]_B[10].pkl
--- a/save/objects/HFL4_mnist_mlp_150_lr[0.05]_C[0.1]_iid[0]_E[1]_B[10].pkl
+++ b/save/objects/HFL4_mnist_mlp_150_lr[0.05]_C[0.1]_iid[0]_E[1]_B[10].pkl
--- a/save/objects/Old/[10]_FL_mnist_cnn_3160_C[0.1]_iid[0]_E[1]_B[10].pkl
+++ b/save/objects/Old/[10]_FL_mnist_cnn_3160_C[0.1]_iid[0]_E[1]_B[10].pkl
--- a/save/objects/Old/[1]_FL_mnist_mlp_500_C[0.1]_iid[1]_E[1]_B[10].pkl
+++ b/save/objects/Old/[1]_FL_mnist_mlp_500_C[0.1]_iid[1]_E[1]_B[10].pkl
--- a/save/objects/Old/[2]_FL_mnist_mlp_1468_C[0.1]_iid[0]_E[1]_B[10].pkl
+++ b/save/objects/Old/[2]_FL_mnist_mlp_1468_C[0.1]_iid[0]_E[1]_B[10].pkl
--- a/save/objects/Old/[3]_HFL_mnist_mlp_500_C[0.1]_iid[1]_E[1]_B[10].pkl
+++ b/save/objects/Old/[3]_HFL_mnist_mlp_500_C[0.1]_iid[1]_E[1]_B[10].pkl
--- a/save/objects/Old/[9]_FL_mnist_cnn_1054_C[0.1]_iid[1]_E[1]_B[10].pkl
+++ b/save/objects/Old/[9]_FL_mnist_cnn_1054_C[0.1]_iid[1]_E[1]_B[10].pkl
--- a/save/objects/[1]FL_mnist_mlp_200_lr[0.05]_C[0.1]_iid[1]_E[1]_B[10].pkl
+++ b/save/objects/[1]FL_mnist_mlp_200_lr[0.05]_C[0.1]_iid[1]_E[1]_B[10].pkl
--- a/save/objects/[2]FL_mnist_mlp_302_lr[0.05]_C[0.1]_iid[0]_E[1]_B[10].pkl
+++ b/save/objects/[2]FL_mnist_mlp_302_lr[0.05]_C[0.1]_iid[0]_E[1]_B[10].pkl
--- a/save/objects/[3]HFL2_mnist_mlp_101_lr[0.05]_C[0.1]_iid[1]_E[1]_B[10].pkl
+++ b/save/objects/[3]HFL2_mnist_mlp_101_lr[0.05]_C[0.1]_iid[1]_E[1]_B[10].pkl
--- a/save/objects/[4]HFL2_mnist_mlp_101_lr[0.05]_C[0.1]_iid[0]_E[1]_B[10].pkl
+++ b/save/objects/[4]HFL2_mnist_mlp_101_lr[0.05]_C[0.1]_iid[0]_E[1]_B[10].pkl
--- a/src/.ipynb_checkpoints/federated-hierarchical_v1_twoclusters-changeEval-checkpoint.ipynb
+++ b/src/.ipynb_checkpoints/federated-hierarchical_v1_twoclusters-changeEval-checkpoint.ipynb
--- a/src/__pycache__/models.cpython-37.pyc
+++ b/src/__pycache__/models.cpython-37.pyc
--- a/src/__pycache__/options.cpython-37.pyc
+++ b/src/__pycache__/options.cpython-37.pyc
--- a/src/__pycache__/utils.cpython-37.pyc
+++ b/src/__pycache__/utils.cpython-37.pyc
--- a/src/federated-hierarchical2_main.py
+++ b/src/federated-hierarchical2_main.py
@@ -38,7 +38,7 @@ def build_model(args, train_dataset):
 
				         len_in = 1
			
 
				         for x in img_size:
			
 
				             len_in *= x
			
 
				-            global_model = MLP(dim_in=len_in, dim_hidden=64,
			
 
				+            global_model = MLP(dim_in=len_in, dim_hidden=args.mlpdim,
			
 
				                                dim_out=args.num_classes)
			
 
				     else:
			
 
				         exit('Error: unrecognized model')
			
@@ -61,7 +61,10 @@ def fl_train(args, train_dataset, cluster_global_model, cluster, usergrp, epochs
 
				 
			
 
				         cluster_global_model.train()
			
 
				         # m = max(int(args.frac * len(cluster)), 1)
			
 
				-        m = max(int(math.ceil(args.frac * len(cluster))), 1)
			
 
				+        # m = max(int(math.ceil(args.frac * len(cluster))), 1)
			
 
				+        m = min(int(len(cluster)), 10)
			
 
				+        # print("=== m ==== ", m)
			
 
				+        # m = 10
			
 
				         idxs_users = np.random.choice(cluster, m, replace=False)
			
 
				 
			
 
				 
			
@@ -85,17 +88,20 @@ def fl_train(args, train_dataset, cluster_global_model, cluster, usergrp, epochs
 
				         # Calculate avg training accuracy over all users at every epoch
			
 
				         list_acc, list_loss = [], []
			
 
				         cluster_global_model.eval()
			
 
				-        for c in range(len(cluster)):
			
 
				-            # local_model = LocalUpdate(args=args, dataset=train_dataset,
			
 
				-            #                           idxs=user_groups[c], logger=logger)
			
 
				-            local_model = LocalUpdate(args=args, dataset=train_dataset,
			
 
				-                                      idxs=user_groups[idx], logger=logger)
			
 
				-            acc, loss = local_model.inference(model=global_model)
			
 
				+        # C = np.random.choice(cluster, m, replace=False) # random set of clients
			
 
				+        # print("C: ", C)
			
 
				+        # for c in C:
			
 
				+        # for c in range(len(cluster)):  
			
 
				+        for c in idxs_users:      
			
 
				+            cluster_local_model = LocalUpdate(args=args, dataset=train_dataset, idxs=usergrp[c], logger=logger)
			
 
				+            # local_model = LocalUpdate(args=args, dataset=train_dataset,idxs=user_groups[idx], logger=logger)
			
 
				+            acc, loss = cluster_local_model.inference(model=global_model)
			
 
				             list_acc.append(acc)
			
 
				             list_loss.append(loss)
			
 
				-        cluster_train_acc.append(sum(list_acc)/len(list_acc))
			
 
				+        # cluster_train_acc.append(sum(list_acc)/len(list_acc))
			
 
				         # Add
			
 
				-    print("Cluster accuracy: ", 100*cluster_train_acc[-1]) 
			
 
				+    # print("Cluster accuracy: ", 100*cluster_train_acc[-1]) 
			
 
				+    print("Cluster accuracy: ", 100*sum(list_acc)/len(list_acc)) 
			
 
				 
			
 
				     return cluster_global_model, cluster_global_weights, cluster_loss_avg
			
 
				     
			
@@ -120,6 +126,8 @@ if __name__ == '__main__':
 
				     # load dataset and user groups
			
 
				     train_dataset, test_dataset, user_groupsold = get_dataset(args)
			
 
				 
			
 
				+    # user_groups = user_groupsold
			
 
				+    # keylist = list(user_groups.keys())
			
 
				     # ======= Shuffle dataset ======= 
			
 
				     keys =  list(user_groupsold.keys())
			
 
				     random.shuffle(keys)
			
@@ -131,17 +139,20 @@ if __name__ == '__main__':
 
				     print("keylist: ", keylist)
			
 
				     # ======= Splitting into clusters. FL groups ======= 
			
 
				     cluster_size = int(args.num_users / args.num_clusters)
			
 
				-    print("Each cluster size: ", cluster_size)
			
 
				+    # cluster_size = 50
			
 
				+    # print("Each cluster size: ", cluster_size)
			
 
				 
			
 
				     # Cluster 1
			
 
				     # A1 = np.arange(cluster_size, dtaype=int)
			
 
				     A1 = keylist[:cluster_size]
			
 
				+    # A1 = np.random.choice(keylist, cluster_size, replace=False)
			
 
				     print("A1: ", A1)
			
 
				     user_groupsA = {k:user_groups[k] for k in A1 if k in user_groups}
			
 
				     print("Size of cluster 1: ", len(user_groupsA))
			
 
				     # Cluster 2
			
 
				     # B1 = np.arange(cluster_size, cluster_size+cluster_size, dtype=int)
			
 
				     B1 = keylist[cluster_size:2*cluster_size]
			
 
				+    # B1 = np.random.choice(keylist, cluster_size, replace=False)
			
 
				     print("B1: ", B1)
			
 
				     user_groupsB = {k:user_groups[k] for k in B1 if k in user_groups}
			
 
				     print("Size of cluster 2: ", len(user_groupsB))
			
@@ -205,10 +216,13 @@ if __name__ == '__main__':
 
				     cv_loss, cv_acc = [], []
			
 
				     print_every = 1
			
 
				     val_loss_pre, counter = 0, 0
			
 
				-    testacc_check, epoch, idx = 0, 0, 0
			
 
				+    testacc_check, epoch = 0, 0 
			
 
				+    # idx = np.random.randint(0,99)
			
 
				 
			
 
				-    for epoch in tqdm(range(args.epochs)):
			
 
				-    # while testacc_check < args.test_acc:
			
 
				+    # for epoch in tqdm(range(args.epochs)):
			
 
				+    # for epoch in range(args.epochs):
			
 
				+    # while testacc_check < args.test_acc or epoch < args.epochs:
			
 
				+    while epoch < args.epochs: 
			
 
				         local_weights, local_losses, local_accuracies= [], [], []
			
 
				         print(f'\n | Global Training Round : {epoch+1} |\n')
			
 
				         
			
@@ -251,8 +265,12 @@ if __name__ == '__main__':
 
				         global_model.eval()
			
 
				         # print("========== idx ========== ", idx)
			
 
				         for c in range(args.num_users):
			
 
				+        # for c in range(cluster_size):
			
 
				+        # C = np.random.choice(keylist, int(args.frac * args.num_users), replace=False) # random set of clients
			
 
				+        # print("C: ", C)
			
 
				+        # for c in C:
			
 
				             local_model = LocalUpdate(args=args, dataset=train_dataset,
			
 
				-                                      idxs=user_groups[idx], logger=logger)
			
 
				+                                      idxs=user_groups[c], logger=logger)
			
 
				             acc, loss = local_model.inference(model=global_model)
			
 
				             list_acc.append(acc)
			
 
				             list_loss.append(loss)
			
@@ -279,8 +297,8 @@ if __name__ == '__main__':
 
				     print("|---- Test Accuracy: {:.2f}%".format(100*test_acc))
			
 
				 
			
 
				     # Saving the objects train_loss and train_accuracy:
			
 
				-    file_name = '../save/objects/HFL_{}_{}_{}_C[{}]_iid[{}]_E[{}]_B[{}].pkl'.\
			
 
				-    format(args.dataset, args.model, epoch, args.frac, args.iid,
			
 
				+    file_name = '../save/objects/HFL2_{}_{}_{}_lr[{}]_C[{}]_iid[{}]_E[{}]_B[{}].pkl'.\
			
 
				+    format(args.dataset, args.model, epoch, args.lr, args.frac, args.iid,
			
 
				            args.local_ep, args.local_bs)
			
 
				 
			
 
				     with open(file_name, 'wb') as f:
			
--- a/src/federated-hierarchical4_main.py
+++ b/src/federated-hierarchical4_main.py
@@ -0,0 +1,306 @@
 
				+#!/usr/bin/env python
			
 
				+# -*- coding: utf-8 -*-
			
 
				+# Python version: 3.6
			
 
				+
			
 
				+
			
 
				+import os
			
 
				+import copy
			
 
				+import time
			
 
				+import pickle
			
 
				+import numpy as np
			
 
				+from tqdm import tqdm
			
 
				+
			
 
				+import torch
			
 
				+from tensorboardX import SummaryWriter
			
 
				+
			
 
				+from options import args_parser
			
 
				+from update import LocalUpdate, test_inference
			
 
				+from models import MLP, CNNMnist, CNNFashion_Mnist, CNNCifar
			
 
				+from utils import get_dataset, average_weights, exp_details
			
 
				+import math
			
 
				+import random
			
 
				+
			
 
				+
			
 
				+# BUILD MODEL
			
 
				+def build_model(args, train_dataset):
			
 
				+    if args.model == 'cnn':
			
 
				+        # Convolutional neural network
			
 
				+        if args.dataset == 'mnist':
			
 
				+            global_model = CNNMnist(args=args)
			
 
				+        elif args.dataset == 'fmnist':
			
 
				+            global_model = CNNFashion_Mnist(args=args)
			
 
				+        elif args.dataset == 'cifar':
			
 
				+            global_model = CNNCifar(args=args)
			
 
				+
			
 
				+    elif args.model == 'mlp':
			
 
				+        # Multi-layer preceptron
			
 
				+        img_size = train_dataset[0][0].shape
			
 
				+        len_in = 1
			
 
				+        for x in img_size:
			
 
				+            len_in *= x
			
 
				+            global_model = MLP(dim_in=len_in, dim_hidden=args.mlpdim,
			
 
				+                               dim_out=args.num_classes)
			
 
				+    else:
			
 
				+        exit('Error: unrecognized model')
			
 
				+        
			
 
				+    return global_model
			
 
				+
			
 
				+
			
 
				+# Defining the training function
			
 
				+def fl_train(args, train_dataset, cluster_global_model, cluster, usergrp, epochs):
			
 
				+    
			
 
				+    cluster_train_loss, cluster_train_acc = [], []
			
 
				+    cluster_val_acc_list, cluster_net_list = [], []
			
 
				+    cluster_cv_loss, cluster_cv_acc = [], []
			
 
				+    # print_every = 1
			
 
				+    cluster_val_loss_pre, counter = 0, 0
			
 
				+
			
 
				+    for epoch in range(epochs):
			
 
				+        cluster_local_weights, cluster_local_losses = [], []
			
 
				+        # print(f'\n | Cluster Training Round : {epoch+1} |\n')
			
 
				+
			
 
				+        cluster_global_model.train()
			
 
				+        # m = max(int(args.frac * len(cluster)), 1)
			
 
				+        # m = max(int(math.ceil(args.frac * len(cluster))), 1)
			
 
				+        m = min(int(len(cluster)), 10)
			
 
				+        # print("=== m ==== ", m)
			
 
				+        idxs_users = np.random.choice(cluster, m, replace=False)
			
 
				+
			
 
				+
			
 
				+        for idx in idxs_users:
			
 
				+            cluster_local_model = LocalUpdate(args=args, dataset=train_dataset, idxs=usergrp[idx], logger=logger)
			
 
				+            cluster_w, cluster_loss = cluster_local_model.update_weights(model=copy.deepcopy(cluster_global_model), global_round=epoch)
			
 
				+            cluster_local_weights.append(copy.deepcopy(cluster_w))
			
 
				+            cluster_local_losses.append(copy.deepcopy(cluster_loss))
			
 
				+            # print('| Global Round : {} | User : {} | \tLoss: {:.6f}'.format(epoch, idx, cluster_loss))
			
 
				+
			
 
				+        # averaging global weights
			
 
				+        cluster_global_weights = average_weights(cluster_local_weights)
			
 
				+
			
 
				+        # update global weights
			
 
				+        cluster_global_model.load_state_dict(cluster_global_weights)
			
 
				+
			
 
				+        cluster_loss_avg = sum(cluster_local_losses) / len(cluster_local_losses)
			
 
				+        cluster_train_loss.append(cluster_loss_avg)
			
 
				+
			
 
				+        # ============== EVAL ============== 
			
 
				+        # Calculate avg training accuracy over all users at every epoch
			
 
				+        list_acc, list_loss = [], []
			
 
				+        cluster_global_model.eval()
			
 
				+        # C = np.random.choice(cluster, m, replace=False) # random set of clients
			
 
				+        # print("C: ", C)
			
 
				+        # for c in C:
			
 
				+        # for c in range(len(cluster)):     
			
 
				+        for c in idxs_users:   
			
 
				+            cluster_local_model = LocalUpdate(args=args, dataset=train_dataset, idxs=usergrp[c], logger=logger)
			
 
				+            # local_model = LocalUpdate(args=args, dataset=train_dataset,idxs=user_groups[idx], logger=logger)
			
 
				+            acc, loss = cluster_local_model.inference(model=global_model)
			
 
				+            list_acc.append(acc)
			
 
				+            list_loss.append(loss)
			
 
				+        # cluster_train_acc.append(sum(list_acc)/len(list_acc))
			
 
				+        # Add
			
 
				+    # print("Cluster accuracy: ", 100*cluster_train_acc[-1]) 
			
 
				+    print("Cluster accuracy: ", 100*sum(list_acc)/len(list_acc)) 
			
 
				+
			
 
				+    return cluster_global_model, cluster_global_weights, cluster_loss_avg
			
 
				+    
			
 
				+
			
 
				+
			
 
				+
			
 
				+
			
 
				+if __name__ == '__main__':
			
 
				+    start_time = time.time()
			
 
				+
			
 
				+    # define paths
			
 
				+    path_project = os.path.abspath('..')
			
 
				+    logger = SummaryWriter('../logs')
			
 
				+
			
 
				+    args = args_parser()
			
 
				+    exp_details(args)
			
 
				+
			
 
				+    if args.gpu:
			
 
				+        torch.cuda.set_device(args.gpu)
			
 
				+    device = 'cuda' if args.gpu else 'cpu'
			
 
				+
			
 
				+    # load dataset and user groups
			
 
				+    train_dataset, test_dataset, user_groupsold = get_dataset(args)
			
 
				+
			
 
				+    # user_groups = user_groupsold
			
 
				+    # keylist = list(user_groups.keys())
			
 
				+    # ======= Shuffle dataset ======= 
			
 
				+    keys =  list(user_groupsold.keys())
			
 
				+    random.shuffle(keys)
			
 
				+    user_groups = dict()
			
 
				+    for key in keys:
			
 
				+        user_groups.update({key:user_groupsold[key]})
			
 
				+    # print(user_groups.keys()) 
			
 
				+    keylist = list(user_groups.keys())
			
 
				+    print("keylist: ", keylist)
			
 
				+    # ======= Splitting into clusters. FL groups ======= 
			
 
				+    # cluster_size = int(args.num_users / args.num_clusters)    
			
 
				+    cluster_size = 50
			
 
				+    print("Each cluster size: ", cluster_size)
			
 
				+
			
 
				+    # Cluster 1
			
 
				+    # A1 = keylist[:cluster_size]
			
 
				+    A1 = np.random.choice(keylist, cluster_size, replace=False)
			
 
				+    print("A1: ", A1)
			
 
				+    user_groupsA = {k:user_groups[k] for k in A1 if k in user_groups}
			
 
				+    print("Size of cluster 1: ", len(user_groupsA))
			
 
				+    # Cluster 2
			
 
				+    # B1 = keylist[cluster_size:2*cluster_size]
			
 
				+    B1 = np.random.choice(keylist, cluster_size, replace=False)    
			
 
				+    print("B1: ", B1)
			
 
				+    user_groupsB = {k:user_groups[k] for k in B1 if k in user_groups}
			
 
				+    print("Size of cluster 2: ", len(user_groupsB))
			
 
				+    # Cluster 3
			
 
				+    # C1 = keylist[2*cluster_size:3*cluster_size]
			
 
				+    C1 = np.random.choice(keylist, cluster_size, replace=False)
			
 
				+    print("C1: ", C1)
			
 
				+    user_groupsC = {k:user_groups[k] for k in C1 if k in user_groups}
			
 
				+    print("Size of cluster 3: ", len(user_groupsC))
			
 
				+    # Cluster 4
			
 
				+    # D1 = keylist[3*cluster_size:4*cluster_size]
			
 
				+    D1 = np.random.choice(keylist, cluster_size, replace=False)
			
 
				+    print("D1: ", D1)
			
 
				+    user_groupsD = {k:user_groups[k] for k in D1 if k in user_groups}
			
 
				+    print("Size of cluster 4: ", len(user_groupsD))
			
 
				+
			
 
				+    # MODEL PARAM SUMMARY
			
 
				+    global_model = build_model(args, train_dataset)
			
 
				+    pytorch_total_params = sum(p.numel() for p in global_model.parameters())
			
 
				+    print("Model total number of parameters: ", pytorch_total_params)
			
 
				+
			
 
				+    # from torchsummary import summary
			
 
				+    # summary(global_model, (1, 28, 28))
			
 
				+    # global_model.parameters()
			
 
				+
			
 
				+    # Set the model to train and send it to device.
			
 
				+    global_model.to(device)
			
 
				+    global_model.train()
			
 
				+    print(global_model)
			
 
				+
			
 
				+    # copy weights
			
 
				+    global_weights = global_model.state_dict()
			
 
				+
			
 
				+
			
 
				+    # ======= Set the cluster models to train and send it to device. =======
			
 
				+    # Cluster A
			
 
				+    cluster_modelA = build_model(args, train_dataset)
			
 
				+    cluster_modelA.to(device)
			
 
				+    cluster_modelA.train()
			
 
				+    # copy weights
			
 
				+    cluster_modelA_weights = cluster_modelA.state_dict()
			
 
				+    # Cluster B
			
 
				+    cluster_modelB = build_model(args, train_dataset)
			
 
				+    cluster_modelB.to(device)
			
 
				+    cluster_modelB.train()
			
 
				+    # copy weights
			
 
				+    cluster_modelB_weights = cluster_modelB.state_dict()
			
 
				+    # Cluster C
			
 
				+    cluster_modelC = build_model(args, train_dataset)
			
 
				+    cluster_modelC.to(device)
			
 
				+    cluster_modelC.train()
			
 
				+    # copy weights
			
 
				+    cluster_modelC_weights = cluster_modelC.state_dict()
			
 
				+    # Cluster D
			
 
				+    cluster_modelD = build_model(args, train_dataset)
			
 
				+    cluster_modelD.to(device)
			
 
				+    cluster_modelD.train()
			
 
				+    # copy weights
			
 
				+    cluster_modelD_weights = cluster_modelD.state_dict()
			
 
				+
			
 
				+
			
 
				+    train_loss, train_accuracy = [], []
			
 
				+    val_acc_list, net_list = [], []
			
 
				+    cv_loss, cv_acc = [], []
			
 
				+    print_every = 1
			
 
				+    val_loss_pre, counter = 0, 0
			
 
				+    testacc_check, epoch = 0, 0 
			
 
				+    idx = np.random.randint(0,99)
			
 
				+
			
 
				+    # for epoch in tqdm(range(args.epochs)):
			
 
				+    # for epoch in range(args.epochs):
			
 
				+    # while testacc_check < args.test_acc or epoch < args.epochs:
			
 
				+    while epoch < args.epochs:        
			
 
				+        local_weights, local_losses, local_accuracies= [], [], []
			
 
				+        print(f'\n | Global Training Round : {epoch+1} |\n')
			
 
				+        
			
 
				+        # ============== TRAIN ==============
			
 
				+        global_model.train()
			
 
				+        
			
 
				+        # Cluster A
			
 
				+        A_model, A_weights, A_losses = fl_train(args, train_dataset, cluster_modelA, A1, user_groupsA, args.Cepochs)        
			
 
				+        local_weights.append(copy.deepcopy(A_weights))
			
 
				+        local_losses.append(copy.deepcopy(A_losses))    
			
 
				+        cluster_modelA = A_model    
			
 
				+        # Cluster B
			
 
				+        B_model, B_weights, B_losses = fl_train(args, train_dataset, cluster_modelB, B1, user_groupsB, args.Cepochs)
			
 
				+        local_weights.append(copy.deepcopy(B_weights))
			
 
				+        local_losses.append(copy.deepcopy(B_losses))
			
 
				+        cluster_modelB = B_model 
			
 
				+        # Cluster C
			
 
				+        C_model, C_weights, C_losses = fl_train(args, train_dataset, cluster_modelC, C1, user_groupsC, args.Cepochs)
			
 
				+        local_weights.append(copy.deepcopy(C_weights))
			
 
				+        local_losses.append(copy.deepcopy(C_losses))   
			
 
				+        cluster_modelC = C_model      
			
 
				+        # Cluster D
			
 
				+        D_model, D_weights, D_losses = fl_train(args, train_dataset, cluster_modelD, D1, user_groupsD, args.Cepochs)
			
 
				+        local_weights.append(copy.deepcopy(D_weights))
			
 
				+        local_losses.append(copy.deepcopy(D_losses))
			
 
				+        cluster_modelD = D_model 
			
 
				+        
			
 
				+        
			
 
				+        # averaging global weights
			
 
				+        global_weights = average_weights(local_weights)
			
 
				+
			
 
				+        # update global weights
			
 
				+        global_model.load_state_dict(global_weights)
			
 
				+
			
 
				+        loss_avg = sum(local_losses) / len(local_losses)
			
 
				+        train_loss.append(loss_avg)
			
 
				+        
			
 
				+        # ============== EVAL ============== 
			
 
				+        # Calculate avg training accuracy over all users at every epoch
			
 
				+        list_acc, list_loss = [], []
			
 
				+        global_model.eval()
			
 
				+        # print("========== idx ========== ", idx)
			
 
				+        for c in range(args.num_users):
			
 
				+        # for c in range(cluster_size):
			
 
				+        # C = np.random.choice(keylist, int(args.frac * args.num_users), replace=False) # random set of clients
			
 
				+        # print("C: ", C)
			
 
				+        # for c in C:
			
 
				+            local_model = LocalUpdate(args=args, dataset=train_dataset,
			
 
				+                                      idxs=user_groups[c], logger=logger)
			
 
				+            acc, loss = local_model.inference(model=global_model)
			
 
				+            list_acc.append(acc)
			
 
				+            list_loss.append(loss)
			
 
				+        train_accuracy.append(sum(list_acc)/len(list_acc))
			
 
				+        # Add
			
 
				+        testacc_check = 100*train_accuracy[-1]
			
 
				+        epoch = epoch + 1
			
 
				+
			
 
				+        # print global training loss after every 'i' rounds
			
 
				+        if (epoch+1) % print_every == 0:
			
 
				+            print(f' \nAvg Training Stats after {epoch+1} global rounds:')
			
 
				+            print(f'Training Loss : {np.mean(np.array(train_loss))}')
			
 
				+            print('Train Accuracy: {:.2f}% \n'.format(100*train_accuracy[-1]))
			
 
				+            
			
 
				+
			
 
				+    print('\n Total Run Time: {0:0.4f}'.format(time.time()-start_time))
			
 
				+
			
 
				+    # Test inference after completion of training
			
 
				+    test_acc, test_loss = test_inference(args, global_model, test_dataset)
			
 
				+
			
 
				+    # print(f' \n Results after {args.epochs} global rounds of training:')
			
 
				+    print(f"\nAvg Training Stats after {epoch} global rounds:")
			
 
				+    print("|---- Avg Train Accuracy: {:.2f}%".format(100*train_accuracy[-1]))
			
 
				+    print("|---- Test Accuracy: {:.2f}%".format(100*test_acc))
			
 
				+
			
 
				+    # Saving the objects train_loss and train_accuracy:
			
 
				+    file_name = '../save/objects/HFL4_{}_{}_{}_lr[{}]_C[{}]_iid[{}]_E[{}]_B[{}].pkl'.\
			
 
				+    format(args.dataset, args.model, epoch, args.lr, args.frac, args.iid,
			
 
				+           args.local_ep, args.local_bs)
			
 
				+
			
 
				+    with open(file_name, 'wb') as f:
			
 
				+        pickle.dump([train_loss, train_accuracy], f)
			
--- a/src/federated-hierarchical8_main.py
+++ b/src/federated-hierarchical8_main.py
@@ -0,0 +1,366 @@
 
				+#!/usr/bin/env python
			
 
				+# -*- coding: utf-8 -*-
			
 
				+# Python version: 3.6
			
 
				+
			
 
				+
			
 
				+import os
			
 
				+import copy
			
 
				+import time
			
 
				+import pickle
			
 
				+import numpy as np
			
 
				+from tqdm import tqdm
			
 
				+
			
 
				+import torch
			
 
				+from tensorboardX import SummaryWriter
			
 
				+
			
 
				+from options import args_parser
			
 
				+from update import LocalUpdate, test_inference
			
 
				+from models import MLP, CNNMnist, CNNFashion_Mnist, CNNCifar
			
 
				+from utils import get_dataset, average_weights, exp_details
			
 
				+import math
			
 
				+import random
			
 
				+
			
 
				+
			
 
				+# BUILD MODEL
			
 
				+def build_model(args, train_dataset):
			
 
				+    if args.model == 'cnn':
			
 
				+        # Convolutional neural network
			
 
				+        if args.dataset == 'mnist':
			
 
				+            global_model = CNNMnist(args=args)
			
 
				+        elif args.dataset == 'fmnist':
			
 
				+            global_model = CNNFashion_Mnist(args=args)
			
 
				+        elif args.dataset == 'cifar':
			
 
				+            global_model = CNNCifar(args=args)
			
 
				+
			
 
				+    elif args.model == 'mlp':
			
 
				+        # Multi-layer preceptron
			
 
				+        img_size = train_dataset[0][0].shape
			
 
				+        len_in = 1
			
 
				+        for x in img_size:
			
 
				+            len_in *= x
			
 
				+            global_model = MLP(dim_in=len_in, dim_hidden=args.mlpdim,
			
 
				+                               dim_out=args.num_classes)
			
 
				+    else:
			
 
				+        exit('Error: unrecognized model')
			
 
				+        
			
 
				+    return global_model
			
 
				+
			
 
				+
			
 
				+# Defining the training function
			
 
				+def fl_train(args, train_dataset, cluster_global_model, cluster, usergrp, epochs):
			
 
				+    
			
 
				+    cluster_train_loss, cluster_train_acc = [], []
			
 
				+    cluster_val_acc_list, cluster_net_list = [], []
			
 
				+    cluster_cv_loss, cluster_cv_acc = [], []
			
 
				+    # print_every = 1
			
 
				+    cluster_val_loss_pre, counter = 0, 0
			
 
				+
			
 
				+    for epoch in range(epochs):
			
 
				+        cluster_local_weights, cluster_local_losses = [], []
			
 
				+        # print(f'\n | Cluster Training Round : {epoch+1} |\n')
			
 
				+
			
 
				+        cluster_global_model.train()
			
 
				+        # m = max(int(args.frac * len(cluster)), 1)
			
 
				+        # m = max(int(math.ceil(args.frac * len(cluster))), 1)
			
 
				+        m = min(int(len(cluster)), 10)
			
 
				+        # print("=== m ==== ", m)
			
 
				+        idxs_users = np.random.choice(cluster, m, replace=False)
			
 
				+
			
 
				+
			
 
				+        for idx in idxs_users:
			
 
				+            cluster_local_model = LocalUpdate(args=args, dataset=train_dataset, idxs=usergrp[idx], logger=logger)
			
 
				+            cluster_w, cluster_loss = cluster_local_model.update_weights(model=copy.deepcopy(cluster_global_model), global_round=epoch)
			
 
				+            cluster_local_weights.append(copy.deepcopy(cluster_w))
			
 
				+            cluster_local_losses.append(copy.deepcopy(cluster_loss))
			
 
				+            # print('| Global Round : {} | User : {} | \tLoss: {:.6f}'.format(epoch, idx, cluster_loss))
			
 
				+
			
 
				+        # averaging global weights
			
 
				+        cluster_global_weights = average_weights(cluster_local_weights)
			
 
				+
			
 
				+        # update global weights
			
 
				+        cluster_global_model.load_state_dict(cluster_global_weights)
			
 
				+
			
 
				+        cluster_loss_avg = sum(cluster_local_losses) / len(cluster_local_losses)
			
 
				+        cluster_train_loss.append(cluster_loss_avg)
			
 
				+
			
 
				+        # ============== EVAL ============== 
			
 
				+        # Calculate avg training accuracy over all users at every epoch
			
 
				+        list_acc, list_loss = [], []
			
 
				+        cluster_global_model.eval()
			
 
				+        # C = np.random.choice(cluster, m, replace=False) # random set of clients
			
 
				+        # print("C: ", C)
			
 
				+        # for c in C:
			
 
				+        # for c in range(len(cluster)):  
			
 
				+        for c in idxs_users:      
			
 
				+            cluster_local_model = LocalUpdate(args=args, dataset=train_dataset, idxs=usergrp[c], logger=logger)
			
 
				+            # local_model = LocalUpdate(args=args, dataset=train_dataset,idxs=user_groups[idx], logger=logger)
			
 
				+            acc, loss = cluster_local_model.inference(model=global_model)
			
 
				+            list_acc.append(acc)
			
 
				+            list_loss.append(loss)
			
 
				+        # cluster_train_acc.append(sum(list_acc)/len(list_acc))
			
 
				+        # Add
			
 
				+    # print("Cluster accuracy: ", 100*cluster_train_acc[-1]) 
			
 
				+    print("Cluster accuracy: ", 100*sum(list_acc)/len(list_acc)) 
			
 
				+
			
 
				+    return cluster_global_model, cluster_global_weights, cluster_loss_avg
			
 
				+    
			
 
				+
			
 
				+
			
 
				+
			
 
				+
			
 
				+if __name__ == '__main__':
			
 
				+    start_time = time.time()
			
 
				+
			
 
				+    # define paths
			
 
				+    path_project = os.path.abspath('..')
			
 
				+    logger = SummaryWriter('../logs')
			
 
				+
			
 
				+    args = args_parser()
			
 
				+    exp_details(args)
			
 
				+
			
 
				+    if args.gpu:
			
 
				+        torch.cuda.set_device(args.gpu)
			
 
				+    device = 'cuda' if args.gpu else 'cpu'
			
 
				+
			
 
				+    # load dataset and user groups
			
 
				+    train_dataset, test_dataset, user_groupsold = get_dataset(args)
			
 
				+
			
 
				+    # user_groups = user_groupsold
			
 
				+    # keylist = list(user_groups.keys())
			
 
				+    # ======= Shuffle dataset ======= 
			
 
				+    keys =  list(user_groupsold.keys())
			
 
				+    random.shuffle(keys)
			
 
				+    user_groups = dict()
			
 
				+    for key in keys:
			
 
				+        user_groups.update({key:user_groupsold[key]})
			
 
				+    # print(user_groups.keys()) 
			
 
				+    keylist = list(user_groups.keys())
			
 
				+    print("keylist: ", keylist)
			
 
				+    # ======= Splitting into clusters. FL groups ======= 
			
 
				+    # cluster_size = int(args.num_users / args.num_clusters)    
			
 
				+    cluster_size = 50
			
 
				+    print("Each cluster size: ", cluster_size)
			
 
				+
			
 
				+    # Cluster 1
			
 
				+    # A1 = keylist[:cluster_size]
			
 
				+    A1 = np.random.choice(keylist, cluster_size, replace=False)
			
 
				+    print("A1: ", A1)
			
 
				+    user_groupsA = {k:user_groups[k] for k in A1 if k in user_groups}
			
 
				+    print("Size of cluster 1: ", len(user_groupsA))
			
 
				+    # Cluster 2
			
 
				+    # B1 = keylist[cluster_size:2*cluster_size]
			
 
				+    B1 = np.random.choice(keylist, cluster_size, replace=False)    
			
 
				+    print("B1: ", B1)
			
 
				+    user_groupsB = {k:user_groups[k] for k in B1 if k in user_groups}
			
 
				+    print("Size of cluster 2: ", len(user_groupsB))
			
 
				+    # Cluster 3
			
 
				+    # C1 = keylist[2*cluster_size:3*cluster_size]
			
 
				+    C1 = np.random.choice(keylist, cluster_size, replace=False)
			
 
				+    print("C1: ", C1)
			
 
				+    user_groupsC = {k:user_groups[k] for k in C1 if k in user_groups}
			
 
				+    print("Size of cluster 3: ", len(user_groupsC))
			
 
				+    # Cluster 4
			
 
				+    # D1 = keylist[3*cluster_size:4*cluster_size]
			
 
				+    D1 = np.random.choice(keylist, cluster_size, replace=False)
			
 
				+    print("D1: ", D1)
			
 
				+    user_groupsD = {k:user_groups[k] for k in D1 if k in user_groups}
			
 
				+    print("Size of cluster 4: ", len(user_groupsD))
			
 
				+
			
 
				+    # Cluster 5    
			
 
				+    E1 = np.random.choice(keylist, cluster_size, replace=False)
			
 
				+    print("E1: ", E1)
			
 
				+    user_groupsE = {k:user_groups[k] for k in E1 if k in user_groups}
			
 
				+    print("Size of cluster 5: ", len(user_groupsE))
			
 
				+    # Cluster 6
			
 
				+    F1 = np.random.choice(keylist, cluster_size, replace=False)    
			
 
				+    print("F1: ", F1)
			
 
				+    user_groupsF = {k:user_groups[k] for k in F1 if k in user_groups}
			
 
				+    print("Size of cluster 6: ", len(user_groupsF))
			
 
				+    # Cluster 7    
			
 
				+    G1 = np.random.choice(keylist, cluster_size, replace=False)
			
 
				+    print("G1: ", G1)
			
 
				+    user_groupsG = {k:user_groups[k] for k in G1 if k in user_groups}
			
 
				+    print("Size of cluster 7: ", len(user_groupsC))
			
 
				+    # Cluster 8
			
 
				+    H1 = np.random.choice(keylist, cluster_size, replace=False)
			
 
				+    print("H1: ", H1)
			
 
				+    user_groupsH = {k:user_groups[k] for k in H1 if k in user_groups}
			
 
				+    print("Size of cluster 8: ", len(user_groupsH))
			
 
				+
			
 
				+    # MODEL PARAM SUMMARY
			
 
				+    global_model = build_model(args, train_dataset)
			
 
				+    pytorch_total_params = sum(p.numel() for p in global_model.parameters())
			
 
				+    print("Model total number of parameters: ", pytorch_total_params)
			
 
				+
			
 
				+    # from torchsummary import summary
			
 
				+    # summary(global_model, (1, 28, 28))
			
 
				+    # global_model.parameters()
			
 
				+
			
 
				+    # Set the model to train and send it to device.
			
 
				+    global_model.to(device)
			
 
				+    global_model.train()
			
 
				+    print(global_model)
			
 
				+
			
 
				+    # copy weights
			
 
				+    global_weights = global_model.state_dict()
			
 
				+
			
 
				+
			
 
				+    # ======= Set the cluster models to train and send it to device. =======
			
 
				+    # Cluster A
			
 
				+    cluster_modelA = build_model(args, train_dataset)
			
 
				+    cluster_modelA.to(device)
			
 
				+    cluster_modelA.train()
			
 
				+    # copy weights
			
 
				+    cluster_modelA_weights = cluster_modelA.state_dict()
			
 
				+    # Cluster B
			
 
				+    cluster_modelB = build_model(args, train_dataset)
			
 
				+    cluster_modelB.to(device)
			
 
				+    cluster_modelB.train()
			
 
				+    cluster_modelB_weights = cluster_modelB.state_dict()
			
 
				+    # Cluster C
			
 
				+    cluster_modelC = build_model(args, train_dataset)
			
 
				+    cluster_modelC.to(device)
			
 
				+    cluster_modelC.train()
			
 
				+    cluster_modelC_weights = cluster_modelC.state_dict()
			
 
				+    # Cluster D
			
 
				+    cluster_modelD = build_model(args, train_dataset)
			
 
				+    cluster_modelD.to(device)
			
 
				+    cluster_modelD.train()
			
 
				+    cluster_modelD_weights = cluster_modelD.state_dict()
			
 
				+    # Cluster E
			
 
				+    cluster_modelE = build_model(args, train_dataset)
			
 
				+    cluster_modelE.to(device)
			
 
				+    cluster_modelE.train()
			
 
				+    cluster_modelE_weights = cluster_modelE.state_dict()
			
 
				+    # Cluster F
			
 
				+    cluster_modelF = build_model(args, train_dataset)
			
 
				+    cluster_modelF.to(device)
			
 
				+    cluster_modelF.train()
			
 
				+    cluster_modelF_weights = cluster_modelF.state_dict()
			
 
				+    # Cluster G
			
 
				+    cluster_modelG = build_model(args, train_dataset)
			
 
				+    cluster_modelG.to(device)
			
 
				+    cluster_modelG.train()
			
 
				+    cluster_modelG_weights = cluster_modelG.state_dict()
			
 
				+    # Cluster H
			
 
				+    cluster_modelH = build_model(args, train_dataset)
			
 
				+    cluster_modelH.to(device)
			
 
				+    cluster_modelH.train()
			
 
				+    # copy weights
			
 
				+    cluster_modelH_weights = cluster_modelH.state_dict()
			
 
				+
			
 
				+
			
 
				+    train_loss, train_accuracy = [], []
			
 
				+    val_acc_list, net_list = [], []
			
 
				+    cv_loss, cv_acc = [], []
			
 
				+    print_every = 1
			
 
				+    val_loss_pre, counter = 0, 0
			
 
				+    testacc_check, epoch = 0, 0 
			
 
				+    idx = np.random.randint(0,99)
			
 
				+
			
 
				+    # for epoch in tqdm(range(args.epochs)):
			
 
				+    # for epoch in range(args.epochs):
			
 
				+    # while testacc_check < args.test_acc or epoch < args.epochs:
			
 
				+    while epoch < args.epochs:        
			
 
				+        local_weights, local_losses, local_accuracies= [], [], []
			
 
				+        print(f'\n | Global Training Round : {epoch+1} |\n')
			
 
				+        
			
 
				+        # ============== TRAIN ==============
			
 
				+        global_model.train()
			
 
				+        
			
 
				+        # Cluster A
			
 
				+        A_model, A_weights, A_losses = fl_train(args, train_dataset, cluster_modelA, A1, user_groupsA, args.Cepochs)        
			
 
				+        local_weights.append(copy.deepcopy(A_weights))
			
 
				+        local_losses.append(copy.deepcopy(A_losses))    
			
 
				+        cluster_modelA = A_model    
			
 
				+        # Cluster B
			
 
				+        B_model, B_weights, B_losses = fl_train(args, train_dataset, cluster_modelB, B1, user_groupsB, args.Cepochs)
			
 
				+        local_weights.append(copy.deepcopy(B_weights))
			
 
				+        local_losses.append(copy.deepcopy(B_losses))
			
 
				+        cluster_modelB = B_model 
			
 
				+        # Cluster C
			
 
				+        C_model, C_weights, C_losses = fl_train(args, train_dataset, cluster_modelC, C1, user_groupsC, args.Cepochs)
			
 
				+        local_weights.append(copy.deepcopy(C_weights))
			
 
				+        local_losses.append(copy.deepcopy(C_losses))   
			
 
				+        cluster_modelC = C_model      
			
 
				+        # Cluster D
			
 
				+        D_model, D_weights, D_losses = fl_train(args, train_dataset, cluster_modelD, D1, user_groupsD, args.Cepochs)
			
 
				+        local_weights.append(copy.deepcopy(D_weights))
			
 
				+        local_losses.append(copy.deepcopy(D_losses))
			
 
				+        cluster_modelD = D_model 
			
 
				+
			
 
				+        # Cluster E
			
 
				+        E_model, E_weights, E_losses = fl_train(args, train_dataset, cluster_modelE, E1, user_groupsE, args.Cepochs)        
			
 
				+        local_weights.append(copy.deepcopy(E_weights))
			
 
				+        local_losses.append(copy.deepcopy(E_losses))    
			
 
				+        cluster_modelE = E_model    
			
 
				+        # Cluster F
			
 
				+        F_model, F_weights, F_losses = fl_train(args, train_dataset, cluster_modelF, F1, user_groupsF, args.Cepochs)
			
 
				+        local_weights.append(copy.deepcopy(F_weights))
			
 
				+        local_losses.append(copy.deepcopy(F_losses))
			
 
				+        cluster_modelF = F_model 
			
 
				+        # Cluster G
			
 
				+        G_model, G_weights, G_losses = fl_train(args, train_dataset, cluster_modelG, G1, user_groupsG, args.Cepochs)
			
 
				+        local_weights.append(copy.deepcopy(G_weights))
			
 
				+        local_losses.append(copy.deepcopy(G_losses))   
			
 
				+        cluster_modelG = G_model      
			
 
				+        # Cluster H
			
 
				+        H_model, H_weights, H_losses = fl_train(args, train_dataset, cluster_modelH, H1, user_groupsH, args.Cepochs)
			
 
				+        local_weights.append(copy.deepcopy(H_weights))
			
 
				+        local_losses.append(copy.deepcopy(H_losses))
			
 
				+        cluster_modelH = H_model 
			
 
				+        
			
 
				+        
			
 
				+        # averaging global weights
			
 
				+        global_weights = average_weights(local_weights)
			
 
				+
			
 
				+        # update global weights
			
 
				+        global_model.load_state_dict(global_weights)
			
 
				+
			
 
				+        loss_avg = sum(local_losses) / len(local_losses)
			
 
				+        train_loss.append(loss_avg)
			
 
				+        
			
 
				+        # ============== EVAL ============== 
			
 
				+        # Calculate avg training accuracy over all users at every epoch
			
 
				+        list_acc, list_loss = [], []
			
 
				+        global_model.eval()
			
 
				+        # print("========== idx ========== ", idx)
			
 
				+        for c in range(args.num_users):
			
 
				+        # for c in range(cluster_size):
			
 
				+        # C = np.random.choice(keylist, int(args.frac * args.num_users), replace=False) # random set of clients
			
 
				+        # print("C: ", C)
			
 
				+        # for c in C:
			
 
				+            local_model = LocalUpdate(args=args, dataset=train_dataset,
			
 
				+                                      idxs=user_groups[c], logger=logger)
			
 
				+            acc, loss = local_model.inference(model=global_model)
			
 
				+            list_acc.append(acc)
			
 
				+            list_loss.append(loss)
			
 
				+        train_accuracy.append(sum(list_acc)/len(list_acc))
			
 
				+        # Add
			
 
				+        testacc_check = 100*train_accuracy[-1]
			
 
				+        epoch = epoch + 1
			
 
				+
			
 
				+        # print global training loss after every 'i' rounds
			
 
				+        if (epoch+1) % print_every == 0:
			
 
				+            print(f' \nAvg Training Stats after {epoch+1} global rounds:')
			
 
				+            print(f'Training Loss : {np.mean(np.array(train_loss))}')
			
 
				+            print('Train Accuracy: {:.2f}% \n'.format(100*train_accuracy[-1]))
			
 
				+            
			
 
				+
			
 
				+    print('\n Total Run Time: {0:0.4f}'.format(time.time()-start_time))
			
 
				+
			
 
				+    # Test inference after completion of training
			
 
				+    test_acc, test_loss = test_inference(args, global_model, test_dataset)
			
 
				+
			
 
				+    # print(f' \n Results after {args.epochs} global rounds of training:')
			
 
				+    print(f"\nAvg Training Stats after {epoch} global rounds:")
			
 
				+    print("|---- Avg Train Accuracy: {:.2f}%".format(100*train_accuracy[-1]))
			
 
				+    print("|---- Test Accuracy: {:.2f}%".format(100*test_acc))
			
 
				+
			
 
				+    # Saving the objects train_loss and train_accuracy:
			
 
				+    file_name = '../save/objects/HFL4_{}_{}_{}_lr[{}]_C[{}]_iid[{}]_E[{}]_B[{}].pkl'.\
			
 
				+    format(args.dataset, args.model, epoch, args.lr, args.frac, args.iid,
			
 
				+           args.local_ep, args.local_bs)
			
 
				+
			
 
				+    with open(file_name, 'wb') as f:
			
 
				+        pickle.dump([train_loss, train_accuracy], f)
			
--- a/src/federated-hierarchical_v1_twoclusters-changeEval.ipynb
+++ b/src/federated-hierarchical_v1_twoclusters-changeEval.ipynb
--- a/src/federated_main.py
+++ b/src/federated_main.py
@@ -52,7 +52,7 @@ if __name__ == '__main__':
 
				         len_in = 1
			
 
				         for x in img_size:
			
 
				             len_in *= x
			
 
				-            global_model = MLP(dim_in=len_in, dim_hidden=64,
			
 
				+            global_model = MLP(dim_in=len_in, dim_hidden=args.mlpdim,
			
 
				                                dim_out=args.num_classes)
			
 
				     else:
			
 
				         exit('Error: unrecognized model')
			
@@ -76,10 +76,12 @@ if __name__ == '__main__':
 
				     cv_loss, cv_acc = [], []
			
 
				     print_every = 1
			
 
				     val_loss_pre, counter = 0, 0
			
 
				-    testacc_check, epoch = 0, 0
			
 
				+    testacc_check, epoch = 0, 0 
			
 
				 
			
 
				     # for epoch in tqdm(range(args.epochs)):  # global training epochs
			
 
				-    while testacc_check < args.test_acc:
			
 
				+    # for epoch in range(args.epochs):
			
 
				+    while testacc_check < args.test_acc or epoch < args.epochs:
			
 
				+    # while testacc_check < args.test_acc:
			
 
				         local_weights, local_losses = [], [] # init empty local weights and local losses
			
 
				         print(f'\n | Global Training Round : {epoch+1} |\n') # starting with | Global Training Round : 1 |
			
 
				 
			
@@ -117,7 +119,7 @@ if __name__ == '__main__':
 
				 
			
 
				         for c in range(args.num_users): # 0 to 99
			
 
				             # local_model = LocalUpdate(args=args, dataset=train_dataset,
			
 
				-                                      # idxs=user_groups[idx], logger=logger)
			
 
				+            #                           idxs=user_groups[idx], logger=logger)
			
 
				             # Fix error idxs=user_groups[idx] to idxs=user_groups[c]                                      
			
 
				             local_model = LocalUpdate(args=args, dataset=train_dataset,
			
 
				                                       idxs=user_groups[c], logger=logger)
			
@@ -144,8 +146,8 @@ if __name__ == '__main__':
 
				     print("|---- Test Accuracy: {:.2f}%".format(100*test_acc))
			
 
				 
			
 
				     # Saving the objects train_loss and train_accuracy:
			
 
				-    file_name = '../save/objects/FL_{}_{}_{}_C[{}]_iid[{}]_E[{}]_B[{}].pkl'.\
			
 
				-        format(args.dataset, args.model, epoch, args.frac, args.iid,
			
 
				+    file_name = '../save/objects/FL_{}_{}_{}_lr[{}]_C[{}]_iid[{}]_E[{}]_B[{}].pkl'.\
			
 
				+        format(args.dataset, args.model, epoch, args.lr, args.frac, args.iid,
			
 
				                args.local_ep, args.local_bs)
			
 
				 
			
 
				     with open(file_name, 'wb') as f:
			
--- a/src/models.py
+++ b/src/models.py
@@ -23,7 +23,7 @@ import torch.nn.functional as F
 
				 #         x = self.layer_hidden(x)
			
 
				 #         return self.softmax(x)
			
 
				 
			
 
				-# Changed MLP model to 2 hidden layers with 200 units
			
 
				+# Change MLP model to 2 hidden layers with 200 units
			
 
				 class MLP(nn.Module):
			
 
				     def __init__(self, dim_in, dim_hidden, dim_out):
			
 
				         super(MLP, self).__init__()
			
@@ -48,6 +48,25 @@ class MLP(nn.Module):
 
				         return self.softmax(x)        
			
 
				 
			
 
				 
			
 
				+# class CNNMnist(nn.Module):
			
 
				+#     def __init__(self, args):
			
 
				+#         super(CNNMnist, self).__init__()
			
 
				+#         self.conv1 = nn.Conv2d(args.num_channels, 10, kernel_size=5)
			
 
				+#         self.conv2 = nn.Conv2d(10, 20, kernel_size=5)
			
 
				+#         self.conv2_drop = nn.Dropout2d()
			
 
				+#         self.fc1 = nn.Linear(320, 50)
			
 
				+#         self.fc2 = nn.Linear(50, args.num_classes)
			
 
				+
			
 
				+#     def forward(self, x):
			
 
				+#         x = F.relu(F.max_pool2d(self.conv1(x), 2))
			
 
				+#         x = F.relu(F.max_pool2d(self.conv2_drop(self.conv2(x)), 2))
			
 
				+#         x = x.view(-1, x.shape[1]*x.shape[2]*x.shape[3])
			
 
				+#         x = F.relu(self.fc1(x))
			
 
				+#         x = F.dropout(x, training=self.training)
			
 
				+#         x = self.fc2(x)
			
 
				+#         return F.log_softmax(x, dim=1)
			
 
				+
			
 
				+# Change CNN model to 
			
 
				 class CNNMnist(nn.Module):
			
 
				     def __init__(self, args):
			
 
				         super(CNNMnist, self).__init__()
			
--- a/src/options.py
+++ b/src/options.py
@@ -65,6 +65,7 @@ def args_parser():
 
				     parser.add_argument('--num_clusters', type=int, default=2, help='the number of clusters')
			
 
				     parser.add_argument('--test_acc', type=int, default=95, help='target test accuracy')
			
 
				     parser.add_argument('--Cepochs', type=int, default=5,help="number of rounds of training in each cluster")
			
 
				+    parser.add_argument('--mlpdim', type=int, default=200,help="MLP model hidden dimension")
			
 
				 
			
 
				     args = parser.parse_args()
			
 
				     return args
			
--- a/src/utils.py
+++ b/src/utils.py
@@ -34,6 +34,7 @@ def get_dataset(args):
 
				         # sample training data amongst users
			
 
				         if args.iid:
			
 
				             # Sample IID user data from Mnist
			
 
				+            print("Dataset: CIFAR10 IID")
			
 
				             user_groups = cifar_iid(train_dataset, args.num_users)
			
 
				         else:
			
 
				             # Sample Non-IID user data from Mnist
			
@@ -42,6 +43,7 @@ def get_dataset(args):
 
				                 raise NotImplementedError()
			
 
				             else:
			
 
				                 # Chose euqal splits for every user
			
 
				+                print("Dataset: CIFAR10 equal Non-IID")
			
 
				                 user_groups = cifar_noniid(train_dataset, args.num_users)
			
 
				 
			
 
				     elif args.dataset == 'mnist' or 'fmnist':
			
@@ -63,14 +65,17 @@ def get_dataset(args):
 
				         # sample training data amongst users
			
 
				         if args.iid:
			
 
				             # Sample IID user data from Mnist
			
 
				+            print("Dataset: MNIST IID")
			
 
				             user_groups = mnist_iid(train_dataset, args.num_users)
			
 
				         else:
			
 
				             # Sample Non-IID user data from Mnist
			
 
				             if args.unequal:
			
 
				+                print("Dataset: MNIST unequal Non-IID")
			
 
				                 # Chose uneuqal splits for every user
			
 
				                 user_groups = mnist_noniid_unequal(train_dataset, args.num_users)
			
 
				             else:
			
 
				-                # Chose euqal splits for every user
			
 
				+                # Chose equal splits for every user
			
 
				+                print("Dataset: MNIST equal Non-IID")
			
 
				                 user_groups = mnist_noniid(train_dataset, args.num_users)
			
 
				 
			
 
				     return train_dataset, test_dataset, user_groups