5 years ago · 3a0e28ed92
--- a/save/objects/Bad/HFL4_mnist_mlp_100_lr[0.01]_C[0.1]_iid[0]_E[1]_B[10].pkl
+++ b/save/objects/Bad/HFL4_mnist_mlp_100_lr[0.01]_C[0.1]_iid[0]_E[1]_B[10].pkl
--- a/save/objects/Bad/HFL4_mnist_mlp_100_lr[0.01]_C[0.1]_iid[1]_E[1]_B[10].pkl
+++ b/save/objects/Bad/HFL4_mnist_mlp_100_lr[0.01]_C[0.1]_iid[1]_E[1]_B[10].pkl
--- a/save/objects/Bad/HFL4_mnist_mlp_100_lr[0.05]_C[0.1]_iid[1]_E[1]_B[10].pkl
+++ b/save/objects/Bad/HFL4_mnist_mlp_100_lr[0.05]_C[0.1]_iid[1]_E[1]_B[10].pkl
--- a/save/objects/Bad/HFL4_mnist_mlp_150_lr[0.01]_C[0.1]_iid[1]_E[1]_B[10].pkl
+++ b/save/objects/Bad/HFL4_mnist_mlp_150_lr[0.01]_C[0.1]_iid[1]_E[1]_B[10].pkl
--- a/save/objects/Bad/clustersize25_HFL4_mnist_mlp_100_lr[0.01]_C[0.1]_iid[1]_E[1]_B[10].pkl
+++ b/save/objects/Bad/clustersize25_HFL4_mnist_mlp_100_lr[0.01]_C[0.1]_iid[1]_E[1]_B[10].pkl
--- a/save/objects/Bad/clustersize25_HFL4_mnist_mlp_100_lr[0.05]_C[0.1]_iid[0]_E[1]_B[10].pkl
+++ b/save/objects/Bad/clustersize25_HFL4_mnist_mlp_100_lr[0.05]_C[0.1]_iid[0]_E[1]_B[10].pkl
--- a/save/objects/FL_mnist_mlp_1196_lr[0.01]_C[0.1]_iid[0]_E[1]_B[10].pkl
+++ b/save/objects/FL_mnist_mlp_1196_lr[0.01]_C[0.1]_iid[0]_E[1]_B[10].pkl
--- a/save/objects/FL_mnist_mlp_141_lr[0.1]_C[0.1]_iid[1]_E[1]_B[10].pkl
+++ b/save/objects/FL_mnist_mlp_141_lr[0.1]_C[0.1]_iid[1]_E[1]_B[10].pkl
--- a/save/objects/FL_mnist_mlp_302_lr[0.1]_C[0.1]_iid[0]_E[1]_B[10].pkl
+++ b/save/objects/FL_mnist_mlp_302_lr[0.1]_C[0.1]_iid[0]_E[1]_B[10].pkl
--- a/save/objects/FL_mnist_mlp_468_C[0.1]_iid[1]_E[1]_B[10].pkl
+++ b/save/objects/FL_mnist_mlp_468_C[0.1]_iid[1]_E[1]_B[10].pkl
--- a/save/objects/HFL2_mnist_mlp_100_lr[0.01]_C[0.1]_iid[1]_E[1]_B[10].pkl
+++ b/save/objects/HFL2_mnist_mlp_100_lr[0.01]_C[0.1]_iid[1]_E[1]_B[10].pkl
--- a/save/objects/HFL4_mnist_mlp_100_lr[0.05]_C[0.1]_iid[0]_E[1]_B[10].pkl
+++ b/save/objects/HFL4_mnist_mlp_100_lr[0.05]_C[0.1]_iid[0]_E[1]_B[10].pkl
--- a/save/objects/HFL4_mnist_mlp_150_lr[0.05]_C[0.1]_iid[0]_E[1]_B[10].pkl
+++ b/save/objects/HFL4_mnist_mlp_150_lr[0.05]_C[0.1]_iid[0]_E[1]_B[10].pkl
--- a/save/objects/Old/[10]_FL_mnist_cnn_3160_C[0.1]_iid[0]_E[1]_B[10].pkl
+++ b/save/objects/Old/[10]_FL_mnist_cnn_3160_C[0.1]_iid[0]_E[1]_B[10].pkl
--- a/save/objects/Old/[1]_FL_mnist_mlp_500_C[0.1]_iid[1]_E[1]_B[10].pkl
+++ b/save/objects/Old/[1]_FL_mnist_mlp_500_C[0.1]_iid[1]_E[1]_B[10].pkl
--- a/save/objects/Old/[2]_FL_mnist_mlp_1468_C[0.1]_iid[0]_E[1]_B[10].pkl
+++ b/save/objects/Old/[2]_FL_mnist_mlp_1468_C[0.1]_iid[0]_E[1]_B[10].pkl
--- a/save/objects/Old/[3]_HFL_mnist_mlp_500_C[0.1]_iid[1]_E[1]_B[10].pkl
+++ b/save/objects/Old/[3]_HFL_mnist_mlp_500_C[0.1]_iid[1]_E[1]_B[10].pkl
--- a/save/objects/Old/[9]_FL_mnist_cnn_1054_C[0.1]_iid[1]_E[1]_B[10].pkl
+++ b/save/objects/Old/[9]_FL_mnist_cnn_1054_C[0.1]_iid[1]_E[1]_B[10].pkl
--- a/save/objects/[1]FL_mnist_mlp_200_lr[0.05]_C[0.1]_iid[1]_E[1]_B[10].pkl
+++ b/save/objects/[1]FL_mnist_mlp_200_lr[0.05]_C[0.1]_iid[1]_E[1]_B[10].pkl
--- a/save/objects/[2]FL_mnist_mlp_302_lr[0.05]_C[0.1]_iid[0]_E[1]_B[10].pkl
+++ b/save/objects/[2]FL_mnist_mlp_302_lr[0.05]_C[0.1]_iid[0]_E[1]_B[10].pkl
--- a/save/objects/[3]HFL2_mnist_mlp_101_lr[0.05]_C[0.1]_iid[1]_E[1]_B[10].pkl
+++ b/save/objects/[3]HFL2_mnist_mlp_101_lr[0.05]_C[0.1]_iid[1]_E[1]_B[10].pkl
--- a/save/objects/[4]HFL2_mnist_mlp_101_lr[0.05]_C[0.1]_iid[0]_E[1]_B[10].pkl
+++ b/save/objects/[4]HFL2_mnist_mlp_101_lr[0.05]_C[0.1]_iid[0]_E[1]_B[10].pkl
--- a/src/.ipynb_checkpoints/federated-hierarchical_v1_twoclusters-changeEval-checkpoint.ipynb
+++ b/src/.ipynb_checkpoints/federated-hierarchical_v1_twoclusters-changeEval-checkpoint.ipynb
--- a/src/__pycache__/models.cpython-37.pyc
+++ b/src/__pycache__/models.cpython-37.pyc
--- a/src/__pycache__/options.cpython-37.pyc
+++ b/src/__pycache__/options.cpython-37.pyc
--- a/src/__pycache__/utils.cpython-37.pyc
+++ b/src/__pycache__/utils.cpython-37.pyc
--- a/src/federated-hierarchical2_main.py
+++ b/src/federated-hierarchical2_main.py
@@ -38,7 +38,7 @@ def build_model(args, train_dataset):
 
															         len_in = 1
														
 
															         for x in img_size:
														
 
															             len_in *= x
														
 
															-            global_model = MLP(dim_in=len_in, dim_hidden=64,
														
 
															+            global_model = MLP(dim_in=len_in, dim_hidden=args.mlpdim,
														
 
															                                dim_out=args.num_classes)
														
 
															     else:
														
 
															         exit('Error: unrecognized model')
														
@@ -61,7 +61,10 @@ def fl_train(args, train_dataset, cluster_global_model, cluster, usergrp, epochs
 
															         cluster_global_model.train()
														
 
															         # m = max(int(args.frac * len(cluster)), 1)
														
 
															-        m = max(int(math.ceil(args.frac * len(cluster))), 1)
														
 
															+        # m = max(int(math.ceil(args.frac * len(cluster))), 1)
														
 
															+        m = min(int(len(cluster)), 10)
														
 
															+        # print("=== m ==== ", m)
														
 
															+        # m = 10
														
 
															         idxs_users = np.random.choice(cluster, m, replace=False)
														
@@ -85,17 +88,20 @@ def fl_train(args, train_dataset, cluster_global_model, cluster, usergrp, epochs
 
															         # Calculate avg training accuracy over all users at every epoch
														
 
															         list_acc, list_loss = [], []
														
 
															         cluster_global_model.eval()
														
 
															-        for c in range(len(cluster)):
														
 
															-            # local_model = LocalUpdate(args=args, dataset=train_dataset,
														
 
															-            #                           idxs=user_groups[c], logger=logger)
														
 
															-            local_model = LocalUpdate(args=args, dataset=train_dataset,
														
 
															-                                      idxs=user_groups[idx], logger=logger)
														
 
															-            acc, loss = local_model.inference(model=global_model)
														
 
															+        # C = np.random.choice(cluster, m, replace=False) # random set of clients
														
 
															+        # print("C: ", C)
														
 
															+        # for c in C:
														
 
															+        # for c in range(len(cluster)):  
														
 
															+        for c in idxs_users:      
														
 
															+            cluster_local_model = LocalUpdate(args=args, dataset=train_dataset, idxs=usergrp[c], logger=logger)
														
 
															+            # local_model = LocalUpdate(args=args, dataset=train_dataset,idxs=user_groups[idx], logger=logger)
														
 
															+            acc, loss = cluster_local_model.inference(model=global_model)
														
 
															             list_acc.append(acc)
														
 
															             list_loss.append(loss)
														
 
															-        cluster_train_acc.append(sum(list_acc)/len(list_acc))
														
 
															+        # cluster_train_acc.append(sum(list_acc)/len(list_acc))
														
 
															         # Add
														
 
															-    print("Cluster accuracy: ", 100*cluster_train_acc[-1]) 
														
 
															+    # print("Cluster accuracy: ", 100*cluster_train_acc[-1]) 
														
 
															+    print("Cluster accuracy: ", 100*sum(list_acc)/len(list_acc)) 
														
 
															     return cluster_global_model, cluster_global_weights, cluster_loss_avg
														
@@ -120,6 +126,8 @@ if __name__ == '__main__':
 
															     # load dataset and user groups
														
 
															     train_dataset, test_dataset, user_groupsold = get_dataset(args)
														
 
															+    # user_groups = user_groupsold
														
 
															+    # keylist = list(user_groups.keys())
														
 
															     # ======= Shuffle dataset ======= 
														
 
															     keys =  list(user_groupsold.keys())
														
 
															     random.shuffle(keys)
														
@@ -131,17 +139,20 @@ if __name__ == '__main__':
 
															     print("keylist: ", keylist)
														
 
															     # ======= Splitting into clusters. FL groups ======= 
														
 
															     cluster_size = int(args.num_users / args.num_clusters)
														
 
															-    print("Each cluster size: ", cluster_size)
														
 
															+    # cluster_size = 50
														
 
															+    # print("Each cluster size: ", cluster_size)
														
 
															     # Cluster 1
														
 
															     # A1 = np.arange(cluster_size, dtaype=int)
														
 
															     A1 = keylist[:cluster_size]
														
 
															+    # A1 = np.random.choice(keylist, cluster_size, replace=False)
														
 
															     print("A1: ", A1)
														
 
															     user_groupsA = {k:user_groups[k] for k in A1 if k in user_groups}
														
 
															     print("Size of cluster 1: ", len(user_groupsA))
														
 
															     # Cluster 2
														
 
															     # B1 = np.arange(cluster_size, cluster_size+cluster_size, dtype=int)
														
 
															     B1 = keylist[cluster_size:2*cluster_size]
														
 
															+    # B1 = np.random.choice(keylist, cluster_size, replace=False)
														
 
															     print("B1: ", B1)
														
 
															     user_groupsB = {k:user_groups[k] for k in B1 if k in user_groups}
														
 
															     print("Size of cluster 2: ", len(user_groupsB))
														
@@ -205,10 +216,13 @@ if __name__ == '__main__':
 
															     cv_loss, cv_acc = [], []
														
 
															     print_every = 1
														
 
															     val_loss_pre, counter = 0, 0
														
 
															-    testacc_check, epoch, idx = 0, 0, 0
														
 
															+    testacc_check, epoch = 0, 0 
														
 
															+    # idx = np.random.randint(0,99)
														
 
															-    for epoch in tqdm(range(args.epochs)):
														
 
															-    # while testacc_check < args.test_acc:
														
 
															+    # for epoch in tqdm(range(args.epochs)):
														
 
															+    # for epoch in range(args.epochs):
														
 
															+    # while testacc_check < args.test_acc or epoch < args.epochs:
														
 
															+    while epoch < args.epochs: 
														
 
															         local_weights, local_losses, local_accuracies= [], [], []
														
 
															         print(f'\n | Global Training Round : {epoch+1} |\n')
														
@@ -251,8 +265,12 @@ if __name__ == '__main__':
 
															         global_model.eval()
														
 
															         # print("========== idx ========== ", idx)
														
 
															         for c in range(args.num_users):
														
 
															+        # for c in range(cluster_size):
														
 
															+        # C = np.random.choice(keylist, int(args.frac * args.num_users), replace=False) # random set of clients
														
 
															+        # print("C: ", C)
														
 
															+        # for c in C:
														
 
															             local_model = LocalUpdate(args=args, dataset=train_dataset,
														
 
															-                                      idxs=user_groups[idx], logger=logger)
														
 
															+                                      idxs=user_groups[c], logger=logger)
														
 
															             acc, loss = local_model.inference(model=global_model)
														
 
															             list_acc.append(acc)
														
 
															             list_loss.append(loss)
														
@@ -279,8 +297,8 @@ if __name__ == '__main__':
 
															     print("|---- Test Accuracy: {:.2f}%".format(100*test_acc))
														
 
															     # Saving the objects train_loss and train_accuracy:
														
 
															-    file_name = '../save/objects/HFL_{}_{}_{}_C[{}]_iid[{}]_E[{}]_B[{}].pkl'.\
														
 
															-    format(args.dataset, args.model, epoch, args.frac, args.iid,
														
 
															+    file_name = '../save/objects/HFL2_{}_{}_{}_lr[{}]_C[{}]_iid[{}]_E[{}]_B[{}].pkl'.\
														
 
															+    format(args.dataset, args.model, epoch, args.lr, args.frac, args.iid,
														
 
															            args.local_ep, args.local_bs)
														
 
															     with open(file_name, 'wb') as f:
														
--- a/src/federated-hierarchical4_main.py
+++ b/src/federated-hierarchical4_main.py
@@ -0,0 +1,306 @@
 
															+#!/usr/bin/env python
														
 
															+# -*- coding: utf-8 -*-
														
 
															+# Python version: 3.6
														
 
															+
														
 
															+
														
 
															+import os
														
 
															+import copy
														
 
															+import time
														
 
															+import pickle
														
 
															+import numpy as np
														
 
															+from tqdm import tqdm
														
 
															+
														
 
															+import torch
														
 
															+from tensorboardX import SummaryWriter
														
 
															+
														
 
															+from options import args_parser
														
 
															+from update import LocalUpdate, test_inference
														
 
															+from models import MLP, CNNMnist, CNNFashion_Mnist, CNNCifar
														
 
															+from utils import get_dataset, average_weights, exp_details
														
 
															+import math
														
 
															+import random
														
 
															+
														
 
															+
														
 
															+# BUILD MODEL
														
 
															+def build_model(args, train_dataset):
														
 
															+    if args.model == 'cnn':
														
 
															+        # Convolutional neural network
														
 
															+        if args.dataset == 'mnist':
														
 
															+            global_model = CNNMnist(args=args)
														
 
															+        elif args.dataset == 'fmnist':
														
 
															+            global_model = CNNFashion_Mnist(args=args)
														
 
															+        elif args.dataset == 'cifar':
														
 
															+            global_model = CNNCifar(args=args)
														
 
															+
														
 
															+    elif args.model == 'mlp':
														
 
															+        # Multi-layer preceptron
														
 
															+        img_size = train_dataset[0][0].shape
														
 
															+        len_in = 1
														
 
															+        for x in img_size:
														
 
															+            len_in *= x
														
 
															+            global_model = MLP(dim_in=len_in, dim_hidden=args.mlpdim,
														
 
															+                               dim_out=args.num_classes)
														
 
															+    else:
														
 
															+        exit('Error: unrecognized model')
														
 
															+        
														
 
															+    return global_model
														
 
															+
														
 
															+
														
 
															+# Defining the training function
														
 
															+def fl_train(args, train_dataset, cluster_global_model, cluster, usergrp, epochs):
														
 
															+    
														
 
															+    cluster_train_loss, cluster_train_acc = [], []
														
 
															+    cluster_val_acc_list, cluster_net_list = [], []
														
 
															+    cluster_cv_loss, cluster_cv_acc = [], []
														
 
															+    # print_every = 1
														
 
															+    cluster_val_loss_pre, counter = 0, 0
														
 
															+
														
 
															+    for epoch in range(epochs):
														
 
															+        cluster_local_weights, cluster_local_losses = [], []
														
 
															+        # print(f'\n | Cluster Training Round : {epoch+1} |\n')
														
 
															+
														
 
															+        cluster_global_model.train()
														
 
															+        # m = max(int(args.frac * len(cluster)), 1)
														
 
															+        # m = max(int(math.ceil(args.frac * len(cluster))), 1)
														
 
															+        m = min(int(len(cluster)), 10)
														
 
															+        # print("=== m ==== ", m)
														
 
															+        idxs_users = np.random.choice(cluster, m, replace=False)
														
 
															+
														
 
															+
														
 
															+        for idx in idxs_users:
														
 
															+            cluster_local_model = LocalUpdate(args=args, dataset=train_dataset, idxs=usergrp[idx], logger=logger)
														
 
															+            cluster_w, cluster_loss = cluster_local_model.update_weights(model=copy.deepcopy(cluster_global_model), global_round=epoch)
														
 
															+            cluster_local_weights.append(copy.deepcopy(cluster_w))
														
 
															+            cluster_local_losses.append(copy.deepcopy(cluster_loss))
														
 
															+            # print('| Global Round : {} | User : {} | \tLoss: {:.6f}'.format(epoch, idx, cluster_loss))
														
 
															+
														
 
															+        # averaging global weights
														
 
															+        cluster_global_weights = average_weights(cluster_local_weights)
														
 
															+
														
 
															+        # update global weights
														
 
															+        cluster_global_model.load_state_dict(cluster_global_weights)
														
 
															+
														
 
															+        cluster_loss_avg = sum(cluster_local_losses) / len(cluster_local_losses)
														
 
															+        cluster_train_loss.append(cluster_loss_avg)
														
 
															+
														
 
															+        # ============== EVAL ============== 
														
 
															+        # Calculate avg training accuracy over all users at every epoch
														
 
															+        list_acc, list_loss = [], []
														
 
															+        cluster_global_model.eval()
														
 
															+        # C = np.random.choice(cluster, m, replace=False) # random set of clients
														
 
															+        # print("C: ", C)
														
 
															+        # for c in C:
														
 
															+        # for c in range(len(cluster)):     
														
 
															+        for c in idxs_users:   
														
 
															+            cluster_local_model = LocalUpdate(args=args, dataset=train_dataset, idxs=usergrp[c], logger=logger)
														
 
															+            # local_model = LocalUpdate(args=args, dataset=train_dataset,idxs=user_groups[idx], logger=logger)
														
 
															+            acc, loss = cluster_local_model.inference(model=global_model)
														
 
															+            list_acc.append(acc)
														
 
															+            list_loss.append(loss)
														
 
															+        # cluster_train_acc.append(sum(list_acc)/len(list_acc))
														
 
															+        # Add
														
 
															+    # print("Cluster accuracy: ", 100*cluster_train_acc[-1]) 
														
 
															+    print("Cluster accuracy: ", 100*sum(list_acc)/len(list_acc)) 
														
 
															+
														
 
															+    return cluster_global_model, cluster_global_weights, cluster_loss_avg
														
 
															+    
														
 
															+
														
 
															+
														
 
															+
														
 
															+
														
 
															+if __name__ == '__main__':
														
 
															+    start_time = time.time()
														
 
															+
														
 
															+    # define paths
														
 
															+    path_project = os.path.abspath('..')
														
 
															+    logger = SummaryWriter('../logs')
														
 
															+
														
 
															+    args = args_parser()
														
 
															+    exp_details(args)
														
 
															+
														
 
															+    if args.gpu:
														
 
															+        torch.cuda.set_device(args.gpu)
														
 
															+    device = 'cuda' if args.gpu else 'cpu'
														
 
															+
														
 
															+    # load dataset and user groups
														
 
															+    train_dataset, test_dataset, user_groupsold = get_dataset(args)
														
 
															+
														
 
															+    # user_groups = user_groupsold
														
 
															+    # keylist = list(user_groups.keys())
														
 
															+    # ======= Shuffle dataset ======= 
														
 
															+    keys =  list(user_groupsold.keys())
														
 
															+    random.shuffle(keys)
														
 
															+    user_groups = dict()
														
 
															+    for key in keys:
														
 
															+        user_groups.update({key:user_groupsold[key]})
														
 
															+    # print(user_groups.keys()) 
														
 
															+    keylist = list(user_groups.keys())
														
 
															+    print("keylist: ", keylist)
														
 
															+    # ======= Splitting into clusters. FL groups ======= 
														
 
															+    # cluster_size = int(args.num_users / args.num_clusters)    
														
 
															+    cluster_size = 50
														
 
															+    print("Each cluster size: ", cluster_size)
														
 
															+
														
 
															+    # Cluster 1
														
 
															+    # A1 = keylist[:cluster_size]
														
 
															+    A1 = np.random.choice(keylist, cluster_size, replace=False)
														
 
															+    print("A1: ", A1)
														
 
															+    user_groupsA = {k:user_groups[k] for k in A1 if k in user_groups}
														
 
															+    print("Size of cluster 1: ", len(user_groupsA))
														
 
															+    # Cluster 2
														
 
															+    # B1 = keylist[cluster_size:2*cluster_size]
														
 
															+    B1 = np.random.choice(keylist, cluster_size, replace=False)    
														
 
															+    print("B1: ", B1)
														
 
															+    user_groupsB = {k:user_groups[k] for k in B1 if k in user_groups}
														
 
															+    print("Size of cluster 2: ", len(user_groupsB))
														
 
															+    # Cluster 3
														
 
															+    # C1 = keylist[2*cluster_size:3*cluster_size]
														
 
															+    C1 = np.random.choice(keylist, cluster_size, replace=False)
														
 
															+    print("C1: ", C1)
														
 
															+    user_groupsC = {k:user_groups[k] for k in C1 if k in user_groups}
														
 
															+    print("Size of cluster 3: ", len(user_groupsC))
														
 
															+    # Cluster 4
														
 
															+    # D1 = keylist[3*cluster_size:4*cluster_size]
														
 
															+    D1 = np.random.choice(keylist, cluster_size, replace=False)
														
 
															+    print("D1: ", D1)
														
 
															+    user_groupsD = {k:user_groups[k] for k in D1 if k in user_groups}
														
 
															+    print("Size of cluster 4: ", len(user_groupsD))
														
 
															+
														
 
															+    # MODEL PARAM SUMMARY
														
 
															+    global_model = build_model(args, train_dataset)
														
 
															+    pytorch_total_params = sum(p.numel() for p in global_model.parameters())
														
 
															+    print("Model total number of parameters: ", pytorch_total_params)
														
 
															+
														
 
															+    # from torchsummary import summary
														
 
															+    # summary(global_model, (1, 28, 28))
														
 
															+    # global_model.parameters()
														
 
															+
														
 
															+    # Set the model to train and send it to device.
														
 
															+    global_model.to(device)
														
 
															+    global_model.train()
														
 
															+    print(global_model)
														
 
															+
														
 
															+    # copy weights
														
 
															+    global_weights = global_model.state_dict()
														
 
															+
														
 
															+
														
 
															+    # ======= Set the cluster models to train and send it to device. =======
														
 
															+    # Cluster A
														
 
															+    cluster_modelA = build_model(args, train_dataset)
														
 
															+    cluster_modelA.to(device)
														
 
															+    cluster_modelA.train()
														
 
															+    # copy weights
														
 
															+    cluster_modelA_weights = cluster_modelA.state_dict()
														
 
															+    # Cluster B
														
 
															+    cluster_modelB = build_model(args, train_dataset)
														
 
															+    cluster_modelB.to(device)
														
 
															+    cluster_modelB.train()
														
 
															+    # copy weights
														
 
															+    cluster_modelB_weights = cluster_modelB.state_dict()
														
 
															+    # Cluster C
														
 
															+    cluster_modelC = build_model(args, train_dataset)
														
 
															+    cluster_modelC.to(device)
														
 
															+    cluster_modelC.train()
														
 
															+    # copy weights
														
 
															+    cluster_modelC_weights = cluster_modelC.state_dict()
														
 
															+    # Cluster D
														
 
															+    cluster_modelD = build_model(args, train_dataset)
														
 
															+    cluster_modelD.to(device)
														
 
															+    cluster_modelD.train()
														
 
															+    # copy weights
														
 
															+    cluster_modelD_weights = cluster_modelD.state_dict()
														
 
															+
														
 
															+
														
 
															+    train_loss, train_accuracy = [], []
														
 
															+    val_acc_list, net_list = [], []
														
 
															+    cv_loss, cv_acc = [], []
														
 
															+    print_every = 1
														
 
															+    val_loss_pre, counter = 0, 0
														
 
															+    testacc_check, epoch = 0, 0 
														
 
															+    idx = np.random.randint(0,99)
														
 
															+
														
 
															+    # for epoch in tqdm(range(args.epochs)):
														
 
															+    # for epoch in range(args.epochs):
														
 
															+    # while testacc_check < args.test_acc or epoch < args.epochs:
														
 
															+    while epoch < args.epochs:        
														
 
															+        local_weights, local_losses, local_accuracies= [], [], []
														
 
															+        print(f'\n | Global Training Round : {epoch+1} |\n')
														
 
															+        
														
 
															+        # ============== TRAIN ==============
														
 
															+        global_model.train()
														
 
															+        
														
 
															+        # Cluster A
														
 
															+        A_model, A_weights, A_losses = fl_train(args, train_dataset, cluster_modelA, A1, user_groupsA, args.Cepochs)        
														
 
															+        local_weights.append(copy.deepcopy(A_weights))
														
 
															+        local_losses.append(copy.deepcopy(A_losses))    
														
 
															+        cluster_modelA = A_model    
														
 
															+        # Cluster B
														
 
															+        B_model, B_weights, B_losses = fl_train(args, train_dataset, cluster_modelB, B1, user_groupsB, args.Cepochs)
														
 
															+        local_weights.append(copy.deepcopy(B_weights))
														
 
															+        local_losses.append(copy.deepcopy(B_losses))
														
 
															+        cluster_modelB = B_model 
														
 
															+        # Cluster C
														
 
															+        C_model, C_weights, C_losses = fl_train(args, train_dataset, cluster_modelC, C1, user_groupsC, args.Cepochs)
														
 
															+        local_weights.append(copy.deepcopy(C_weights))
														
 
															+        local_losses.append(copy.deepcopy(C_losses))   
														
 
															+        cluster_modelC = C_model      
														
 
															+        # Cluster D
														
 
															+        D_model, D_weights, D_losses = fl_train(args, train_dataset, cluster_modelD, D1, user_groupsD, args.Cepochs)
														
 
															+        local_weights.append(copy.deepcopy(D_weights))
														
 
															+        local_losses.append(copy.deepcopy(D_losses))
														
 
															+        cluster_modelD = D_model 
														
 
															+        
														
 
															+        
														
 
															+        # averaging global weights
														
 
															+        global_weights = average_weights(local_weights)
														
 
															+
														
 
															+        # update global weights
														
 
															+        global_model.load_state_dict(global_weights)
														
 
															+
														
 
															+        loss_avg = sum(local_losses) / len(local_losses)
														
 
															+        train_loss.append(loss_avg)
														
 
															+        
														
 
															+        # ============== EVAL ============== 
														
 
															+        # Calculate avg training accuracy over all users at every epoch
														
 
															+        list_acc, list_loss = [], []
														
 
															+        global_model.eval()
														
 
															+        # print("========== idx ========== ", idx)
														
 
															+        for c in range(args.num_users):
														
 
															+        # for c in range(cluster_size):
														
 
															+        # C = np.random.choice(keylist, int(args.frac * args.num_users), replace=False) # random set of clients
														
 
															+        # print("C: ", C)
														
 
															+        # for c in C:
														
 
															+            local_model = LocalUpdate(args=args, dataset=train_dataset,
														
 
															+                                      idxs=user_groups[c], logger=logger)
														
 
															+            acc, loss = local_model.inference(model=global_model)
														
 
															+            list_acc.append(acc)
														
 
															+            list_loss.append(loss)
														
 
															+        train_accuracy.append(sum(list_acc)/len(list_acc))
														
 
															+        # Add
														
 
															+        testacc_check = 100*train_accuracy[-1]
														
 
															+        epoch = epoch + 1
														
 
															+
														
 
															+        # print global training loss after every 'i' rounds
														
 
															+        if (epoch+1) % print_every == 0:
														
 
															+            print(f' \nAvg Training Stats after {epoch+1} global rounds:')
														
 
															+            print(f'Training Loss : {np.mean(np.array(train_loss))}')
														
 
															+            print('Train Accuracy: {:.2f}% \n'.format(100*train_accuracy[-1]))
														
 
															+            
														
 
															+
														
 
															+    print('\n Total Run Time: {0:0.4f}'.format(time.time()-start_time))
														
 
															+
														
 
															+    # Test inference after completion of training
														
 
															+    test_acc, test_loss = test_inference(args, global_model, test_dataset)
														
 
															+
														
 
															+    # print(f' \n Results after {args.epochs} global rounds of training:')
														
 
															+    print(f"\nAvg Training Stats after {epoch} global rounds:")
														
 
															+    print("|---- Avg Train Accuracy: {:.2f}%".format(100*train_accuracy[-1]))
														
 
															+    print("|---- Test Accuracy: {:.2f}%".format(100*test_acc))
														
 
															+
														
 
															+    # Saving the objects train_loss and train_accuracy:
														
 
															+    file_name = '../save/objects/HFL4_{}_{}_{}_lr[{}]_C[{}]_iid[{}]_E[{}]_B[{}].pkl'.\
														
 
															+    format(args.dataset, args.model, epoch, args.lr, args.frac, args.iid,
														
 
															+           args.local_ep, args.local_bs)
														
 
															+
														
 
															+    with open(file_name, 'wb') as f:
														
 
															+        pickle.dump([train_loss, train_accuracy], f)
														
--- a/src/federated-hierarchical8_main.py
+++ b/src/federated-hierarchical8_main.py
@@ -0,0 +1,366 @@
 
															+#!/usr/bin/env python
														
 
															+# -*- coding: utf-8 -*-
														
 
															+# Python version: 3.6
														
 
															+
														
 
															+
														
 
															+import os
														
 
															+import copy
														
 
															+import time
														
 
															+import pickle
														
 
															+import numpy as np
														
 
															+from tqdm import tqdm
														
 
															+
														
 
															+import torch
														
 
															+from tensorboardX import SummaryWriter
														
 
															+
														
 
															+from options import args_parser
														
 
															+from update import LocalUpdate, test_inference
														
 
															+from models import MLP, CNNMnist, CNNFashion_Mnist, CNNCifar
														
 
															+from utils import get_dataset, average_weights, exp_details
														
 
															+import math
														
 
															+import random
														
 
															+
														
 
															+
														
 
															+# BUILD MODEL
														
 
															+def build_model(args, train_dataset):
														
 
															+    if args.model == 'cnn':
														
 
															+        # Convolutional neural network
														
 
															+        if args.dataset == 'mnist':
														
 
															+            global_model = CNNMnist(args=args)
														
 
															+        elif args.dataset == 'fmnist':
														
 
															+            global_model = CNNFashion_Mnist(args=args)
														
 
															+        elif args.dataset == 'cifar':
														
 
															+            global_model = CNNCifar(args=args)
														
 
															+
														
 
															+    elif args.model == 'mlp':
														
 
															+        # Multi-layer preceptron
														
 
															+        img_size = train_dataset[0][0].shape
														
 
															+        len_in = 1
														
 
															+        for x in img_size:
														
 
															+            len_in *= x
														
 
															+            global_model = MLP(dim_in=len_in, dim_hidden=args.mlpdim,
														
 
															+                               dim_out=args.num_classes)
														
 
															+    else:
														
 
															+        exit('Error: unrecognized model')
														
 
															+        
														
 
															+    return global_model
														
 
															+
														
 
															+
														
 
															+# Defining the training function
														
 
															+def fl_train(args, train_dataset, cluster_global_model, cluster, usergrp, epochs):
														
 
															+    
														
 
															+    cluster_train_loss, cluster_train_acc = [], []
														
 
															+    cluster_val_acc_list, cluster_net_list = [], []
														
 
															+    cluster_cv_loss, cluster_cv_acc = [], []
														
 
															+    # print_every = 1
														
 
															+    cluster_val_loss_pre, counter = 0, 0
														
 
															+
														
 
															+    for epoch in range(epochs):
														
 
															+        cluster_local_weights, cluster_local_losses = [], []
														
 
															+        # print(f'\n | Cluster Training Round : {epoch+1} |\n')
														
 
															+
														
 
															+        cluster_global_model.train()
														
 
															+        # m = max(int(args.frac * len(cluster)), 1)
														
 
															+        # m = max(int(math.ceil(args.frac * len(cluster))), 1)
														
 
															+        m = min(int(len(cluster)), 10)
														
 
															+        # print("=== m ==== ", m)
														
 
															+        idxs_users = np.random.choice(cluster, m, replace=False)
														
 
															+
														
 
															+
														
 
															+        for idx in idxs_users:
														
 
															+            cluster_local_model = LocalUpdate(args=args, dataset=train_dataset, idxs=usergrp[idx], logger=logger)
														
 
															+            cluster_w, cluster_loss = cluster_local_model.update_weights(model=copy.deepcopy(cluster_global_model), global_round=epoch)
														
 
															+            cluster_local_weights.append(copy.deepcopy(cluster_w))
														
 
															+            cluster_local_losses.append(copy.deepcopy(cluster_loss))
														
 
															+            # print('| Global Round : {} | User : {} | \tLoss: {:.6f}'.format(epoch, idx, cluster_loss))
														
 
															+
														
 
															+        # averaging global weights
														
 
															+        cluster_global_weights = average_weights(cluster_local_weights)
														
 
															+
														
 
															+        # update global weights
														
 
															+        cluster_global_model.load_state_dict(cluster_global_weights)
														
 
															+
														
 
															+        cluster_loss_avg = sum(cluster_local_losses) / len(cluster_local_losses)
														
 
															+        cluster_train_loss.append(cluster_loss_avg)
														
 
															+
														
 
															+        # ============== EVAL ============== 
														
 
															+        # Calculate avg training accuracy over all users at every epoch
														
 
															+        list_acc, list_loss = [], []
														
 
															+        cluster_global_model.eval()
														
 
															+        # C = np.random.choice(cluster, m, replace=False) # random set of clients
														
 
															+        # print("C: ", C)
														
 
															+        # for c in C:
														
 
															+        # for c in range(len(cluster)):  
														
 
															+        for c in idxs_users:      
														
 
															+            cluster_local_model = LocalUpdate(args=args, dataset=train_dataset, idxs=usergrp[c], logger=logger)
														
 
															+            # local_model = LocalUpdate(args=args, dataset=train_dataset,idxs=user_groups[idx], logger=logger)
														
 
															+            acc, loss = cluster_local_model.inference(model=global_model)
														
 
															+            list_acc.append(acc)
														
 
															+            list_loss.append(loss)
														
 
															+        # cluster_train_acc.append(sum(list_acc)/len(list_acc))
														
 
															+        # Add
														
 
															+    # print("Cluster accuracy: ", 100*cluster_train_acc[-1]) 
														
 
															+    print("Cluster accuracy: ", 100*sum(list_acc)/len(list_acc)) 
														
 
															+
														
 
															+    return cluster_global_model, cluster_global_weights, cluster_loss_avg
														
 
															+    
														
 
															+
														
 
															+
														
 
															+
														
 
															+
														
 
															+if __name__ == '__main__':
														
 
															+    start_time = time.time()
														
 
															+
														
 
															+    # define paths
														
 
															+    path_project = os.path.abspath('..')
														
 
															+    logger = SummaryWriter('../logs')
														
 
															+
														
 
															+    args = args_parser()
														
 
															+    exp_details(args)
														
 
															+
														
 
															+    if args.gpu:
														
 
															+        torch.cuda.set_device(args.gpu)
														
 
															+    device = 'cuda' if args.gpu else 'cpu'
														
 
															+
														
 
															+    # load dataset and user groups
														
 
															+    train_dataset, test_dataset, user_groupsold = get_dataset(args)
														
 
															+
														
 
															+    # user_groups = user_groupsold
														
 
															+    # keylist = list(user_groups.keys())
														
 
															+    # ======= Shuffle dataset ======= 
														
 
															+    keys =  list(user_groupsold.keys())
														
 
															+    random.shuffle(keys)
														
 
															+    user_groups = dict()
														
 
															+    for key in keys:
														
 
															+        user_groups.update({key:user_groupsold[key]})
														
 
															+    # print(user_groups.keys()) 
														
 
															+    keylist = list(user_groups.keys())
														
 
															+    print("keylist: ", keylist)
														
 
															+    # ======= Splitting into clusters. FL groups ======= 
														
 
															+    # cluster_size = int(args.num_users / args.num_clusters)    
														
 
															+    cluster_size = 50
														
 
															+    print("Each cluster size: ", cluster_size)
														
 
															+
														
 
															+    # Cluster 1
														
 
															+    # A1 = keylist[:cluster_size]
														
 
															+    A1 = np.random.choice(keylist, cluster_size, replace=False)
														
 
															+    print("A1: ", A1)
														
 
															+    user_groupsA = {k:user_groups[k] for k in A1 if k in user_groups}
														
 
															+    print("Size of cluster 1: ", len(user_groupsA))
														
 
															+    # Cluster 2
														
 
															+    # B1 = keylist[cluster_size:2*cluster_size]
														
 
															+    B1 = np.random.choice(keylist, cluster_size, replace=False)    
														
 
															+    print("B1: ", B1)
														
 
															+    user_groupsB = {k:user_groups[k] for k in B1 if k in user_groups}
														
 
															+    print("Size of cluster 2: ", len(user_groupsB))
														
 
															+    # Cluster 3
														
 
															+    # C1 = keylist[2*cluster_size:3*cluster_size]
														
 
															+    C1 = np.random.choice(keylist, cluster_size, replace=False)
														
 
															+    print("C1: ", C1)
														
 
															+    user_groupsC = {k:user_groups[k] for k in C1 if k in user_groups}
														
 
															+    print("Size of cluster 3: ", len(user_groupsC))
														
 
															+    # Cluster 4
														
 
															+    # D1 = keylist[3*cluster_size:4*cluster_size]
														
 
															+    D1 = np.random.choice(keylist, cluster_size, replace=False)
														
 
															+    print("D1: ", D1)
														
 
															+    user_groupsD = {k:user_groups[k] for k in D1 if k in user_groups}
														
 
															+    print("Size of cluster 4: ", len(user_groupsD))
														
 
															+
														
 
															+    # Cluster 5    
														
 
															+    E1 = np.random.choice(keylist, cluster_size, replace=False)
														
 
															+    print("E1: ", E1)
														
 
															+    user_groupsE = {k:user_groups[k] for k in E1 if k in user_groups}
														
 
															+    print("Size of cluster 5: ", len(user_groupsE))
														
 
															+    # Cluster 6
														
 
															+    F1 = np.random.choice(keylist, cluster_size, replace=False)    
														
 
															+    print("F1: ", F1)
														
 
															+    user_groupsF = {k:user_groups[k] for k in F1 if k in user_groups}
														
 
															+    print("Size of cluster 6: ", len(user_groupsF))
														
 
															+    # Cluster 7    
														
 
															+    G1 = np.random.choice(keylist, cluster_size, replace=False)
														
 
															+    print("G1: ", G1)
														
 
															+    user_groupsG = {k:user_groups[k] for k in G1 if k in user_groups}
														
 
															+    print("Size of cluster 7: ", len(user_groupsC))
														
 
															+    # Cluster 8
														
 
															+    H1 = np.random.choice(keylist, cluster_size, replace=False)
														
 
															+    print("H1: ", H1)
														
 
															+    user_groupsH = {k:user_groups[k] for k in H1 if k in user_groups}
														
 
															+    print("Size of cluster 8: ", len(user_groupsH))
														
 
															+
														
 
															+    # MODEL PARAM SUMMARY
														
 
															+    global_model = build_model(args, train_dataset)
														
 
															+    pytorch_total_params = sum(p.numel() for p in global_model.parameters())
														
 
															+    print("Model total number of parameters: ", pytorch_total_params)
														
 
															+
														
 
															+    # from torchsummary import summary
														
 
															+    # summary(global_model, (1, 28, 28))
														
 
															+    # global_model.parameters()
														
 
															+
														
 
															+    # Set the model to train and send it to device.
														
 
															+    global_model.to(device)
														
 
															+    global_model.train()
														
 
															+    print(global_model)
														
 
															+
														
 
															+    # copy weights
														
 
															+    global_weights = global_model.state_dict()
														
 
															+
														
 
															+
														
 
															+    # ======= Set the cluster models to train and send it to device. =======
														
 
															+    # Cluster A
														
 
															+    cluster_modelA = build_model(args, train_dataset)
														
 
															+    cluster_modelA.to(device)
														
 
															+    cluster_modelA.train()
														
 
															+    # copy weights
														
 
															+    cluster_modelA_weights = cluster_modelA.state_dict()
														
 
															+    # Cluster B
														
 
															+    cluster_modelB = build_model(args, train_dataset)
														
 
															+    cluster_modelB.to(device)
														
 
															+    cluster_modelB.train()
														
 
															+    cluster_modelB_weights = cluster_modelB.state_dict()
														
 
															+    # Cluster C
														
 
															+    cluster_modelC = build_model(args, train_dataset)
														
 
															+    cluster_modelC.to(device)
														
 
															+    cluster_modelC.train()
														
 
															+    cluster_modelC_weights = cluster_modelC.state_dict()
														
 
															+    # Cluster D
														
 
															+    cluster_modelD = build_model(args, train_dataset)
														
 
															+    cluster_modelD.to(device)
														
 
															+    cluster_modelD.train()
														
 
															+    cluster_modelD_weights = cluster_modelD.state_dict()
														
 
															+    # Cluster E
														
 
															+    cluster_modelE = build_model(args, train_dataset)
														
 
															+    cluster_modelE.to(device)
														
 
															+    cluster_modelE.train()
														
 
															+    cluster_modelE_weights = cluster_modelE.state_dict()
														
 
															+    # Cluster F
														
 
															+    cluster_modelF = build_model(args, train_dataset)
														
 
															+    cluster_modelF.to(device)
														
 
															+    cluster_modelF.train()
														
 
															+    cluster_modelF_weights = cluster_modelF.state_dict()
														
 
															+    # Cluster G
														
 
															+    cluster_modelG = build_model(args, train_dataset)
														
 
															+    cluster_modelG.to(device)
														
 
															+    cluster_modelG.train()
														
 
															+    cluster_modelG_weights = cluster_modelG.state_dict()
														
 
															+    # Cluster H
														
 
															+    cluster_modelH = build_model(args, train_dataset)
														
 
															+    cluster_modelH.to(device)
														
 
															+    cluster_modelH.train()
														
 
															+    # copy weights
														
 
															+    cluster_modelH_weights = cluster_modelH.state_dict()
														
 
															+
														
 
															+
														
 
															+    train_loss, train_accuracy = [], []
														
 
															+    val_acc_list, net_list = [], []
														
 
															+    cv_loss, cv_acc = [], []
														
 
															+    print_every = 1
														
 
															+    val_loss_pre, counter = 0, 0
														
 
															+    testacc_check, epoch = 0, 0 
														
 
															+    idx = np.random.randint(0,99)
														
 
															+
														
 
															+    # for epoch in tqdm(range(args.epochs)):
														
 
															+    # for epoch in range(args.epochs):
														
 
															+    # while testacc_check < args.test_acc or epoch < args.epochs:
														
 
															+    while epoch < args.epochs:        
														
 
															+        local_weights, local_losses, local_accuracies= [], [], []
														
 
															+        print(f'\n | Global Training Round : {epoch+1} |\n')
														
 
															+        
														
 
															+        # ============== TRAIN ==============
														
 
															+        global_model.train()
														
 
															+        
														
 
															+        # Cluster A
														
 
															+        A_model, A_weights, A_losses = fl_train(args, train_dataset, cluster_modelA, A1, user_groupsA, args.Cepochs)        
														
 
															+        local_weights.append(copy.deepcopy(A_weights))
														
 
															+        local_losses.append(copy.deepcopy(A_losses))    
														
 
															+        cluster_modelA = A_model    
														
 
															+        # Cluster B
														
 
															+        B_model, B_weights, B_losses = fl_train(args, train_dataset, cluster_modelB, B1, user_groupsB, args.Cepochs)
														
 
															+        local_weights.append(copy.deepcopy(B_weights))
														
 
															+        local_losses.append(copy.deepcopy(B_losses))
														
 
															+        cluster_modelB = B_model 
														
 
															+        # Cluster C
														
 
															+        C_model, C_weights, C_losses = fl_train(args, train_dataset, cluster_modelC, C1, user_groupsC, args.Cepochs)
														
 
															+        local_weights.append(copy.deepcopy(C_weights))
														
 
															+        local_losses.append(copy.deepcopy(C_losses))   
														
 
															+        cluster_modelC = C_model      
														
 
															+        # Cluster D
														
 
															+        D_model, D_weights, D_losses = fl_train(args, train_dataset, cluster_modelD, D1, user_groupsD, args.Cepochs)
														
 
															+        local_weights.append(copy.deepcopy(D_weights))
														
 
															+        local_losses.append(copy.deepcopy(D_losses))
														
 
															+        cluster_modelD = D_model 
														
 
															+
														
 
															+        # Cluster E
														
 
															+        E_model, E_weights, E_losses = fl_train(args, train_dataset, cluster_modelE, E1, user_groupsE, args.Cepochs)        
														
 
															+        local_weights.append(copy.deepcopy(E_weights))
														
 
															+        local_losses.append(copy.deepcopy(E_losses))    
														
 
															+        cluster_modelE = E_model    
														
 
															+        # Cluster F
														
 
															+        F_model, F_weights, F_losses = fl_train(args, train_dataset, cluster_modelF, F1, user_groupsF, args.Cepochs)
														
 
															+        local_weights.append(copy.deepcopy(F_weights))
														
 
															+        local_losses.append(copy.deepcopy(F_losses))
														
 
															+        cluster_modelF = F_model 
														
 
															+        # Cluster G
														
 
															+        G_model, G_weights, G_losses = fl_train(args, train_dataset, cluster_modelG, G1, user_groupsG, args.Cepochs)
														
 
															+        local_weights.append(copy.deepcopy(G_weights))
														
 
															+        local_losses.append(copy.deepcopy(G_losses))   
														
 
															+        cluster_modelG = G_model      
														
 
															+        # Cluster H
														
 
															+        H_model, H_weights, H_losses = fl_train(args, train_dataset, cluster_modelH, H1, user_groupsH, args.Cepochs)
														
 
															+        local_weights.append(copy.deepcopy(H_weights))
														
 
															+        local_losses.append(copy.deepcopy(H_losses))
														
 
															+        cluster_modelH = H_model 
														
 
															+        
														
 
															+        
														
 
															+        # averaging global weights
														
 
															+        global_weights = average_weights(local_weights)
														
 
															+
														
 
															+        # update global weights
														
 
															+        global_model.load_state_dict(global_weights)
														
 
															+
														
 
															+        loss_avg = sum(local_losses) / len(local_losses)
														
 
															+        train_loss.append(loss_avg)
														
 
															+        
														
 
															+        # ============== EVAL ============== 
														
 
															+        # Calculate avg training accuracy over all users at every epoch
														
 
															+        list_acc, list_loss = [], []
														
 
															+        global_model.eval()
														
 
															+        # print("========== idx ========== ", idx)
														
 
															+        for c in range(args.num_users):
														
 
															+        # for c in range(cluster_size):
														
 
															+        # C = np.random.choice(keylist, int(args.frac * args.num_users), replace=False) # random set of clients
														
 
															+        # print("C: ", C)
														
 
															+        # for c in C:
														
 
															+            local_model = LocalUpdate(args=args, dataset=train_dataset,
														
 
															+                                      idxs=user_groups[c], logger=logger)
														
 
															+            acc, loss = local_model.inference(model=global_model)
														
 
															+            list_acc.append(acc)
														
 
															+            list_loss.append(loss)
														
 
															+        train_accuracy.append(sum(list_acc)/len(list_acc))
														
 
															+        # Add
														
 
															+        testacc_check = 100*train_accuracy[-1]
														
 
															+        epoch = epoch + 1
														
 
															+
														
 
															+        # print global training loss after every 'i' rounds
														
 
															+        if (epoch+1) % print_every == 0:
														
 
															+            print(f' \nAvg Training Stats after {epoch+1} global rounds:')
														
 
															+            print(f'Training Loss : {np.mean(np.array(train_loss))}')
														
 
															+            print('Train Accuracy: {:.2f}% \n'.format(100*train_accuracy[-1]))
														
 
															+            
														
 
															+
														
 
															+    print('\n Total Run Time: {0:0.4f}'.format(time.time()-start_time))
														
 
															+
														
 
															+    # Test inference after completion of training
														
 
															+    test_acc, test_loss = test_inference(args, global_model, test_dataset)
														
 
															+
														
 
															+    # print(f' \n Results after {args.epochs} global rounds of training:')
														
 
															+    print(f"\nAvg Training Stats after {epoch} global rounds:")
														
 
															+    print("|---- Avg Train Accuracy: {:.2f}%".format(100*train_accuracy[-1]))
														
 
															+    print("|---- Test Accuracy: {:.2f}%".format(100*test_acc))
														
 
															+
														
 
															+    # Saving the objects train_loss and train_accuracy:
														
 
															+    file_name = '../save/objects/HFL4_{}_{}_{}_lr[{}]_C[{}]_iid[{}]_E[{}]_B[{}].pkl'.\
														
 
															+    format(args.dataset, args.model, epoch, args.lr, args.frac, args.iid,
														
 
															+           args.local_ep, args.local_bs)
														
 
															+
														
 
															+    with open(file_name, 'wb') as f:
														
 
															+        pickle.dump([train_loss, train_accuracy], f)
														
--- a/src/federated-hierarchical_v1_twoclusters-changeEval.ipynb
+++ b/src/federated-hierarchical_v1_twoclusters-changeEval.ipynb
--- a/src/federated_main.py
+++ b/src/federated_main.py
@@ -52,7 +52,7 @@ if __name__ == '__main__':
 
															         len_in = 1
														
 
															         for x in img_size:
														
 
															             len_in *= x
														
 
															-            global_model = MLP(dim_in=len_in, dim_hidden=64,
														
 
															+            global_model = MLP(dim_in=len_in, dim_hidden=args.mlpdim,
														
 
															                                dim_out=args.num_classes)
														
 
															     else:
														
 
															         exit('Error: unrecognized model')
														
@@ -76,10 +76,12 @@ if __name__ == '__main__':
 
															     cv_loss, cv_acc = [], []
														
 
															     print_every = 1
														
 
															     val_loss_pre, counter = 0, 0
														
 
															-    testacc_check, epoch = 0, 0
														
 
															+    testacc_check, epoch = 0, 0 
														
 
															     # for epoch in tqdm(range(args.epochs)):  # global training epochs
														
 
															-    while testacc_check < args.test_acc:
														
 
															+    # for epoch in range(args.epochs):
														
 
															+    while testacc_check < args.test_acc or epoch < args.epochs:
														
 
															+    # while testacc_check < args.test_acc:
														
 
															         local_weights, local_losses = [], [] # init empty local weights and local losses
														
 
															         print(f'\n | Global Training Round : {epoch+1} |\n') # starting with | Global Training Round : 1 |
														
@@ -117,7 +119,7 @@ if __name__ == '__main__':
 
															         for c in range(args.num_users): # 0 to 99
														
 
															             # local_model = LocalUpdate(args=args, dataset=train_dataset,
														
 
															-                                      # idxs=user_groups[idx], logger=logger)
														
 
															+            #                           idxs=user_groups[idx], logger=logger)
														
 
															             # Fix error idxs=user_groups[idx] to idxs=user_groups[c]                                      
														
 
															             local_model = LocalUpdate(args=args, dataset=train_dataset,
														
 
															                                       idxs=user_groups[c], logger=logger)
														
@@ -144,8 +146,8 @@ if __name__ == '__main__':
 
															     print("|---- Test Accuracy: {:.2f}%".format(100*test_acc))
														
 
															     # Saving the objects train_loss and train_accuracy:
														
 
															-    file_name = '../save/objects/FL_{}_{}_{}_C[{}]_iid[{}]_E[{}]_B[{}].pkl'.\
														
 
															-        format(args.dataset, args.model, epoch, args.frac, args.iid,
														
 
															+    file_name = '../save/objects/FL_{}_{}_{}_lr[{}]_C[{}]_iid[{}]_E[{}]_B[{}].pkl'.\
														
 
															+        format(args.dataset, args.model, epoch, args.lr, args.frac, args.iid,
														
 
															                args.local_ep, args.local_bs)
														
 
															     with open(file_name, 'wb') as f:
														
--- a/src/models.py
+++ b/src/models.py
@@ -23,7 +23,7 @@ import torch.nn.functional as F
 
															 #         x = self.layer_hidden(x)
														
 
															 #         return self.softmax(x)
														
 
															-# Changed MLP model to 2 hidden layers with 200 units
														
 
															+# Change MLP model to 2 hidden layers with 200 units
														
 
															 class MLP(nn.Module):
														
 
															     def __init__(self, dim_in, dim_hidden, dim_out):
														
 
															         super(MLP, self).__init__()
														
@@ -48,6 +48,25 @@ class MLP(nn.Module):
 
															         return self.softmax(x)        
														
 
															+# class CNNMnist(nn.Module):
														
 
															+#     def __init__(self, args):
														
 
															+#         super(CNNMnist, self).__init__()
														
 
															+#         self.conv1 = nn.Conv2d(args.num_channels, 10, kernel_size=5)
														
 
															+#         self.conv2 = nn.Conv2d(10, 20, kernel_size=5)
														
 
															+#         self.conv2_drop = nn.Dropout2d()
														
 
															+#         self.fc1 = nn.Linear(320, 50)
														
 
															+#         self.fc2 = nn.Linear(50, args.num_classes)
														
 
															+
														
 
															+#     def forward(self, x):
														
 
															+#         x = F.relu(F.max_pool2d(self.conv1(x), 2))
														
 
															+#         x = F.relu(F.max_pool2d(self.conv2_drop(self.conv2(x)), 2))
														
 
															+#         x = x.view(-1, x.shape[1]*x.shape[2]*x.shape[3])
														
 
															+#         x = F.relu(self.fc1(x))
														
 
															+#         x = F.dropout(x, training=self.training)
														
 
															+#         x = self.fc2(x)
														
 
															+#         return F.log_softmax(x, dim=1)
														
 
															+
														
 
															+# Change CNN model to 
														
 
															 class CNNMnist(nn.Module):
														
 
															     def __init__(self, args):
														
 
															         super(CNNMnist, self).__init__()
														
--- a/src/options.py
+++ b/src/options.py
@@ -65,6 +65,7 @@ def args_parser():
 
															     parser.add_argument('--num_clusters', type=int, default=2, help='the number of clusters')
														
 
															     parser.add_argument('--test_acc', type=int, default=95, help='target test accuracy')
														
 
															     parser.add_argument('--Cepochs', type=int, default=5,help="number of rounds of training in each cluster")
														
 
															+    parser.add_argument('--mlpdim', type=int, default=200,help="MLP model hidden dimension")
														
 
															     args = parser.parse_args()
														
 
															     return args
														
--- a/src/utils.py
+++ b/src/utils.py
@@ -34,6 +34,7 @@ def get_dataset(args):
 
															         # sample training data amongst users
														
 
															         if args.iid:
														
 
															             # Sample IID user data from Mnist
														
 
															+            print("Dataset: CIFAR10 IID")
														
 
															             user_groups = cifar_iid(train_dataset, args.num_users)
														
 
															         else:
														
 
															             # Sample Non-IID user data from Mnist
														
@@ -42,6 +43,7 @@ def get_dataset(args):
 
															                 raise NotImplementedError()
														
 
															             else:
														
 
															                 # Chose euqal splits for every user
														
 
															+                print("Dataset: CIFAR10 equal Non-IID")
														
 
															                 user_groups = cifar_noniid(train_dataset, args.num_users)
														
 
															     elif args.dataset == 'mnist' or 'fmnist':
														
@@ -63,14 +65,17 @@ def get_dataset(args):
 
															         # sample training data amongst users
														
 
															         if args.iid:
														
 
															             # Sample IID user data from Mnist
														
 
															+            print("Dataset: MNIST IID")
														
 
															             user_groups = mnist_iid(train_dataset, args.num_users)
														
 
															         else:
														
 
															             # Sample Non-IID user data from Mnist
														
 
															             if args.unequal:
														
 
															+                print("Dataset: MNIST unequal Non-IID")
														
 
															                 # Chose uneuqal splits for every user
														
 
															                 user_groups = mnist_noniid_unequal(train_dataset, args.num_users)
														
 
															             else:
														
 
															-                # Chose euqal splits for every user
														
 
															+                # Chose equal splits for every user
														
 
															+                print("Dataset: MNIST equal Non-IID")
														
 
															                 user_groups = mnist_noniid(train_dataset, args.num_users)
														
 
															     return train_dataset, test_dataset, user_groups