Firsh Push at 20241207

2024-12-07 02:00:39 +08:00
commit 4bd0ae023d
122 changed files with 2804 additions and 0 deletions
--- a/Image_Process/Image_Generator.py
+++ b/Image_Process/Image_Generator.py
@@ -0,0 +1,201 @@
+from Read_and_process_image.ReadAndProcess import Read_image_and_Process_image
+from _validation.ValidationTheEnterData import validation_the_enter_data
+from Load_process.file_processing import Process_File
+from keras.preprocessing.image import ImageDataGenerator
+from Load_process.LoadData import Load_Data_Prepare
+
+class Image_generator():
+    '''製作資料強化'''
+    def __init__(self, Generator_Root, Labels) -> None:
+        self._validation = validation_the_enter_data()
+        self.stop = 0
+        self.Labels = Labels
+        self.Generator_Root = Generator_Root        
+        pass
+
+    def Processing_Main(self, Training_Dict_Data_Root):
+        data_size = 0
+
+        # 製作標準資料增強
+        '''
+            這裡我想要做的是依照paper上的資料強化IMAGE DATA COLLECTION AND IMPLEMENTATION OF DEEP LEARNING-BASED MODEL IN DETECTING MONKEYPOX DISEASE USING MODIFIED VGG16
+            產生出資料強化後的影像
+        '''
+        print("\nAugmentation one monkeypox image")
+        data_size = self.get_processing_Augmentation(Training_Dict_Data_Root, 1, data_size)
+        self.stop += data_size
+
+        # 製作標準資料增強
+        '''
+            這裡我想要做的是依照paper上的資料強化IMAGE DATA COLLECTION AND IMPLEMENTATION OF DEEP LEARNING-BASED MODEL IN DETECTING MONKEYPOX DISEASE USING MODIFIED VGG16
+            產生出資料強化後的影像
+        '''
+        print("\nAugmentation two monkeypox image")
+        data_size = self.get_processing_Augmentation(Training_Dict_Data_Root, 2, data_size)
+        self.stop += data_size
+
+        # 製作標準資料增強
+        '''
+            這裡我想要做的是依照paper上的資料強化IMAGE DATA COLLECTION AND IMPLEMENTATION OF DEEP LEARNING-BASED MODEL IN DETECTING MONKEYPOX DISEASE USING MODIFIED VGG16
+            產生出資料強化後的影像
+        '''
+        print("\nAugmentation three monkeypox image")
+        data_size = self.get_processing_Augmentation(Training_Dict_Data_Root, 3, data_size)
+        self.stop += data_size
+        
+
+        # 製作標準資料增強
+        '''
+            這裡我想要做的是依照paper上的資料強化IMAGE DATA COLLECTION AND IMPLEMENTATION OF DEEP LEARNING-BASED MODEL IN DETECTING MONKEYPOX DISEASE USING MODIFIED VGG16
+            產生出資料強化後的影像
+        '''
+        print("\nAugmentation four monkeypox image")
+        data_size = self.get_processing_Augmentation(Training_Dict_Data_Root, 4, data_size)
+
+        print()
+
+    def get_processing_Augmentation(self, original_image_root : dict, Augment_choose, data_size):
+        Prepaer = Load_Data_Prepare()
+
+        self.get_data_roots = original_image_root # 要處理的影像路徑
+        Prepaer.Set_Label_List(self.Labels)
+        data_size = self.Generator_main(self.Generator_Root, Augment_choose, data_size) # 執行
+        return data_size
+    
+    def Generator_main(self, save_roots, stardand, data_size):
+        '''
+            Parameter:
+                labels = 取得資料的標籤
+                save_root = 要儲存資料的地方
+                strardand = 要使用哪種Image Augmentation
+        '''
+        File = Process_File()
+
+        for label in self.Labels: # 分別對所有類別進行資料強化
+            image = self.load_data(label) # 取的資料
+            save_root = File.Make_Save_Root(label, save_roots) # 合併路徑
+
+            if File.JudgeRoot_MakeDir(save_root): # 判斷要存的資料夾存不存在，不存在則創立
+                print("The file is exist")
+
+            train_Generator = self.Generator_Content(stardand) # 取的要做怎樣的資料強化
+            stop_counter = 0
+            for batches in train_Generator.flow(image, batch_size = 16): # 執行資料強化
+                ''' 
+                    程式碼中的 batch_size 參數被設置為 12, 這表示每次從訓練資料集中產生 12 個影像資料，作為一個 batch。當程式碼迭代 train_Generator 物件時，每次從訓練資料集中取出一個 batch 的影像，並逐一處理其中的每個影像。
+
+                    在迭代過程中, counter 變數用於計算存儲的 Numpy 陣列檔案的數量，而 i 變數用於計算迭代的次數。當 i 的值是 417 的倍數時, if i % 417 == 0: 條件就會成立，進而執行 break 語句，退出外層迴圈。因此，最多只會從訓
+                    練資料集中產生 417 個 batch 的影像資料。如果資料集中的影像總數不能被 12 整除，最後一個 batch 的影像數量會少於 12。因此, 最終產生的 Numpy 陣列檔案數量可能小於 image 資料集的影像總數除以 12。
+
+                    總之，根據程式碼的設計，最多只會從訓練資料集中產生 417 個 batch 的影像資料，並將它們存儲為 Numpy 陣列檔案。在最後一個 batch 中的影像數量可能少於 12。
+
+                    * train_Generator: 是一個ImageDataGenerator物件, 它從訓練資料中產生影像資料，這些影像資料可以用於訓練神經網路模型。
+                    * flow(): 方法是ImageDataGenerator物件的一個方法, 它可以從資料集中產生一個batch的影像資料。image 是要傳遞給ImageDataGenerator的影像資料, batch_size 是一個batch中包含的影像數量。
+                    * for batch in train_Generator.flow(image, batch_size = 12): 語句會迭代ImageDataGenerator物件產生的影像batch, 這些影像batch會逐一傳遞給batch 變數。
+                    * for batches in batch: 語句會迭代batch中的每個影像資料, 這些影像資料會逐一傳遞給batches 變數。
+                    * self.save_dir("image_" + label + str(counter) + ".npy", batches): 語句會以Numpy陣列的形式將每個影像資料存儲為一個Numpy陣列檔案, 檔案名稱會包含影像標籤和計數器。
+                    * counter += 1: 語句會將計數器增加1, 以便標識存儲的Numpy陣列檔案。
+                    * i += 1: 語句會增加迭代器的值, 以便在每417個影像batch之後退出迴圈。
+                    * if i % 417 == 0: break 語句會檢查迭代器是否達到了417的倍數, 如果是, 就會退出外層的迴圈, 以便結束影像資料的存儲。
+                '''
+                for batch in batches: # 分別抓出每一張照片來儲存
+                    File.Save_CV2_File("image_" + label + str(data_size) + ".png", save_root, batch) # 存檔
+                    data_size += 1
+                    stop_counter += 1
+
+                if stop_counter >= self.stop: # 若做指定次數則停止
+                    break
+            print(str(label) + "有" + str(stop_counter) + "筆資料")
+
+        return data_size
+
+    def load_data(self, label):
+        '''Images is readed by myself'''
+        image_processing = Read_image_and_Process_image()
+        img = image_processing.Data_Augmentation_Image(self.get_data_roots[label])
+
+        self.stop = len(img) * 1.5
+        return img
+    
+    def Generator_Content(self, judge): # 影像資料增強
+        '''
+        ImageGenerator的參數:
+            featurewise_center : 布爾值。將輸入數據的均值設置為0，逐特徵進行。
+            samplewise_center : 布爾值。將每個樣本的均值設置為0。
+            featurewise_std_normalization : Boolean. 布爾值。將輸入除以數據標準差，逐特徵進行。
+            samplewise_std_normalization : 布爾值。將每個輸入除以其標準差。
+            zca_epsilon : ZCA 白化的epsilon 值，默認為1e-6。
+            zca_whitening : 布爾值。是否應用ZCA 白化。
+            rotation_range : 整數。隨機旋轉的度數範圍。
+            width_shift_range : 浮點數、一維數組或整數
+                float: 如果<1，則是除以總寬度的值，或者如果>=1，則為像素值。
+                1-D 數組: 數組中的隨機元素。
+                int: 來自間隔 (-width_shift_range, +width_shift_range) 之間的整數個像素。
+                width_shift_range=2時，可能值是整數[-1, 0, +1]，與 width_shift_range=[-1, 0, +1] 相同；而 width_shift_range=1.0 時，可能值是 [-1.0, +1.0) 之間的浮點數。
+            height_shift_range : 浮點數、一維數組或整數
+                float: 如果<1，則是除以總寬度的值，或者如果>=1，則為像素值。
+                1-D array-like: 數組中的隨機元素。
+                int: 來自間隔 (-height_shift_range, +height_shift_range) 之間的整數個像素。
+                height_shift_range=2時，可能值是整數[-1, 0, +1]，與 height_shift_range=[-1, 0, +1] 相同；而 height_shift_range=1.0 時，可能值是 [-1.0, +1.0) 之間的浮點數。
+            shear_range : 浮點數。剪切強度（以弧度逆時針方向剪切角度）。
+            zoom_range : 浮點數或[lower, upper]。隨機縮放範圍。如果是浮點數，[lower, upper] = [1-zoom_range, 1+zoom_range]。
+            channel_shift_range : 浮點數。隨機通道轉換的範圍。
+            fill_mode : {"constant", "nearest", "reflect" or "wrap"} 之一。默認為'nearest'。輸入邊界以外的點根據給定的模式填充：
+                'constant': kkkkkkkk|abcd|kkkkkkkk (cval=k)
+                'nearest': aaaaaaaa|abcd|dddddddd
+                'reflect': abcddcba|abcd|dcbaabcd
+                'wrap': abcdabcd|abcd|abcdabcd
+            cval : 浮點數或整數。用於邊界之外的點的值，當 fill_mode = "constant" 時。
+            horizontal_flip : 布爾值。隨機水平翻轉。
+            vertical_flip : 布爾值。隨機垂直翻轉。
+            rescale : 重縮放因子。默認為None。如果是None 或0，不進行縮放，否則將數據乘以所提供的值（在應用任何其他轉換之前）。
+            preprocessing_function : 應用於每個輸入的函數。這個函數會在任何其他改變之前運行。這個函數需要一個參數：一張圖像（秩為3 的Numpy 張量），並且應該輸出一個同尺寸的Numpy 張量。
+            data_format : 圖像數據格式，{"channels_first", "channels_last"} 之一。"channels_last" 模式表示圖像輸入尺寸應該為(samples, height, width, channels)，"channels_first" 模式表示輸入尺寸應該為(samples, channels, height, width)。默認為在Keras 配置文件 ~/.keras/keras.json 中的 image_data_format 值。如果你從未設置它，那它就是"channels_last"。
+            validation_split : 浮點數。Float. 保留用於驗證的圖像的比例（嚴格在0和1之間）。
+            dtype : 生成數組使用的數據類型。
+        '''
+        if judge == 1:
+            datagen  = ImageDataGenerator(
+                        rotation_range=30,          # 旋轉影像
+                        width_shift_range=0.1,      # 圖像隨機水平移動，位移距離為圖像長度乘以參數(0.1)
+                        height_shift_range=0.1,     # 圖像隨機垂直移動，位移距離為圖像長度乘以參數(0.1)
+                        zoom_range=0.2,             # 隨機縮放範圍，[lower, upper] = [1-zoom_range, 1+zoom_range]   
+                        horizontal_flip=False,      # 水平翻轉
+                        vertical_flip=False,        # 垂直翻轉
+                        fill_mode='nearest'         # 在旋轉或平移造成空隙時，則空隙補常數
+                    )
+        if judge == 2:
+            datagen  = ImageDataGenerator(
+                        rotation_range=180,
+                        width_shift_range=0.2,
+                        height_shift_range=0.1,
+                        zoom_range=0.1,
+                        horizontal_flip=True,
+                        vertical_flip=True,
+                        fill_mode='nearest'
+            )
+        if judge == 3:
+            datagen = ImageDataGenerator(
+                rotation_range=45,          # 旋轉影像
+                width_shift_range=0.02,      # 圖像隨機水平移動，位移距離為圖像長度乘以參數(0.1)
+                height_shift_range=0.02,     # 圖像隨機垂直移動，位移距離為圖像長度乘以參數(0.1)
+                shear_range = 0.02,
+                zoom_range=0.02,             # 隨機縮放範圍，[lower, upper] = [1-zoom_range, 1+zoom_range]
+                horizontal_flip = True,
+                fill_mode = "reflect"
+            )
+        
+        if judge == 4: # 第二份paper的資料強化
+            datagen = ImageDataGenerator(
+                rotation_range=50,          # 旋轉影像
+                width_shift_range=0.2,      # 圖像隨機水平移動，位移距離為圖像長度乘以參數(0.1)
+                height_shift_range=0.2,     # 圖像隨機垂直移動，位移距離為圖像長度乘以參數(0.1)
+                shear_range = 0.25,
+                zoom_range=0.1,             # 隨機縮放範圍，[lower, upper] = [1-zoom_range, 1+zoom_range]
+                channel_shift_range = 20    # 隨機通道轉換的範圍
+            )
+
+        if judge == 5: # 第一份paper的資料強化
+            datagen = ImageDataGenerator(rescale = 1 / 255)
+
+        return datagen