Tips for a Neural network model training

The Major 3 Steps in a Neural network Model Training

Method	Which is the step this method apply	Benefits
Adagrad, RMSProp, Momentum, Adam, etc.	Find the best function	Better Optimization (not for Generalization)
AdamW	Find the best function	Better Generalization (cf. Adam), Better Optimization (cf. Vanilla Gradient Descent), (not for Optimization cf. Adam)
Dropout	Find the best function	Better Generalization
Weight Decay	Find the best function	Better Generalization
Initialization (e.g., pre-train)	Find the best function	Better Optimization, Better Generalization
CNN (e.g., for image)	Change search the scope of the function	Better Generalization
Skip Connection	Change search the scope of the function	Better Optimization
Normalization	Change search the scope of the function	Better Optimization, (Sometimes Better Generalization)
Do not use accuracy as loss	What I am looking for	Better Optimization
More training data	What I am looking for	Better Generalization
Data Augmentation (e.g. Mixup)	What I am looking for	Better Generalization
Semi-supervised (e.g., Entropy, Graph)	What I am looking for	Better Generalization
Parameter Regularization	What I am looking for	Better Generalization

方法名	改了那一個步驟	帶來什麼好處
Adagrad, RMSProp, Momentum, Adam, etc.	找最好的函式	Better Optimization
AdamW	找最好的函式	Better Generalization (cf. Adam), Better Optimization (cf. Vanilla Gradient Descent), (not for Optimization cf. Adam)
Dropout	找最好的函式	Better Generalization
Weight Decay	找最好的函式	Better Generalization
Initialization (e.g., pre-train)	找最好的函式	Better Optimization, Better Generalization
CNN (e.g., for image)	改變函式搜尋範圍	Better Generalization
Skip Connection	改變函式搜尋範圍	Better Optimization
Normalization	改變函式搜尋範圍	Better Optimization, (Sometimes Better Generalization)
Do not use accuracy as loss	我要找什麼	Better Optimization
More training data	我要找什麼	Better Generalization
Data Augmentation (e.g. Mixup)	我要找什麼	Better Generalization
Semi-supervised (e.g., Entropy, Graph)	我要找什麼	Better Generalization
Parameter Regularization	我要找甚麼	Better Generalization

Reference: https://speech.ee.ntu.edu.tw/~hylee/GenAI-ML/2025-fall-course-data/TrainingTip.pdf