[Bug Record] — binary classification accuracy converges to 0.5

本文首發於我的Medium
最近在研究寫文的平台，赫然發現這邊還能做自己的blog，而且Code很好打進文章，雖然Medium也可以，但就是一種卡卡的感覺。
近期會兩邊都發文，看看哪邊比較順，再定下來只用一邊。也可能一邊純心得，一邊純紀錄Code也說不定~
(以下正文開始XD)

記錄一下在訓練模型的時候採到的坑。

前陣子，我的模型在用測試用的Data時很正常，準確率很穩定的都97%~98%左右，但在換成論文要用的data後突然變成accuracy都只有0.5。

為此困擾了我很久我嘗試過很多方法，最後發現問題在哪的時候想穿越回去打死我自己QQ。

這個問題其實可以套用到不同的Classifier model上，當你的模型訓練的accuracy穩定維持在 1/n (分成n類)，你可以參考以下方法來解決你的問題:

檢查模型架構：使用model.summary()檢查模型架構，確認模型有真學進去。(看一下最下方的total parameter，大概可以了解你的模型有沒有好好學習)
檢查數據標籤(y or label)：
- 確認你的標籤是正確的，沒有標錯
- 確認標籤的type正確
- 確認標籤的size正確
檢查你的訓練資料有被打散: 最好每個batch中，每種類別的資料個數要均勻分配。確認Shuffle=True。
確認input shape: 不要懷疑，就算你能跑得動，你也可能是因為資料進去的樣子不太對，比如說一維data是用一、|或 ‧ 的樣子進去模型。
降低learning rage：把learning rate降低一些，比如說原本的0.1倍。
使用提早停止訓練機制: 防止overfitting，也防止你遇到本文的問題時，浪費很多時間在那邊0.5, 0.5, 0.5.....。
當模型正確率連續幾個epoch都沒有長進，就判斷已收斂並結束學習，tensorflow 2 有一個EarlyStopping可以拿來用，不過要注意使用，有時候誤用會有明明還沒訓練好但是提前結束的情況。或是你也可以自己手刻，手刻的好處是，你想要的全都有~