validationのlossが極端に低いやつはさっきの資料で言うところの先鋭化したロスにいるから汎化仕切ってない -> 同じ盆地にいない -> テストデータでの精度がそこまでよくない -> その重みを除去すると精度が上がったって理解できそう