ML Crash Course: Descending into ML: Training and Loss
Training ແບບຈຳລອງກະຄືກັບ ການສອນໃຜຄົນໜຶ່ງໃຫ້ຮູ້ໄດ້ເອງວ່າສິ່ງນັ້ນແມ່ນຫຍັງຈາກການທີ່ເຮົາໃຫ້ຂໍ້ມູນໃຫ້ກະເຂົາພ້ອມກັບຕົວຢ່າງນຳວ່າອັນນີ້ແມ່ນອັນນີ້ເດີ້ ອັນນີ້ແມ່ນອັນນັ້ນເດີ້ (determining) ຂໍ້ມູນທີ່ເຮົາເອົາມາສອນນັ້ນແມ່ນໄດ້ຈາກ ສຳປະສິດຄວາມຊັນຂອງເສັ້ນສະແດງ(weight) ແລະ bias ຈາກຂໍ້ມູນ (labeled example). ສຳລັບ supervised learning, ຫຼັກການ algorithm ຂອງ machine learning ກະຄືເຮົາຈະຕ້ອງຈະສ້າງແບບຈຳລອງໂດຍການກວດສອບຂໍ້ມູນຫຼາຍໆໂຕ ແລະ ຫາແບບຈຳລອງທີ່ມີຄ່າ loss ໜ້ອຍທີ່ສຸດ. ຂັ້ນຕອນນີ້ເຂົາເຈົ້າຈະເອີ້ນວ່າ empirical risk minimization.
Loss ແມ່ນຄວາມຜິດພາດທີ່ເກີດຂຶ້ນຈາກການຄຳນວນ (ພະຍາກອນ) ບໍ່ຖືກ. Loss ຄ່າໜຶ່ງທີ່ຊີ້ບອກວ່າ ແບບຈຳລອງຂອງເຮົານັ້ນຄຳນວນບໍ່ຖືກຫຼາຍສ່ຳໃດຈາກການຄຳນວນຂໍ້ມູນໜຶ່ງໂຕ. ຖ້າແບບຈຳລອງຂອງເຮົາຄຳນວນຖືກຕ້ອງ ຄ່າ loss ກໍຈະເທົ່າກັບ 0, ກົງກັນຂ້າມ ຖ້າແບບຈຳລອງຄຳນວນບໍ່ຖືກຄ່າ loss ກໍຈະສູງ. ເປົ້າໝາຍຂອງການ train ແບບຈຳລອງກະຄືການຫາຄ່າ weight ແລະ bias ທີ່ມີຄ່າ loss ໜ້ອຍທີ່ສຸດ. ຕົວຢ່າງ: ໃນຮູບດ້ານລຸ່ມຈະສະແດງໃຫ້ເຫັນ ແບບຈຳລອງທີ່ມີ loss ສູງ (ຊ້າຍມື) ແລະ ແບບຈຳລອງທີ່ມີຄ່າ loss ຕ່ຳ (ຂວາມື).
- ລູກສອນສີແດງໝາຍເຖິງ loss
- ເສັ້ນສະແດງສີຟ້າໝາຍເຖິງ ການຄຳນວນ (ການພະຍາກອນ)
ຖ້າເຮົາປຽບທຽບສອງຮູບນີ້ແລ້ວ ເຮົາຈະສັງເກດເຫັນວ່າ ລູກສອນສີແດງໃນຮູບດ້ານຊ້າຍມືຈະມີຂະໜາດທີ່ຍາວກ່ວາຮູບຂວາມື ແລະ ເສັ້ນສະແດງຂີດຜ່ານຮູບດ້ານຂວາມືກະຖືກຕ້ອງກ່ວາ.
Squared loss: ສົມຜົນ loss (function) ທີ່ນິຍົມໃຊ້ກັນ.
ໃນສົມຖົດຖອຍເສັ້ນຊື່ (linear regression) ທີ່ເຮົາກຳລັງສຶກສາຢູ່ນີ້ຈະໃຊ້ ສົມຜົນ loss ທີ່ມີຊື່ວ່າ: squared loss ຫຼື L2 loss. ການຄຳນວນຫາຄ່າ loss ຂອງຂໍ້ມູນໜຶ່ງໂຕ ສາມາດເຮັດໄດ້ດັ່ງນີ້:
= the square of the difference between the label and the prediction
= (observation - prediction(x))2
= (y - y')2
= ກຳລັງສອງຂອງຄ່າແຕກຕ່າງກັນລະຫວ່າງ label ກັບ prediction
= (ຄ່າຈິງ - ຄ່າທີ່ຄຳນວນໄດ້(x))2
= (y - y')2
ສຳລັບ ໃຜທີ່ຮຽນສະຖິຕິ loss ກະຄືກັບ residual ຂອງສົມຜົນ. ເຊິ່ງວ່າ e(error) = y – y’.
Mean square error (MSE) ແມ່ນ ຄ່າສະເລ່ຍຂອງ loss ຕໍ່ໜຶ່ງຂໍ້ມູນ. ໃນການຄິດໄລ່ MSE ນັ້ນເຮົາຈະຕ້ອງເອົາຜົນບວກຂອງ square loss ທັງໝົດ ມາຫານໃຫ້ ຈຳນວນຂອງຂໍ້ມູນ.
ຄຳອະທິບາຍ:
-
ແມ່ນຂໍ້ມູນທີ່ເຮົານຳເຂົ້າມາໄລ່ໃນສົມຜົນ
-
ແມ່ນ ຕົວປ່ຽນຕົ້ນ ທີ່ເຮົາເອົາມາຄຳນວນ (ສຽງຮ້ອງຕໍ່ນາທີ, ອາຍຸ, ເພດ)
-
ແມ່ນຄ່າທີ່ເຮົາຈິງທີ່ເຮົາມີຢູ່ແລ້ວ (example’s label) (ໃນຕົວຢ່າງແມ່ນ ອຸນຫະພູມ)
-
ແມ່ນຄ່າທີ່ໄດ້ຈາກການການຄຳນວນ (ລວມ weight ແລະ bias ແລ້ວ) ທີ່ໄດ້ຈາກ feature
-
ແມ່ນຂໍ້ມູນທີ່ເອົາມາໄລ່.
-
ແມ່ນຈຳນວນຂອງຂໍ້ມູນໃນ
ເຖິງວ່າ MSE ຈະນິຍົມໃຊ້ກັນໃນການຫາຄ່າ loss ໃນແບບຈຳລອງເຮົາ, ແຕ່ມັນຈະບໍ່ສະເໝີໄປ ຍັງມີບາງສູດຄິດໄລ່ທີ່ຫາຄ່າ loss ໄດ້ດີກ່ວານີ້ ເຊິ່ງຂຶ້ນກັບແຕ່ລະສະຖານະການ.