ML Crash Course: Descending into ML: Training and Loss


Training ແບບ​ຈຳ​ລອງກະ​ຄື​ກັບ ການ​ສອນ​ໃຜ​ຄົນ​ໜຶ່ງ​ໃຫ້​ຮູ້​ໄດ້​ເອງວ່າ​ສິ່ງນັ້ນ​ແມ່ນ​ຫຍັງ​ຈາກ​ການ​ທີ່​ເຮົາ​ໃຫ້​ຂໍ້​ມູນ​ໃຫ້​ກະ​ເຂົາ​ພ້ອມ​ກັບ​ຕົວ​ຢ່າງ​ນຳ​ວ່າ​ອັນ​ນີ້​ແມ່ນ​ອັນ​ນີ້​ເດີ້ ອັນ​ນີ້​ແມ່ນ​ອັນ​ນັ້ນ​ເດີ້ (determining) ​ຂໍ້​ມູນ​ທີ່​ເຮົາ​ເອົາ​ມາ​ສອນນັ້ນ​ແມ່ນໄດ້​ຈາກ ສຳ​ປ​ະ​ສິດຄວາມ​ຊັນ​ຂອງ​ເສັ້ນ​ສະ​ແດງ(weight) ແລະ bias ຈາກຂໍ້​ມູນ (labeled example). ສຳ​ລັບ​ supervised learning, ຫຼັກການ algorithm ຂອງ machine learning ກະ​ຄື​ເຮົາ​ຈະ​ຕ້ອງຈະ​ສ້າງ​ແບບ​ຈຳ​ລອງ​ໂດຍ​ການກວດ​ສອບ​ຂໍ້​ມູນ​ຫຼາຍໆ​ໂຕ ແລະ ຫາ​ແບບ​ຈຳ​ລອງ​ທີ່​ມີ​ຄ່າ loss ໜ້ອຍ​ທີ່​ສຸດ. ຂັ້ນ​ຕອນນີ້​ເຂົາ​ເຈົ້າ​ຈະ​ເອີ້ນ​ວ່າ empirical risk minimization.
… 

 

ML Crash Course: Descending into ML: Linear Regression


ໃນ​ບົດ​ຄວາມນີ້​ເຮົາ​ຈະ​ເລີ່ມ​ລົງ​ເລິກ​ໃນ​ເລື່ອງ​ຂອງ Machine Learning ກັນ! ໂດຍ​ເລີ່ມ​ຈາກ​ການ​ໄດ້​ຮູ້​ຈັກ​ໝູ່​ຄົນ​ທຳ​ອິດ​ຂອງ​ທ່ານ​ໃນ​ສາຍນີ້​ກະ​ຄື ທ້າວ ລີ​ເນ​ແອ ຫຼື Linear Regression (ຂໍ​ເວົ້າ​ເປັນ​ພາ​ສາທີ່​ເຮົາ​ຄຸ້ຍ​ເຄີຍ​ກັນ​ໃນ​ຫ້ອງ​ຮຽນ​ເນາະ, ບາງ​ຄົນ​ນິ​ເບິ່ງ​ທຳ​ອິດ​ອາດ​ງົງ​ວ່າ​ມັນ​ແມ່ນ​ຫຍັງ ລີ​ເນຍ, ພໍ​ໄດ້​ຟັງ​ ລີ​ເນ​ແອ ນິ​ກະ​ເຖິງ​ກັບ​ເວົ້າ​ວ່າ ອໍ້! ເລີຍ​ກັບ​ບາ​ດ).

ແລ້ວ​ສົມ​ຜົ​ນ​ຖົດ​ຖອຍ​ເສັ້ນ​ຊື່​ລີ​ເນ​ແອ​ນິ​ມັນ​ຈະ​ມີ​ຮູບ​ລັກ​ສະ​ນະ​ແບບ​ໃດ? ທຳ​ອິດ ເມື່ອ​ເຮົາ​ໄດ້​ຂໍ​້​ມູນເຮົາ​ຈະ​ຕ້ອງ​ມາ plot (ມາແຕ້ມ​ເສັ້ນ​ສະ​ແດງ) ວ່າ​ຂ​ໍ້​ມູ​ນ​ເຮົາ​ຢູ່​ໃນ​ຮູບ​ແບບ​ໃດ ມັນ​ຈັບ​ກຸ່ມ​ກັນ​ເປັນ​ແບບ​ໃດ.
… 

 

Machine Learning Crash Course: ML Terminology

​ບົດ​ຄວາມນີ້ຈະ​ເປັນ​ບົດ​ຄວາມ​ທຳ​ອິດ​ໃນ series ຂອງ Machine Learning Crash Course ​ເຊິ່ງ​ທ່ານ​ຈະ​ໄດ້​ຮູ້​ຈັກ​ກັບ​ຄຳ​ວ່າ Machine Learning ແມ່ນ​ຫຍັງ ແລະ ຄຳ​ສັບ​ຕ່າງໆ​ທີ່​ກະ​ເຈົ້າ​ໃຊ້​ກັນ​ໃນ​ວົງ​ການນີ້.

Label

Labels ໝາຍ​ເຖິງ​ຜົນ​ໄດ້​ຮັບ ຫຼື ​ສິ່ງ​ທີ່​ເຮົາ​ຈະພະ​ຍາ​ກອນ​ ເຊິ່ງ​ມັນ​ກະ​ຄືໂຕປ່ຽນ y (output) ນັ້ນ​ເອງ ຖ້າ​ເຮົາ​ທຽບ​ກັບ​ສົມ​ຜົນ​ຖົດ​ຖອຍ​ເສັ້ນ​ຊື່ (Linear Regression). Labels ອາດ​ຈະ​ເປັນ ລາ​ຄາ​ຂອງ​ເຂົ້າ​ໃນ​ອະ​ນາ​ຄົດ, ຊື່​ສັດ​ຕ່າງໆ​ທີ່​ຢູ່​ໃນ​ຮູບ, ຄວາມ​ໝາຍ​ຂອງ​ສຽງ​ຕ່າງ ແລະ ອື່ນໆ.

Features

Features ແມ່ນ​ຕົວ​ປ່ຽນ x (input) ຕົວ​ປ່ຽນ​ທີ່​ເຮົາ​ຈະ​ເອົາ​ມາ​ຄິດ​ໄລ່​ໃນ​ສົມ​ຜົນ. ບາງວຽກ​ໃນ​ສາຍ Machine Learning ງ່າຍໆ​ອາດ​ຈະ​ໄດ້​ໃຊ້​ແຕ່ feature ອັນ​ດຽວ, ແຕ່​ບາງວຽກ​ທີ່​ຊັບ​ຊ້ອນ​ອາດ​ຈະ​ໄດ້​ໃຊ້ feature ຫຼາຍໆ​​ໂຕ​ເປັນ n ໂຕ.

{ x 1 , x 2 , . . . x N }

ຕົວ​ຢ່າງ​ການ​ສ້າງແບບ​ຈຳ​ລອງ​ກ່ຽວ​ກັບ​ການ​ກັ່ນ​ຕອງ spam ຈະ​ຕ້ອງ​ມີ feature ຄື:

  • ຄຳ​ຕ່າງໆ​ທີ່​ໃຊ້ໃນເນື້ອ​ຫາ​ອີ​ເມວທີ່​ສົ່ງ​ມາ
  • ທີ່​ຢູ່​​ອີ​ເມວຂອງ​ຜູ່​ທີ່​ສົ່ງ​ມາ​ຫາ​ເຮົາ
  • ເວ​ລາ​ໃດ​ທີ່​ອີ​ເມວ​ໄດ້​ສົ່ງ​ມາ
  • ອີ​ເມວ​ທີ່​ມີ​ຄຳ​ແປກໆ ແບບ​ເຂົ້າ​ຂ່າຍ​ຕົ້ມ​ຕຸນ​ປົນ​ມາ​ (one weird trick)

… 

 

ຄຳ​ຖາມສອບ​ເສັງໂຄງ​ການ​ຊາວ​ໜຸ່ມ​ເດີນ​ທະ​ເລ ​ອາ​ຊຽນ​-ຍີ່​ປຸ່ນ (SSEAYP) ຄັ້ງ​ທີ 45th ປີ 2018

ເພື່ອ​ເປ​ັນ​ແນວ​ທາງ​ໃຫ້ ຜູ່​ທີ່​ຈະ​ສົນ​ໃຈ​ໃນ​ການ​ສອບ​ເສັງ​ໂຄງ​ການ​ຂອງ ຊາວ​ໜຸ່ມ​ເດີນ​ທະ​ເລ ອາ​ຊຽນ-ຍີ່​ປຸ່ນ ຂອງ ສູນ​ການ​ຊາວ​ໜຸ່ມ ປະ​ຊາ​ຊົນ ປະ​ຕິ​ວັດ​ລາວ.

ລາ​ຍ​ລະ​ອຽດ​ການ​ສອບ​ເສັງ

ປີນີ້ ​ມີ​ຜູ່​ເຂົ້າ​ສອບ​ເສັງ​ໂດຍ​ປະ​ມານ​ແມ່ນ 240ທ່ານ ແລະ ຂາຍ​ຟ​ອມ​ໄປຫຼາຍ​ກ່​ວາ 300 ກ່​ວາ​ຊຸດ. ຮູບ​ແບບ​ການ​ສອບ​ເສັງ​ຈະ​ແຕກ​ຕ່າງ(ອ​ີກ​ແລ້ວ) ເພາະ​ໃຫ້​ເວ​ລາ​ເສັງ​ພຽງ​ແຕ່ 30 ນາ​ທີ ເທົ່າ​ນັ້ນ, ໂດຍ​ຄຳ​ຖາມ​ທີ່​ໃຫ້​ຈະ​ເປັນ​ແບບ​ປາ​ລະ​ໄນ 65 ຂໍ້, ຂໍ້​ລະ 3 ຕົວ​ເລືອກ. ຈາກ​ການ​ຖາມ​ຄົນ​ທີ່​ເຄີຍ​ເສັງ​ປີ​ກ່ອນ​ໜ້ານີ້​ແມ່ນ ໃຫ້​ເວ​ລາ​ສອບ​ເສັງ 1ຊົ່ວ​ໂມງ ແລະ ແບ່ງ​ອອກ​ເປັນ 2 ພາກ​ຄື: ພາກ​ຕອບ​ຄຳ​ຖາມ ກັບ ພາກ​ຂຽນ (essay) 500ຄຳ.

ໝາຍ​ເຫດ: ຄຳ​ຖາມ​ທີ່​ຂຽນ​ຂຶ້ນ​ຕໍ່​ໄປ​ນີ້​ອາດ​ຈະ​ບໍ່​ກົງ​ກັບ​ຄຳ​ຖາມ​ທີ່​ອອກ​ເສັງ​ແທ້ 100% ອາດ​ຈະ​ມີ​ການ​ຫຼົງໆ​ລືມໆ​ແນ່ ຫຼື ຮ້າຍ​ໄປ​ກ່​ວານັ້ນ​ແມ່ນແປ​ຄຳ​ຖາມຜິດ(ອ່ອນພາ​ສາ​ອັງ​ກິດ). ດັ່ງ​ນັ້ນ, ສຳ​ລັບ​ໃຜ​ທີ່​ຈະ​ອ່ານ ຄວນ​ໃຊ້​ພິ​ຈາ​ລະ​ນາໃນ​ການ​ອ່ານ.

… 

 

ມາ​ຮ່ວມ​ກັນ​ເຮັດ​ໃຫ້​ພາ​ສາ​ລາວ​ໃນ​ບໍ​ລິ​ການ​ຂອງ Google ດີ​ຂຶ້ນ​ກັນ​ເທາະ​ດ້ວຍ Google Crowdsource

ເວ​ລາ​ທີ່ບໍ​ລິ​ການ​ໃດ​ໜ​ຶ່ງ​ຂອງ Google ທີ່​ເຮົາ​ໃຊ້​ເປັນ​ປະ​ຈຳ​ຮອງ​ຮັບພາ​ສາ​ລາວແລ້ວ​ ເຊັ່ນ: Google Search, Gmail, Google Translation, Google Maps ແລະ ອື່ນໆ ສຳ​ລັບ​ຜູ່​ທີ່​ເປັນ​ເຈົ້​າ​ຂອງ​ພາ​ສາ​ເອງ ເຮົາ​ຈະ​ສັງ​ເກດ​ເຫັນ​ວ່າ Google ​ໃຊ້​ພາ​ສາ​ລາວ​ຍັງບໍ່​ຖືກ​ໃນ​ບາງ​ຄຳ ຫຼື ບາງ​ຄຳ​ທີ່​ໃຊ້​ແມ່ນ​ບໍ່​ເໝາະ​ສົມ. ຕົວ​ຢ່າງ: ເຮົາ​ສາ​ມາດ​ເຫັນໄດ້​ໂຕ​ຈິງຈາກ ບໍ​ລິ​ການ​ Google Translation ທີ່​ແປ​ຍັງ​ບໍ່​ຖື​ກ​ກັບ​ຄວາມ​ໝາຍ​ປານ​ໃດ, ແປ​ຕາມ​ໂຕ. ຖ້າ​ເປັນ​ແບບນີ້ໃນ​ນາມ​ຜູ່​ເປັນ​ເຈົ້າ​ຂອງ​ພາ​ສາ ​ເຮົາ​ສາ​ມາດຊ່ວຍ​ປັບ​ປຸງ​ໃຫ້​ມັນ​ດີ​ຂຶ້ນ​ໄດ້​ແນວ​ໃດ?

​ຄຳ​ຕອບ​ກໍ​ຄື ເຮົາ​ສາ​ມາດ​ຊ່ວຍ​ໄດ້​ໂດຍ​ຜ່ານ Crowdsource!

…