Machine Learning Crash Course: ML Terminology

​ບົດ​ຄວາມນີ້ຈະ​ເປັນ​ບົດ​ຄວາມ​ທຳ​ອິດ​ໃນ series ຂອງ Machine Learning Crash Course ​ເຊິ່ງ​ທ່ານ​ຈະ​ໄດ້​ຮູ້​ຈັກ​ກັບ​ຄຳ​ວ່າ Machine Learning ແມ່ນ​ຫຍັງ ແລະ ຄຳ​ສັບ​ຕ່າງໆ​ທີ່​ກະ​ເຈົ້າ​ໃຊ້​ກັນ​ໃນ​ວົງ​ການນີ້.

Label

Labels ໝາຍ​ເຖິງ​ຜົນ​ໄດ້​ຮັບ ຫຼື ​ສິ່ງ​ທີ່​ເຮົາ​ຈະພະ​ຍາ​ກອນ​ ເຊິ່ງ​ມັນ​ກະ​ຄືໂຕປ່ຽນ y (output) ນັ້ນ​ເອງ ຖ້າ​ເຮົາ​ທຽບ​ກັບ​ສົມ​ຜົນ​ຖົດ​ຖອຍ​ເສັ້ນ​ຊື່ (Linear Regression). Labels ອາດ​ຈະ​ເປັນ ລາ​ຄາ​ຂອງ​ເຂົ້າ​ໃນ​ອະ​ນາ​ຄົດ, ຊື່​ສັດ​ຕ່າງໆ​ທີ່​ຢູ່​ໃນ​ຮູບ, ຄວາມ​ໝາຍ​ຂອງ​ສຽງ​ຕ່າງ ແລະ ອື່ນໆ.

Features

Features ແມ່ນ​ຕົວ​ປ່ຽນ x (input) ຕົວ​ປ່ຽນ​ທີ່​ເຮົາ​ຈະ​ເອົາ​ມາ​ຄິດ​ໄລ່​ໃນ​ສົມ​ຜົນ. ບາງວຽກ​ໃນ​ສາຍ Machine Learning ງ່າຍໆ​ອາດ​ຈະ​ໄດ້​ໃຊ້​ແຕ່ feature ອັນ​ດຽວ, ແຕ່​ບາງວຽກ​ທີ່​ຊັບ​ຊ້ອນ​ອາດ​ຈະ​ໄດ້​ໃຊ້ feature ຫຼາຍໆ​​ໂຕ​ເປັນ n ໂຕ.

{ x 1 , x 2 , . . . x N }

ຕົວ​ຢ່າງ​ການ​ສ້າງແບບ​ຈຳ​ລອງ​ກ່ຽວ​ກັບ​ການ​ກັ່ນ​ຕອງ spam ຈະ​ຕ້ອງ​ມີ feature ຄື:

  • ຄຳ​ຕ່າງໆ​ທີ່​ໃຊ້ໃນເນື້ອ​ຫາ​ອີ​ເມວທີ່​ສົ່ງ​ມາ
  • ທີ່​ຢູ່​​ອີ​ເມວຂອງ​ຜູ່​ທີ່​ສົ່ງ​ມາ​ຫາ​ເຮົາ
  • ເວ​ລາ​ໃດ​ທີ່​ອີ​ເມວ​ໄດ້​ສົ່ງ​ມາ
  • ອີ​ເມວ​ທີ່​ມີ​ຄຳ​ແປກໆ ແບບ​ເຂົ້າ​ຂ່າຍ​ຕົ້ມ​ຕຸນ​ປົນ​ມາ​ (one weird trick)

… 

 

ຄຳ​ຖາມສອບ​ເສັງໂຄງ​ການ​ຊາວ​ໜຸ່ມ​ເດີນ​ທະ​ເລ ​ອາ​ຊຽນ​-ຍີ່​ປຸ່ນ (SSEAYP) ຄັ້ງ​ທີ 45th ປີ 2018

ເພື່ອ​ເປ​ັນ​ແນວ​ທາງ​ໃຫ້ ຜູ່​ທີ່​ຈະ​ສົນ​ໃຈ​ໃນ​ການ​ສອບ​ເສັງ​ໂຄງ​ການ​ຂອງ ຊາວ​ໜຸ່ມ​ເດີນ​ທະ​ເລ ອາ​ຊຽນ-ຍີ່​ປຸ່ນ ຂອງ ສູນ​ການ​ຊາວ​ໜຸ່ມ ປະ​ຊາ​ຊົນ ປະ​ຕິ​ວັດ​ລາວ.

ລາ​ຍ​ລະ​ອຽດ​ການ​ສອບ​ເສັງ

ປີນີ້ ​ມີ​ຜູ່​ເຂົ້າ​ສອບ​ເສັງ​ໂດຍ​ປະ​ມານ​ແມ່ນ 240ທ່ານ ແລະ ຂາຍ​ຟ​ອມ​ໄປຫຼາຍ​ກ່​ວາ 300 ກ່​ວາ​ຊຸດ. ຮູບ​ແບບ​ການ​ສອບ​ເສັງ​ຈະ​ແຕກ​ຕ່າງ(ອ​ີກ​ແລ້ວ) ເພາະ​ໃຫ້​ເວ​ລາ​ເສັງ​ພຽງ​ແຕ່ 30 ນາ​ທີ ເທົ່າ​ນັ້ນ, ໂດຍ​ຄຳ​ຖາມ​ທີ່​ໃຫ້​ຈະ​ເປັນ​ແບບ​ປາ​ລະ​ໄນ 65 ຂໍ້, ຂໍ້​ລະ 3 ຕົວ​ເລືອກ. ຈາກ​ການ​ຖາມ​ຄົນ​ທີ່​ເຄີຍ​ເສັງ​ປີ​ກ່ອນ​ໜ້ານີ້​ແມ່ນ ໃຫ້​ເວ​ລາ​ສອບ​ເສັງ 1ຊົ່ວ​ໂມງ ແລະ ແບ່ງ​ອອກ​ເປັນ 2 ພາກ​ຄື: ພາກ​ຕອບ​ຄຳ​ຖາມ ກັບ ພາກ​ຂຽນ (essay) 500ຄຳ.

ໝາຍ​ເຫດ: ຄຳ​ຖາມ​ທີ່​ຂຽນ​ຂຶ້ນ​ຕໍ່​ໄປ​ນີ້​ອາດ​ຈະ​ບໍ່​ກົງ​ກັບ​ຄຳ​ຖາມ​ທີ່​ອອກ​ເສັງ​ແທ້ 100% ອາດ​ຈະ​ມີ​ການ​ຫຼົງໆ​ລືມໆ​ແນ່ ຫຼື ຮ້າຍ​ໄປ​ກ່​ວານັ້ນ​ແມ່ນແປ​ຄຳ​ຖາມຜິດ(ອ່ອນພາ​ສາ​ອັງ​ກິດ). ດັ່ງ​ນັ້ນ, ສຳ​ລັບ​ໃຜ​ທີ່​ຈະ​ອ່ານ ຄວນ​ໃຊ້​ພິ​ຈາ​ລະ​ນາໃນ​ການ​ອ່ານ.

… 

 

ມາ​ຮ່ວມ​ກັນ​ເຮັດ​ໃຫ້​ພາ​ສາ​ລາວ​ໃນ​ບໍ​ລິ​ການ​ຂອງ Google ດີ​ຂຶ້ນ​ກັນ​ເທາະ​ດ້ວຍ Google Crowdsource

ເວ​ລາ​ທີ່ບໍ​ລິ​ການ​ໃດ​ໜ​ຶ່ງ​ຂອງ Google ທີ່​ເຮົາ​ໃຊ້​ເປັນ​ປະ​ຈຳ​ຮອງ​ຮັບພາ​ສາ​ລາວແລ້ວ​ ເຊັ່ນ: Google Search, Gmail, Google Translation, Google Maps ແລະ ອື່ນໆ ສຳ​ລັບ​ຜູ່​ທີ່​ເປັນ​ເຈົ້​າ​ຂອງ​ພາ​ສາ​ເອງ ເຮົາ​ຈະ​ສັງ​ເກດ​ເຫັນ​ວ່າ Google ​ໃຊ້​ພາ​ສາ​ລາວ​ຍັງບໍ່​ຖືກ​ໃນ​ບາງ​ຄຳ ຫຼື ບາງ​ຄຳ​ທີ່​ໃຊ້​ແມ່ນ​ບໍ່​ເໝາະ​ສົມ. ຕົວ​ຢ່າງ: ເຮົາ​ສາ​ມາດ​ເຫັນໄດ້​ໂຕ​ຈິງຈາກ ບໍ​ລິ​ການ​ Google Translation ທີ່​ແປ​ຍັງ​ບໍ່​ຖື​ກ​ກັບ​ຄວາມ​ໝາຍ​ປານ​ໃດ, ແປ​ຕາມ​ໂຕ. ຖ້າ​ເປັນ​ແບບນີ້ໃນ​ນາມ​ຜູ່​ເປັນ​ເຈົ້າ​ຂອງ​ພາ​ສາ ​ເຮົາ​ສາ​ມາດຊ່ວຍ​ປັບ​ປຸງ​ໃຫ້​ມັນ​ດີ​ຂຶ້ນ​ໄດ້​ແນວ​ໃດ?

​ຄຳ​ຕອບ​ກໍ​ຄື ເຮົາ​ສາ​ມາດ​ຊ່ວຍ​ໄດ້​ໂດຍ​ຜ່ານ Crowdsource!

… 

 

ຂໍ້​ແນະ​ນຳ​ກ່ອນ​ການ​ເປັນ​ນັກ​ສຶກ​ສາ​ມະ​ຫາວິ​ທະ​ຍາ​ໄລ

​ບົດ​ຄວາມນີ້​ຈະ​ເປັນ​ການ​ເລົ່າ​ປະ​ສົບ​ການ ແລະ ຂໍ້​ແນະ​ນຳ​ສຳ​ລັບ​ນ້ອງໆ​ທີ່​ກຳ​ລັງ​ຈະ​ກ້າວ​ຂ້າມ​ຈາກ​ການ​ເປັນ​ນັກ​ຮຽນ​ມາ​ເປັນ​ນັກ​ສຶກ​ສາ​. ເຈົ້າ​ຂອງບ໋ອກ​ກໍ​ກຳ​ລັງ​ຈະ​ຈົບ​ຈາກ​ການ​ເປັນ​ນັກ​ສຶກ​ສາ ແລະ ຈະ​ກ້າວ​ໄປ​ເປັນ​ເປັນ​ພະ​ນັກ​ງານ​ແລ້ວກໍ​ຢາກ​ຈະ​ມາ​ເລົ່າ​ປະ​ສົບ​ການ ແລະ ສິ່ງ​ທີ່​ຢາກ​ໃຫ້​ນ້ອງໆ​ໄດ້​ຮູ້​ວ່າ​ຊີ​ວິດ​ໃນ​ຮົ້ວ​ມະ​ຫາ​ໄລ​ນັ້ນ​ເປັ​ແນວນ​ໃດ ບາງ​ເທື່ອ​ມັນ​ອາດ​ຈະ​ບໍ່​ເປັນ​ດັ່ງ​ທີ່​ເຮົາ​ໄດ້​ຄິດ​ໄວ້ ຫຼື ອາດ​ຈະ​ເປັນ​ດັ່ງ​ທີ່​ເຮົາ​ປາດ​ຖະ​ໜາ​ໄວ້.

… 

 

ການວິ​ເຄາະ​ເສດ​ຖະ​ກິດ ແລະ ການ​ເງິນ​ຂອງ​ໂຄງ​ການ

​ການ​ວິ​ເຄາະ​ໂຄງ​ການ​ກ່ອນ​ການລົງ​ມື​ປະ​ຕິ​ບັດ​ມີ​ຄວາມ​ສຳ​ຄັນຫຼາຍ​ເພາະ​ມັນ​ເປັນ​ຕົວ​ຊີ້​ວັດ​ວ່າ ໂຄງ​ການນີ້​ເມື່ອ​ເຮັດ​ສຳ​ເລັດ​ແລ້ວ ຈະ​ມີ​ປະ​ສິດ​ທິ​ພາບ ແລະ ໄດ້​ຮັບ​ຜົນ​ປະ​ໂຫຍດ​ສູງ​ສຸດ ຫຼືບໍ່?

…