ສະ​ຖິ​ຕິ​ພື້ນ​ຖານ-ຂໍ້​ມູນ

ບົດ​ຄວາມ​ທຳ​ອິດ​ຂອງ ການ​ນຳ​ສະ​ເໜີ​ກ່ຽວ​ກັ​ບ​ເລ​ື່ອງ​ສະ​ຖິ​ຕິ ເຊິ່ງວ່າຈະ​ຮວບ​ຮວມ​ເອົາ​ສິ່ງ​ທີ່​ຄວນ​ຮູ້​ກ່ຽວ​ກັບ​ເລື່ອງ​ສ​ະ​ຖິ​ຕິ​ຕ່າງ​ມາ​ອ​ະ​ທິ​ບາຍ​ໃນ​ມຸມ​ຂອງການ​ເຂົ້າ​ໃຈ​ງ່າຍໆ ທີ່​ໃຜໆ​ກໍ​ສາ​ມາດ​ເຂົ້າ​ໃຈ​ໄດ້.

 

ສຳ​ລັບ​ໃຜ​ທີ່ບໍ່​ຮູ້​ວ່າ​ສະ​ຖິ​ຕິ​ແມ່ນ​ຫຍັງ? ຫຼື ຫຼົງ​ເຂົ້າ​ມາ​ອ່ານ​ແລ້ວບໍ່​ຮູ້​ຄວາ​ມ​ໝາຍ​ຂ​ອງ​ມັນ? ດຽວ​ເຮົາ​ຈະ​ມ​າ​ອະ​ທິ​ບາຍ​ໃຫ້​ຟັງ​ເລ​ີຍ. ທຳ​ອິດ​ເຮົາມາ​ເບິ່ງ​ຄວາມ​ໝາຍ​ຂອງ​ມັນ​ຈາກ dictionary ກັນ​ກ່ອນ.

the practice or science of collecting and analyzing numerical data in large quantities, especially for the purpose of inferring proportions in a whole from those in a representative sample

ຄັນ​ສິ​ເວົ້າ​ໃຫ້​ເຂົ້າ​ໃຈ​ງ່າຍ​ກະ​ຄື ສະ​ຖິ​ຕິ ແມ່ນ​ເປັນ​ຂະ​ບວນ​ການ​ໜຶ່ງ​ທີ່​ໄດ​້​ຈາກ​ການ​ເກັບ​ຂໍ້​ມູນ ແລະ ຫຼັງ​ຈາກນັ້ນ​ກໍ​ນຳ​ຂໍ້​ມູນ​ດັ່ງ​ກ່າວ​ມາ​ວິ​ເຄາະ ໂດຍ​ເຮົາ​ສາ​ມາດ​ຕັ້ງ​ສົມ​ມຸດ​ຖານ ຫຼື ບໍ່​ຕັ້ງ​ກໍ​ໄດ້.

… 

 

ML Crash Course: Descending into ML: Training and Loss


Training ແບບ​ຈຳ​ລອງກະ​ຄື​ກັບ ການ​ສອນ​ໃຜ​ຄົນ​ໜຶ່ງ​ໃຫ້​ຮູ້​ໄດ້​ເອງວ່າ​ສິ່ງນັ້ນ​ແມ່ນ​ຫຍັງ​ຈາກ​ການ​ທີ່​ເຮົາ​ໃຫ້​ຂໍ້​ມູນ​ໃຫ້​ກະ​ເຂົາ​ພ້ອມ​ກັບ​ຕົວ​ຢ່າງ​ນຳ​ວ່າ​ອັນ​ນີ້​ແມ່ນ​ອັນ​ນີ້​ເດີ້ ອັນ​ນີ້​ແມ່ນ​ອັນ​ນັ້ນ​ເດີ້ (determining) ​ຂໍ້​ມູນ​ທີ່​ເຮົາ​ເອົາ​ມາ​ສອນນັ້ນ​ແມ່ນໄດ້​ຈາກ ສຳ​ປ​ະ​ສິດຄວາມ​ຊັນ​ຂອງ​ເສັ້ນ​ສະ​ແດງ(weight) ແລະ bias ຈາກຂໍ້​ມູນ (labeled example). ສຳ​ລັບ​ supervised learning, ຫຼັກການ algorithm ຂອງ machine learning ກະ​ຄື​ເຮົາ​ຈະ​ຕ້ອງຈະ​ສ້າງ​ແບບ​ຈຳ​ລອງ​ໂດຍ​ການກວດ​ສອບ​ຂໍ້​ມູນ​ຫຼາຍໆ​ໂຕ ແລະ ຫາ​ແບບ​ຈຳ​ລອງ​ທີ່​ມີ​ຄ່າ loss ໜ້ອຍ​ທີ່​ສຸດ. ຂັ້ນ​ຕອນນີ້​ເຂົາ​ເຈົ້າ​ຈະ​ເອີ້ນ​ວ່າ empirical risk minimization.
… 

 

ML Crash Course: Descending into ML: Linear Regression


ໃນ​ບົດ​ຄວາມນີ້​ເຮົາ​ຈະ​ເລີ່ມ​ລົງ​ເລິກ​ໃນ​ເລື່ອງ​ຂອງ Machine Learning ກັນ! ໂດຍ​ເລີ່ມ​ຈາກ​ການ​ໄດ້​ຮູ້​ຈັກ​ໝູ່​ຄົນ​ທຳ​ອິດ​ຂອງ​ທ່ານ​ໃນ​ສາຍນີ້​ກະ​ຄື ທ້າວ ລີ​ເນ​ແອ ຫຼື Linear Regression (ຂໍ​ເວົ້າ​ເປັນ​ພາ​ສາທີ່​ເຮົາ​ຄຸ້ຍ​ເຄີຍ​ກັນ​ໃນ​ຫ້ອງ​ຮຽນ​ເນາະ, ບາງ​ຄົນ​ນິ​ເບິ່ງ​ທຳ​ອິດ​ອາດ​ງົງ​ວ່າ​ມັນ​ແມ່ນ​ຫຍັງ ລີ​ເນຍ, ພໍ​ໄດ້​ຟັງ​ ລີ​ເນ​ແອ ນິ​ກະ​ເຖິງ​ກັບ​ເວົ້າ​ວ່າ ອໍ້! ເລີຍ​ກັບ​ບາ​ດ).

ແລ້ວ​ສົມ​ຜົ​ນ​ຖົດ​ຖອຍ​ເສັ້ນ​ຊື່​ລີ​ເນ​ແອ​ນິ​ມັນ​ຈະ​ມີ​ຮູບ​ລັກ​ສະ​ນະ​ແບບ​ໃດ? ທຳ​ອິດ ເມື່ອ​ເຮົາ​ໄດ້​ຂໍ​້​ມູນເຮົາ​ຈະ​ຕ້ອງ​ມາ plot (ມາແຕ້ມ​ເສັ້ນ​ສະ​ແດງ) ວ່າ​ຂ​ໍ້​ມູ​ນ​ເຮົາ​ຢູ່​ໃນ​ຮູບ​ແບບ​ໃດ ມັນ​ຈັບ​ກຸ່ມ​ກັນ​ເປັນ​ແບບ​ໃດ.
… 

 

Machine Learning Crash Course: ML Terminology

​ບົດ​ຄວາມນີ້ຈະ​ເປັນ​ບົດ​ຄວາມ​ທຳ​ອິດ​ໃນ series ຂອງ Machine Learning Crash Course ​ເຊິ່ງ​ທ່ານ​ຈະ​ໄດ້​ຮູ້​ຈັກ​ກັບ​ຄຳ​ວ່າ Machine Learning ແມ່ນ​ຫຍັງ ແລະ ຄຳ​ສັບ​ຕ່າງໆ​ທີ່​ກະ​ເຈົ້າ​ໃຊ້​ກັນ​ໃນ​ວົງ​ການນີ້.

Label

Labels ໝາຍ​ເຖິງ​ຜົນ​ໄດ້​ຮັບ ຫຼື ​ສິ່ງ​ທີ່​ເຮົາ​ຈະພະ​ຍາ​ກອນ​ ເຊິ່ງ​ມັນ​ກະ​ຄືໂຕປ່ຽນ y (output) ນັ້ນ​ເອງ ຖ້າ​ເຮົາ​ທຽບ​ກັບ​ສົມ​ຜົນ​ຖົດ​ຖອຍ​ເສັ້ນ​ຊື່ (Linear Regression). Labels ອາດ​ຈະ​ເປັນ ລາ​ຄາ​ຂອງ​ເຂົ້າ​ໃນ​ອະ​ນາ​ຄົດ, ຊື່​ສັດ​ຕ່າງໆ​ທີ່​ຢູ່​ໃນ​ຮູບ, ຄວາມ​ໝາຍ​ຂອງ​ສຽງ​ຕ່າງ ແລະ ອື່ນໆ.

Features

Features ແມ່ນ​ຕົວ​ປ່ຽນ x (input) ຕົວ​ປ່ຽນ​ທີ່​ເຮົາ​ຈະ​ເອົາ​ມາ​ຄິດ​ໄລ່​ໃນ​ສົມ​ຜົນ. ບາງວຽກ​ໃນ​ສາຍ Machine Learning ງ່າຍໆ​ອາດ​ຈະ​ໄດ້​ໃຊ້​ແຕ່ feature ອັນ​ດຽວ, ແຕ່​ບາງວຽກ​ທີ່​ຊັບ​ຊ້ອນ​ອາດ​ຈະ​ໄດ້​ໃຊ້ feature ຫຼາຍໆ​​ໂຕ​ເປັນ n ໂຕ.

{ x 1 , x 2 , . . . x N }

ຕົວ​ຢ່າງ​ການ​ສ້າງແບບ​ຈຳ​ລອງ​ກ່ຽວ​ກັບ​ການ​ກັ່ນ​ຕອງ spam ຈະ​ຕ້ອງ​ມີ feature ຄື:

  • ຄຳ​ຕ່າງໆ​ທີ່​ໃຊ້ໃນເນື້ອ​ຫາ​ອີ​ເມວທີ່​ສົ່ງ​ມາ
  • ທີ່​ຢູ່​​ອີ​ເມວຂອງ​ຜູ່​ທີ່​ສົ່ງ​ມາ​ຫາ​ເຮົາ
  • ເວ​ລາ​ໃດ​ທີ່​ອີ​ເມວ​ໄດ້​ສົ່ງ​ມາ
  • ອີ​ເມວ​ທີ່​ມີ​ຄຳ​ແປກໆ ແບບ​ເຂົ້າ​ຂ່າຍ​ຕົ້ມ​ຕຸນ​ປົນ​ມາ​ (one weird trick)

… 

 

ຄຳ​ຖາມສອບ​ເສັງໂຄງ​ການ​ຊາວ​ໜຸ່ມ​ເດີນ​ທະ​ເລ ​ອາ​ຊຽນ​-ຍີ່​ປຸ່ນ (SSEAYP) ຄັ້ງ​ທີ 45th ປີ 2018

ເພື່ອ​ເປ​ັນ​ແນວ​ທາງ​ໃຫ້ ຜູ່​ທີ່​ຈະ​ສົນ​ໃຈ​ໃນ​ການ​ສອບ​ເສັງ​ໂຄງ​ການ​ຂອງ ຊາວ​ໜຸ່ມ​ເດີນ​ທະ​ເລ ອາ​ຊຽນ-ຍີ່​ປຸ່ນ ຂອງ ສູນ​ການ​ຊາວ​ໜຸ່ມ ປະ​ຊາ​ຊົນ ປະ​ຕິ​ວັດ​ລາວ.

ລາ​ຍ​ລະ​ອຽດ​ການ​ສອບ​ເສັງ

ປີນີ້ ​ມີ​ຜູ່​ເຂົ້າ​ສອບ​ເສັງ​ໂດຍ​ປະ​ມານ​ແມ່ນ 240ທ່ານ ແລະ ຂາຍ​ຟ​ອມ​ໄປຫຼາຍ​ກ່​ວາ 300 ກ່​ວາ​ຊຸດ. ຮູບ​ແບບ​ການ​ສອບ​ເສັງ​ຈະ​ແຕກ​ຕ່າງ(ອ​ີກ​ແລ້ວ) ເພາະ​ໃຫ້​ເວ​ລາ​ເສັງ​ພຽງ​ແຕ່ 30 ນາ​ທີ ເທົ່າ​ນັ້ນ, ໂດຍ​ຄຳ​ຖາມ​ທີ່​ໃຫ້​ຈະ​ເປັນ​ແບບ​ປາ​ລະ​ໄນ 65 ຂໍ້, ຂໍ້​ລະ 3 ຕົວ​ເລືອກ. ຈາກ​ການ​ຖາມ​ຄົນ​ທີ່​ເຄີຍ​ເສັງ​ປີ​ກ່ອນ​ໜ້ານີ້​ແມ່ນ ໃຫ້​ເວ​ລາ​ສອບ​ເສັງ 1ຊົ່ວ​ໂມງ ແລະ ແບ່ງ​ອອກ​ເປັນ 2 ພາກ​ຄື: ພາກ​ຕອບ​ຄຳ​ຖາມ ກັບ ພາກ​ຂຽນ (essay) 500ຄຳ.

ໝາຍ​ເຫດ: ຄຳ​ຖາມ​ທີ່​ຂຽນ​ຂຶ້ນ​ຕໍ່​ໄປ​ນີ້​ອາດ​ຈະ​ບໍ່​ກົງ​ກັບ​ຄຳ​ຖາມ​ທີ່​ອອກ​ເສັງ​ແທ້ 100% ອາດ​ຈະ​ມີ​ການ​ຫຼົງໆ​ລືມໆ​ແນ່ ຫຼື ຮ້າຍ​ໄປ​ກ່​ວານັ້ນ​ແມ່ນແປ​ຄຳ​ຖາມຜິດ(ອ່ອນພາ​ສາ​ອັງ​ກິດ). ດັ່ງ​ນັ້ນ, ສຳ​ລັບ​ໃຜ​ທີ່​ຈະ​ອ່ານ ຄວນ​ໃຊ້​ພິ​ຈາ​ລະ​ນາໃນ​ການ​ອ່ານ.

…