ML Crash Course: Descending into ML: Linear Regression


ໃນ​ບົດ​ຄວາມນີ້​ເຮົາ​ຈະ​ເລີ່ມ​ລົງ​ເລິກ​ໃນ​ເລື່ອງ​ຂອງ Machine Learning ກັນ! ໂດຍ​ເລີ່ມ​ຈາກ​ການ​ໄດ້​ຮູ້​ຈັກ​ໝູ່​ຄົນ​ທຳ​ອິດ​ຂອງ​ທ່ານ​ໃນ​ສາຍນີ້​ກະ​ຄື ທ້າວ ລີ​ເນ​ແອ ຫຼື Linear Regression (ຂໍ​ເວົ້າ​ເປັນ​ພາ​ສາທີ່​ເຮົາ​ຄຸ້ຍ​ເຄີຍ​ກັນ​ໃນ​ຫ້ອງ​ຮຽນ​ເນາະ, ບາງ​ຄົນ​ນິ​ເບິ່ງ​ທຳ​ອິດ​ອາດ​ງົງ​ວ່າ​ມັນ​ແມ່ນ​ຫຍັງ ລີ​ເນຍ, ພໍ​ໄດ້​ຟັງ​ ລີ​ເນ​ແອ ນິ​ກະ​ເຖິງ​ກັບ​ເວົ້າ​ວ່າ ອໍ້! ເລີຍ​ກັບ​ບາ​ດ).

ແລ້ວ​ສົມ​ຜົ​ນ​ຖົດ​ຖອຍ​ເສັ້ນ​ຊື່​ລີ​ເນ​ແອ​ນິ​ມັນ​ຈະ​ມີ​ຮູບ​ລັກ​ສະ​ນະ​ແບບ​ໃດ? ທຳ​ອິດ ເມື່ອ​ເຮົາ​ໄດ້​ຂໍ​້​ມູນເຮົາ​ຈະ​ຕ້ອງ​ມາ plot (ມາແຕ້ມ​ເສັ້ນ​ສະ​ແດງ) ວ່າ​ຂ​ໍ້​ມູ​ນ​ເຮົາ​ຢູ່​ໃນ​ຮູບ​ແບບ​ໃດ ມັນ​ຈັບ​ກຸ່ມ​ກັນ​ເປັນ​ແບບ​ໃດ.

ຕົວ​ຢ່າງ:
ດັ່ງ​ທີ່​ເຮົາ​ຮູ້​ກັນ​ແລ້ວ​ວ່າ ໂຕ​ແມງ​ຈີ່​ລໍ່(ຕິ ອັນ​ທີ່​ມັນ​ຮ້ອງ ຕອນ​ໃບ​ໄມ້​ປົ່ງ​ຫັ້ນ​ນ່າ, ຮ້ອງ​ລະ​ຢາກນອນ​ໂລດ​ຕອນ​ຮຽນ​ໜັງ​ສື) ​ຈະ​ຮ້ອງ​ດຸເປັນ​ພິ​ເສດ​ໃນ​ມື້​ທີ່​ອາ​ກາດ​ຮ້ອນ (ຫາກໍ່​ຮູ້​ໄດ໋​ນິ​) ຫຼາຍ​ກ່​ວາມື້​ທີ່​ອາ​ກາດ​ເຢັນ. ເກືອບ​ວ່າ​ເປັນ 10 ປີ ທີ່​ນັກ​ວິ​ທະ​ຍາ​ສາດ​ໄດ້​ຈັດລຽງ​ຂໍ້​ມູນ (cataloged data) ອອກ​ເປັນ​ສອງ​ອັນ​ຄື: ໄລ​ຍະ​ເວ​ລາ​ທີ່ແມງ​ຈີ​ລໍ່​ມັນ​​ຮ້ອງ (ໄລ່​ເປັນ​ນາ​ທີ) ກັບ ອຸນ​ຫະ​ພ​ູມ. ແລ້ວ​ຂໍ້​ມູນ​ທີ່​ເຮົາ​ມີ ສາ​ມາດ plot ໄດ້​ດັ່ງ​ຮູບ​ຂ້າງ​ລຸ່ມ:

Figure 1. Chirps per Minute vs. Temperature in Celsius

Figure 1. Chirps per Minute vs. Temperature in Celsius

ໃນ​ຮູບ​ເຮົາ​ຈະ​ສັງ​ເກດ​ເຫັນ​ວ່າ ການ​ແຈກ​ຢາຍ​ຂໍ້​ມູນ​ຂອງ​ເຮົາ​ມີ​ການ​ເກາະ​ກຸ່ມ​ກຸ່ມ​ກັນ​ເປັນ​ເສັ້ນ​ຊື່ ເຫັນ​ວ່າ​ສອງ​ຕົວ​ປ່ຽນ​ທີ່​ເຮົາ​ນຳ​ມາ​ວິ​ເຄາະ​ນັ້ນ​ມີ​ຄວາມ​ສຳ​ພັນ​ກັນ​ເປັນ​ເສັ້ນ​ຊື່ ຖ້າ​ເຮົາ​ຂີດ​ເສັ້ນ​ເບິ່ງ​ຕາມ​ຮູບ​ຂ້າງ​ລຸ່ມ.

Figure 2. A linear relationship.

Figure 2. A linear relationship.

ຈາກ​ຮູບ​ດ້ານ​ເທິງ​ເມື່​ອ​ເຮົາ​ຂີດ​ເສັ້ນ​ຕັດ​ຜ່ານ​ຂໍ້​ມ​ູນ​ແລ້ວ ເຮົາ​ສ​ັງ​ເກດ​ເຫັນ​ບໍ່​ວ່າ​ບາງ​ເສັ້ນ​ມັນ​ກະ​ຍັງ​ບໍ່​ຕັດ​ຜ່ານ​ຈຸດ​ທີ່​ຂໍ້​ມູນ​ເຮົາ​ຢູ່, ບໍ່​ຕ້ອງ​ກັງ​ວົນ​ໄປ​ເນາະ​ໃນ​ຂໍ້​ມູນ​ໂຕ​ຈິງ​ມັນ​ກະ​ເປັນ​ແບບ​ຄ້າຍໆ​ແບບນີ້​ລະ ບໍ່​ມີ​ຫຍັງ perfect ຕາມ​ທີ່​ບົດ​ຮຽນ​ໄດ້​ສອນ​ເຮົາ. ອັນ​ຈຸດ​ທີ່​ມັນ​ຫ່າງ​ຫັ້ນ​ນ່າ ໃນ​ສະ​ຖິ​ຕິ​ເຮົາ​ຈະ​ຕ້ອງ​ມາ​ຫາ​ວ່າ​ມັນ​ຫ່າງ​ສ່ຳ​ໃດ ຜົນ​ທີ່​ໄດ້​ມາ​ກະ​ຄື​ຄ່າ​ຜິດ​ພາດເກີດ​ຈາກ​ການ​ຄຳ​ນວນ (residual) ຂອງ​ສົມ​ຜົນ​ເຮົາ.

y = m x + b

ຄຳ​ອະ​ທິ​ບາຍ:

  • y

    ແມ່ນ ອ​ຸນ​ຫ​ະ​ພູມ ຫົວ​ໜ່ວຍເປັນ ອົງ​ສາ​ເຊ (Celsius) – ຄ່າ​ທີ່​ເຮົາ​ຈະ​ຄຳ​ນວນ​ຫາ (ພະ​ຍາ​ກອນ)

  • m

    ສຳ​ປະ​ສິດຄວາມ​ຊັນ​(ມູມ)ຂອງ​ເສັ້ນ​ສະ​ແດງ (slope)

  • x

    ແມ່ນ​ຕົວ​ປ່ຽນທີ່​ເຮົາ​ເອົາ​ມາ​ຄິດ​ໄລ່ ໃນ​ບ່ອນນີ້ ຕົວ​ປ່ຽນ​ຂອງ​ເຮົາ​ແມ່ນ ໄລ​ຍະ​ເວ​ລາ​ຂອງ​ສຽງ​ຮ້ອງ​ແມງ​ຈີ່​ລໍ່​ຕໍ່​ນາ​ທີ – ຄ່າ​ຂອງ​ feature ທີ່​ເຮົາ​ຈະ​ເອົາ​ມາ​ໄລ່.

  • b

    ແມ່ນ ຄ່າ​ຜິດ​ພາດທີ່​ເກີດ​ຈາກ​ການ​ຄຳ​ນວນ (bias/error) (y-intercept)

ຫຼັງ​ຈາກ​ທີ່​ເຮົາ​ໄດ້​ສົມ​ຜົນ​ໃນ​ຮູບ​ແບບ​ເລກ​ທົ່ວ​ໄປ​ແລ້ວ ເຮົາ​ຈະ​ເອົາ​ສົມ​ຜົນ​ຂ້າງ​ເທິງນີ້​ມາ​ປ່ຽນ​ໃນ​ຮູບ​ແບບ​ສົມ​ຜົນ​ຂອງ Machine Learning ກັນ:

y = b + w 1 x 1

ຄຳ​ອະ​ທິ​ບາຍ:

  • y

    ແມ່ນ​ຄ່າ​ຂອງ label ທີ່​ເຮົາ​ໄດ້​ຄຳ​ນວນ (ພະ​ຍາ​ກອນ) ແລ້ວໆ (a desired output)

  • b

    ແມ່ນ​ຄ່າ​ຜິດ​ພາດ (bias (y-intercept)), ບາງ​ເທື່ອ​ອາດ​ຈະ​ໃຊ້​ສັນ​ຍາ​ລັກ

    w 0
  • w 1

    ແມ່ນ weight ຂອງ feature 1. weight ຄວາມ​ໝາຍ​ໃນ​ບ່ອນນີ້​ກະ​ແມ່ນ​ຄ່າສຳ​ປະ​ສິດ​ຄວາມ​ຊັນ​ຂອງ​ເສັ້ນ​ສະ​ແດງ (slope) ນັ້ນ​ລະ.

  • x 1

    ແມ່ນ feature (ຕົວ​ປ່ຽນ) (a know input)

  • ຖ້າ​ເຮົາ​ຢາກ infer (predict) ອຸນ​ຫະ​ພູມຂອງ

    y

    ຂອງ​ຄ່າ​ຂອງ

    x 1

    ໃໝ່ (ໄລ​ຍະ​ເວ​ລາ​ທີ່​ຈີ່​ລໍ່​ຮ້ອງ​ຕໍ່​ນາ​ທີ) ກະ​ມີ​ແຕ່​ເອົາ​ຄ່າ​ຂອງ

    x 1

    ເຂົ້າ​ໃນ​ສົມ​ຜົນ​ເລີຍ.

    ເຮົາ​ຢ່າ​ລືມ​ວ່າ ສົມ​ຜົນ​ຂ້າງ​ເທິງນີ້​ແມ່ນ​ໃຊ້​ໄດ້​ສຳ​ລັບ​ແບບ​ຈຳ​ລອງ​ທີ່​ມີ feature ພຽງ​ໂຕ​ດຽ​ວ​ເທົ່າ​ນັ້ນ, ຖ້າ​ເຮົາ​ມີ feature ຫຼາຍ​ກ່​ວາ 2 ໂຕ​ຂຶ້ນ​ໄປ​ກໍ​ຈະ​ໄປ​ໃຊ້​ແບບ​ຈຳ​ລອງ Multiple Linear Regression ບໍ່​ພຽງ​ເທົ່າ​ນັ້ນ​ໃນ​ແຕ່​ລະ feature ກໍ​ຈະ​ມີ weight ຂອງ​ໃຜ​ລາວ​ນຳ​ອີກ. ຕົວ​ຢ່າງ: ແບບ​ຈຳ​ລອງ​ທີ່​ມີ 3 feature:

    y = b + w 1 x 1 + w 2 x 2 + w 3 x 3

    ຂອບ​ໃຈ​ຂໍ້​ມູນ​ຈາກ ML Crash Course

     

Douangtavanh Kongphaly

ດວງຕາວັນ ກອງຜາລີ (Douangtavanh Kongphaly) ນັກ​ຄົ້ນ​ຄ້​ວາ (Data Analyst), ສູນ​ຄົ້ນ​ຄ້​ວາ​ນະ​ໂຍ​ບາຍ​ການ​ພັດ​ທະ​ນາ, ກະ​ຊວງ​ ແຜນ​ການ ແລະ ການ​ລົງ​ທຶນ.

 

Leave a Reply

Your email address will not be published. Required fields are marked *