ສະຖິຕິພື້ນຖານ-ຂໍ້ມູນ
ບົດຄວາມທຳອິດຂອງ ການນຳສະເໜີກ່ຽວກັບເລື່ອງສະຖິຕິ ເຊິ່ງວ່າຈະຮວບຮວມເອົາສິ່ງທີ່ຄວນຮູ້ກ່ຽວກັບເລື່ອງສະຖິຕິຕ່າງມາອະທິບາຍໃນມຸມຂອງການເຂົ້າໃຈງ່າຍໆ ທີ່ໃຜໆກໍສາມາດເຂົ້າໃຈໄດ້.
ສຳລັບໃຜທີ່ບໍ່ຮູ້ວ່າສະຖິຕິແມ່ນຫຍັງ? ຫຼື ຫຼົງເຂົ້າມາອ່ານແລ້ວບໍ່ຮູ້ຄວາມໝາຍຂອງມັນ? ດຽວເຮົາຈະມາອະທິບາຍໃຫ້ຟັງເລີຍ. ທຳອິດເຮົາມາເບິ່ງຄວາມໝາຍຂອງມັນຈາກ dictionary ກັນກ່ອນ.
the practice or science of collecting and analyzing numerical data in large quantities, especially for the purpose of inferring proportions in a whole from those in a representative sample
ຄັນສິເວົ້າໃຫ້ເຂົ້າໃຈງ່າຍກະຄື ສະຖິຕິ ແມ່ນເປັນຂະບວນການໜຶ່ງທີ່ໄດ້ຈາກການເກັບຂໍ້ມູນ ແລະ ຫຼັງຈາກນັ້ນກໍນຳຂໍ້ມູນດັ່ງກ່າວມາວິເຄາະ ໂດຍເຮົາສາມາດຕັ້ງສົມມຸດຖານ ຫຼື ບໍ່ຕັ້ງກໍໄດ້.
ທຳອິດເລີຍ ການຮຽນສະຖິຕິ ເຮົາຈະຕ້ອງຮູ້ຈັກກ່ອນວ່າຂໍ້ມູນແມ່ນຫຍັງ?
ຂໍ້ມູນ ກະແມ່ນຂໍ້ມູນ ຫັ້ນລະ, ທີ່ເຮົາໄດ້ຈາກການທີ່ເຮົາໄດ້ລົງເປັນເກັບກຳຂໍ້ມູນເອງເບາະ ຫຼື ເອົາຂໍ້ມູນຈາກຄົນອື່ນມາ ເຊິ່ງຂໍ້ມູນທີ່ໄດ້ມາກໍຈະເປັນໄດ້ຫຼາຍຢ່າງເຊັ່ນ: ຂໍ້ມູນເລື່ອງຄວາມສູງຂອງຄົນ, ນ້ຳໜັກ, ຂະໜາດຂອງເຈ້ຍ ແລະ ອື່ນໆ.
ຂໍ້ມູນທີ່ເຮົາເກັບມານັ້ນ ຈະແບ່ງອອກເປັນ 2 ປະເພດໃຫຍ່ຄື:
- ຂໍ້ມູນຕົ້ນ (primary data) ເປັນຂໍ້ມູນທີ່ເຮົາໄດ້ຈາກການໄປເກັບກຳເອງ, ໄປສຳຫຼວດເອງ ໂດຍທີ່ຂໍ້ມູນທີ່ເຮົາໄດ້ມາຈະບໍ່ແມ່ນຂໍ້ມູນທີ່ໄດ້ຈາກບ່ອນອື່ນ, ເປັນຂໍ້ມູນທີ່ເຮົາສ້າງມາເອງ ຫຼື ບາງຄົນອາດຈະເວົ້າວ່າ ຂໍ້ມູນມືໜຶ່ງ ຫຼື ຂໍ້ມູນດິບ (raw data).
- ຂໍ້ມູນປາຍ (secondary data) ເປັນຂໍ້ມູນທີ່ເຮົາເອົາມາຈາກ ເອກະສານ, ສິ່ງພິມຕ່າງ ທີ່ເຂົາເກັບມາແລ້ວ ນຳເອົາມາເຜີຍແຜ່ ເຮົາກະເອົາຂໍ້ມູນໂຕນັ້ນມາວິເຄາະ ແລະ ສັງລວມອີກເທື່ອໜຶ່ງ ຫຼື ເວົ້າອີກຊື່ໜຶ່ງວ່າ ຂໍ້ມູນມືສອງ.
ຜົນດີ ແລະ ຜົນເສຍຂອງແຕ່ລະຂໍ້ມູນມັນຕ່າງກັນບ່ອນໃດ?
ຂໍ້ມູນຕົ້ນ
ຜົນດີ: ເຮົາສາມາດກຳນົດຕົວປ່ຽນທີ່ເຮົາຕ້ອງການໄດ້.
ຜົນເສຍ: ຖ້າຫາກວ່າເຮົາຕ້ອງການຂະໜາດຂໍ້ມູນຫຼາຍ ເຮົາຈະຕ້ອງໄດ້ເສຍເວລາຫຼາຍໃນການທີ່ຈະໄປເກັບກຳຂໍ້ມູນ.
ຂໍ້ມູນປາຍ
ຜົນດີ: ປະຫຍັດເວລາໃນການລົງໄປເກັບກຳຂໍ້ມູນ.
ຜົນເສຍ: ເຮົາບໍ່ສາມາດກຳນົດຕົວປ່ຽນໄດ້ເອງ, ບາງຕົວປ່ຽນທີ່ເຮົາຕ້ອງການ ອາດຈະບໍ່ມີໃນຂໍ້ມູນທີ່ເຮົາເອົາມາ ຫຼື ບາງເທື່ອຂະໜາດຂໍ້ມູນອາດຈະບໍ່ຕອບສະໜອງກັບຄວາມຕ້ອງການເຮົາໄດ້.
ນອກຈາກນີ້ຂໍ້ມູນທີ່ເຮົາສາມາດຈຳແນກໄດ້ຈາກທີ່ມາຂອງຂໍ້ມູນ ເຮົາຍັງສາມາດຈຳແນກໄດ້ຈາກຄຸນລັກສະນະຂອງຂໍ້ມູນໄດ້ນຳອີກ, ເຊິ່ງໂຕນີ້ຈະໄປເປັນປະໂຫຍດໃຫ້ແກ່ເຮົາຕອນທີ່ເຮົາຈະໄປນຳໃຊ້ຄິດໄລ່
ການແບ່ງຂໍ້ມູນຕາມຄຸນລັກສະນະຂອງມັນເຮົາສາມາດແບ່ງໄດ້ອອກເປັນ 2 ແບບຄື:
- ຂໍ້ມູນດ້ານປະລິມານ ເປັນຂໍ້ມູນປະເພດທີ່ສາມາດບອກໂຕມັນເອງໄດ້ວ່າມັນມີຄ່າຫຼາຍ ຫຼື ໜ້ອຍ ເຊັ່ນ: ນ້ຳໜັກຂອງຄົນ, ລວງສູງ, ຄວາມຍາວຂອງເສັ້ນທາງ ເປັນຕົ້ນ. ຂໍ້ມູນຈຳພວກນີ້ເຮົາສາມາດຮູ້ໄດ້ເລີຍວ່າມັນຫຼາຍ ຫຼື ໜ້ອຍ.
- ຂໍ້ມູນດ້ານຄຸນນະພາບ ເປັນຂໍ້ມູນທີ່ບໍ່ສາມາດມີຄວາມໝາຍໄດ້ວ່າ ມັນຫຼາຍ ຫຼື ມັນໜ້ອຍ ເຊັ່ນ: ສີ, ເພດ, ລະດັບການສຶກສາເປັນຕົ້ນ. ເຖິງວ່າຂໍ້ມູນເຫຼົ່ານີ້ ເຮົາບໍ່ສາມາດຮູ້ໄດ້ວ່າມັນຫຼາຍ ຫຼື ໜ້ອຍ ແຕ່ເຮົາສາມາດຮູ້ຄວາມໝາຍຂອງມັນໄດ້ເຊັ່ນ: ສີແດງ, ສີຂຽວ ແລະ ອື່ນໆ.
ຕົວປ່ຽນແມ່ນຫຍັງລະ? (ບໍ່ແມ່ນໂຕທີ່ເຮົາຈະເຮົາມາປ່ຽນແທນເດີ້, ໂຕສຳຮອງ)
ຕົວປ່ຽນໃນສົມຜົນ ຫຼື ໃນສະຖິຕິທີ່ຖືກໃຊ້ໃນການທົດສອບຈະແບບອອກເປັນ 2 ຕົວປ່ຽນຄື: ຕົວປ່ຽນຕົ້ນ (independent variable) ແລະ ຕົວປ່ຽນຕາມ (dependent variable).
ຕົວປ່ຽນຕົ້ນ ແມ່ນຕົວປ່ຽນ x ນັ້ນລະຖ້າທຽບໃສ່ສົມຜົນ ເຊິ່ງວ່າຕົວປ່ຽນດັ່ງກ່າວຄ່າຂອງມັນຈະບໍ່ມີການປ່ຽນແປງ ຫຼື ບໍ່ມີປັດໄຈໃດເຮັດໃຫ້ຄ່າຂອງມັນປ່ຽນ. ຖ້າເຮົາໄປເວົ້າໃນເລື່ອງ ທິດສະດີ ແລ້ວ ຫຼື ໃນມຸມມອງຂອງສົມມຸດຖານແລ້ວ ຕົວປ່ຽນຕົ້ນ ກະຄື ສິ່ງທີ່ໄປກະທົບເຮັດໃຫ້ສິ່ງໄດ້ສິ່ງໜຶ່ງປ່ຽນແປງ.
ຕົວປ່ຽນຕາມ ແມ່ນຕົວປ່ຽນ y ທີ່ຄ່າຂອງມັນຈະປ່ຽນແປງໄປຕາມຕົວປ່ຽນ x ຖ້າປຽບທຽບແລ້ວກະຄືກັບສິ່ງທີ່ຖືກອັນອື່ນມາກະທົບໃສ່.
ບາງຄົນອ່ານມາຮອດນີ້ອາດຈະງົງໆ ດຽວເຮົາຈະມາເຮັດໃຫ້ເຫັນພາບຍິ່ງຂຶ້ນ
ສົມມຸດວ່າ: ເຮົາເຮັດ ແບບສອບຖາມກ່ຽບກັບຄວາມເພິ່ງພໍໃຈຂອງຜູ່ໃຊ້ບໍລິການອິນເຕີເນັດຂອງຄ້າຍໃດໜຶ່ງ.
ຂໍ້ມູນທີ່ເຮົາໄປເກັບມາກະຄື: ເພດ, ອາຍຸ, ລະດັບການສຶກສາ, ໄລຍະເວລາທີ່ໃຊ້ອິນເຕີເນັດ, ຄວາມໄວທີ່ໃຊ້, ລາຄາທີ່ຜູ່ໃຊ້ຈ່າຍຄ່າອິນເຕີເນັດ.
ການແບ່ງປະເພດຂອງຂໍ້ມູນ: ຂໍ້ມູນທີ່ເຮົາໄດ້ມານັ້ນ ເຂົາຈະເອີ້ນວ່າ ຂໍ້ມູນຕົ້ນ, ເພາະເຮົາໄປເກັບຂໍ້ມູນດ້ວຍການໄປຢາຍແບບສອບຖາມ ໂດຍກຸ່ມຕົວຢ່າງທີ່ເຮົາຢາຍໃຫ້ນັ້ນ ແມ່ນສະເພາະຜູ່ທີ່ກຳລັງໃຊ້ບໍລິການອິນເຕີເນັດຂອງຄ້າຍນັ້ນໆຢູ່.
ການແບ່ງປະເພດຂໍ້ມູນຕາມຄຸນລັກສະນະ: ເຮົາສາມາດແຍກໄດ້ຫຼັກຄື 2 ຢ່າງດັ່ງນີ້:
ຂໍ້ມູນຄຸນນະພາບ: ເພດ (1: ຍິງ; 0: ຊາຍ), ລະດັບການສຶກສາ (1-5)
ຂໍ້ມູນປະລິມານ: ອາຍຸ, ໄລຍະເວລາທີ່ໃຊ້, ຄວາມໄວອິນເຕີເນັດ, ຄ່າໃຊ້ຈ່າຍອິນເຕີເນັດ
ຕົວປ່ຽນຕົ້ນ ຂອງເຮົາໃນບ່ອນນີ້ແມ່ນ ອາຍຸ, ເພດ, ລະດັບການສຶກສາ, ໄລຍະເວລາທີ່ໃຊ້, ຄ່າໃຊ້ຈ່າຍ, ຄວາມໄວອິນເຕີເນັດ
ຕົວປ່ຽນຕາມ ລະດັບຄວາມເພິ່ງພໍໃຈຂອງຜູ່ໃຊ້ບໍລິການ
ອີກຕົວຢ່າງໜຶີ່ງ
ເຮົາຢາກຮູ້ວ່າ ອັນໃດເຮັດໃຫ້ GDP (gross domestic product) ເພີ່ມຂຶ້ນ?
ຂໍ້ມູນທີ່ເຮົາເອົາມາຄິດໄລ່ ໃນບ່ອນນີ້ແມ່ນຂໍ້ມູນທີ່ໄດ້ຈາກ ສູນສະຖິຕິແຫ່ງຊາດ ໝາຍຄວາມວ່າຂໍ້ມູນດັ່ງກ່າວ ແມ່ນຂໍ້ມູນປາຍ ແລະ ຂໍ້ມູນທັງໝົດເປັນຂໍ້ມູນປະລິມານ.
ຕົວປ່ຽນຕົ້ນແມ່ນ: ການຈ່າຍພາກເອກະຊົນ, ການລົງທຶນ, ການລົງທຶນພາກລັດ, ການນຳເຂົ້າ-ສົ່ງອອກ.
ຕົວປ່ຽນຕາມ: GDP
ມາຮອດນີ້ ກະເອົາປະມານນີ້ກ່ອນ, ດຽວຕໍ່ໄປຈະມາເວົ້າກ່ຽວກັບການຄິດໄລ່ຂໍ້ມູນທີ່ເຮົາໄດ້ມາ.