ຈັດການຂໍ້ມູນເພື່ອການວິເຄາະເຮັດແນວໃດ?
ການເກັບກຳຂໍ້ມູນໃຫ້ເປັນລະບຽບ ຊ່ວຍໃຫ້ເຮົາປະຢັດເວລາ ແລະ ສະດວກສະບາຍໃນການດຶງຂໍ້ມູນໄປວິເຄາະ.
ໂດຍທົ່ວໄປແລ້ວຂໍ້ມູນທີ່ເຮົານຳມາວິເຄາະ ມັນອາດຈະມານຳຮູບແບບໃດກໍໄດ້ ອາດຈະມາໃນຮູບແບບທີ່ຈັດລຽງສວຍງາມ ເຮົາສາມາດນຳເອົາຂໍ້ມູນມາໃຊ້ໄດ້ເລີຍ ບາງເທື່ອໃນໂລກຄວາມເປັນຈິງມັນອາດຈະບໍ່ສວຍງາມແບບນັ້ນ ເຮົາອາດຈະຕ້ອງໄດ້ມາອະນາໄມຂໍ້ມູນຂອງເຮົາ (clean) ຂໍ້ມູນ, ແປງຖັນເປັນແຖວ ບາງເທື່ອອາດຈະໄດ້ມາປ້ອນຂໍ້ມູນເຂົ້າຊ້ຳ ຖ້າຍັງເປັນປຶ້ມຢູ່.
ການເກັບຂໍ້ມູນ ມັນຈະມີເສັ້ນກັ້ນບາງໆລະຫວ່າງ ການຈັດຂໍ້ມູນທີ່ມັນງ່າຍຕໍ່ການເບິ່ງ ແຕ່ວ່າ ບໍ່ງ່າຍຕໍ່ການວິເຄາະ ແຕ່ວ່າຂໍ້ມູນທີ່ງ່າຍຕໍ່ການວິເຄາະມັນອາດຈະເບິ່ງບໍ່ງ່າຍໃນມຸມມອງຂອງການວິເຄາະທົ່ວໄປ.
ຈາກຮູບຂ້າງເທິງເຮົາເຫັນວ່າ ໂອເຄ, ມັນງ່າຍດີຖ້າເຮົາກາງຂໍ້ມູນເບິ່ງ ເຫັນວ່າມີໝວດໝູ່ ລະອຽດດີ. ແຕ່ວ່າ ການຈັດຂໍ້ມູນແບບນີ້ ເຮົາຈະຕ້ອງໄດ້ຈັດລຽງຂໍ້ມູນໃໝ່ຖ້າເຮົາຢາກເອົາຂໍ້ມູນມາວິເຄາະ ແລະ ສາມາດເອົາຂໍ້ມູນໄປໃຊ້ໄດ້ບ່ອນອື່ນ ຕົວຢ່າງເອົາຂໍ້ມູນນຳເຂົ້າໄປປະມວນຜົນໃນໂປຣແກຣມການວິເຄາະ ຫຼື ນຳອອກເອົາມາໃຊ້ບ່ອນອື່ນໆ ໄດ້ງ່າຍ.
ກ່ອນອື່ນໝົດເຮົາມາເບິ່ງກັນກ່ອນວ່າຂໍ້ມູນສ່ວນໃຫຍ່ແມ່ນ ເກັບໃນຮູບແບບໃດແນ່?
- CSV, JSON, XML (text format): ເປັນປະເພດຂໍ້ມູນທີ່ ເຮົາສາມາດເອົາມານຳໃຊ້ໄດ້ເລີຍ ແລະ ເຄື່ອງມືວິເຄາະຂໍ້ມູນແມ່ນຮອງຮັບຟາຍພວກນີ້ໄດ້ໝົດ.
- xlsx (Excel): ຂໍ້ມູນໃນຮູບແບບນີ້ກໍ່ສາມາດເອົາມານຳໃຊ້ໄດ້ເລີຍ ໂດຍສະເພາະ ຖ້າເຮົາວິເຄາະໃນໂປຣແກຣມ Excel ແຕ່ວ່າຖ້າເຮົາຈະນຳຂໍ້ມູນຂອງເຮົາໄປໃຊ້ບ່ອນອື່ນແມ່ນ ເຄື່ອງມືໂຕອື່ນອາດຈະບໍ່ຮອງຮັບຟາຍປະເພດນີ້. ດັ່ງນັ້ນ, ເຮົາຄວນຈະ export ຟາຍຂໍ້ມູນດັ່ງກ່າວໃນຮູບແບບຂອງ CSV ເຊິ່ງເຮົາສາມາດເຮັດໄດ້ຢູ່ໃນ Excel.
- PDF: ຖ້າຂໍ້ມູນເຮົາເກັບມາໃນຮູບແບບນີ້ ຂໍພາວະນາໃຫ້ເຮົາມີເວລາຫຼາຍໆ ແລະ ເປັນຟາຍທີ່ນັກວິເຄາະທັງຫຼາຍ ບໍ່ຢາກພົບ ເພາະວ່າ ການໃຫ້ຟາຍແບບນີ້ ແມ່ນບໍ່ຕ່າງຫຍັງກັບການໃຫ້ປຶ້ມ ເຮົາມາປ້ອນຂອງມູນເອງ ເຮົາຈະຕ້ອງເສຍເວລາມາປ້ອນຂໍ້ມູນເຂົ້າອີກເທື່ອໜຶ່ງ. ເຖິງວ່າມັນຈະມີໂປຣແກຣມທີ່ເຮົາສາມາດແປງຂໍ້ມູນອອກມາໄດ້ໃນຮູບແບບ text ກໍ່ຕາມແຕ່ກະຍັງບໍ່ໄດ້ດີເທົ່າທີຄວນ.
- ຮູບພາບ: ສົ່ງຂໍ້ມູນມາໃຫ້ໂດຍການຖ່າຍຮູບມາ ອັນນີ້ກະບໍ່ຕ່າງຫຍັງກັບການສົ່ງປຶ້ມມາໃຫ້ດີໆນີ້ເອງ ເຮົາກະຕ້ອງໄດ້ມາປ້ອນຂໍ້ມູນເຂົ້າໃໝ່ຄືເກົ່າ. ມີແອັບ Microsoft ສາມາດແປງຮູບໃຫ້ເປັນຕາຕະລາງໃນ Excel ໄດ້ແຕ່ກະຍັງບໍ່ໄດ້ດີເທົ່າທີ່ຄວນ ຍິ່ງຖ້າຂໍ້ມູນເປັນພາສາລາວ ແມ່ນເຮັດໄດ້ຍາກ.
- ປຶ້ມ: ອັນນີ້ກະຄົງຕ້ອງໄດ້ມາປ້ອນຂໍ້ມູນເຂົ້າຄອມໃໝ່.
ຮູ້ຈັກກັບ metadata ຂອງຂໍ້ມູນທີ່ເຮົາຈະນຳມາວິເຄາະກ່ອນ
ຊຸດຂໍ້ມູນ (data-set) ທີ່ບໍ່ຊັບຊ້ອນຫຼາຍມີພຽງແຕ່ 1 ມິຕິ ເຮົາກໍ່ບໍ່ຈຳເປັນຕ້ອງຈັດການຂໍ້ມູນຫຍັງຫຼາຍ ແຕ່ຖ້າຫາກວ່າຂໍ້ມູນເຮົາມີຫຼາຍ ກວ່າ 1 ມິຕິ ແລະ ຍັງມີຫຼາຍມາດວັດອີກເດ ເຮົາຈະຈັດການຂໍ້ມູນແນວໃດ.
ແນ່ນອນວ່າເຮົາຈະຕ້ອງໄປເບິ່ງ metadata ຂອງຊຸດຂໍ້ມູນນັ້ນວ່າມີບໍ່? ຖ້າບໍ່ມີເຮົາກໍຄວນຈະສ້າງຂຶ້ນມາເອງ ໂດຍກຳນົດເປັນໝວດໝູ່ເຊັ່ນ: ຊື່, ຊື່ຫຍໍ້, ຂໍ້ມູນໄດ້ມາຈາກໃສ, ຂໍ້ມູນແຕ່ປີໃດ ເປັນຕົ້ນ. ສ່ວນມາດວັດ ກໍຈະເປັນ ປະເພດຂອງຂໍ້ມູນ: ຕົວເລກ, ຕົວໜັງສື, ເປັນຕົວເລກ ຄ່າສະເລ່ຍເບາະ, ເປັນຕົວເລກທີ່ເປັນອັນດັບເບາະ ປະມານນີ້.
ຈັດການກັບຕາຕະລາງທີ່ບໍ່ເໝາະກັບການນຳມາວິເຄາະຂໍ້ມູນ
ດຽວເຮົາຈະມາຍົກຕົວຢ່າງ ຕາຕະລາງຈາກສະຖິຕິສຶກສາ 2016-2017 ຖ້າເບິ່ງໂດຍລວມແລ້ວຕາຕະລາງນີ້ຖືວ່າ ເບິ່ງງ່າຍ ມີການຈັດໝວດໝູ່ ແລະ ເປັນລະບຽບດີ. ແຕ່ວ່າຕາຕະລາງແບບນີ້ບໍ່ເໝາະແກ່ການນຳເອົາໄປວິເຄາະປານໃດ ຖ້າເຮົາເອົາຕະຕະລາງນີ້ໃນ sheet ກໍລະນີເຮົາຢາກ ຈັດລຽງຂໍ້ມູນກໍຢາກຍາກ ເຊັ່ນ: ຖ້າເຮົາຢາກຮູ້ວ່າ ໃນນະຄອນຫຼວງວຽງຈັນ ນັກຮຽນຊັ້ນໃດມີເປີເຊັນການອອກໂຮງຮຽນສູງກ່ອນໝູ່. ໃນກໍລະນີນີ້ແມ່ນເຮົາຈະ filter ຂໍ້ມູນບໍ່ໄດ້ເລີຍໃນຮູບແບບດັ່ງກ່າວ.
ວິທີການແກ້ໄຂກໍຄື: ຈັດໃຫ້ເປັນໃນຮູບແບບຂໍ້ມູນ CSV ຂໍ້ມູນທີ່ແຖວດຽວຕົວປ່ຽນອັນດຽວ ຄືກັບຕາຕະລາງຂ້າງເທິງນີ້. ເຮົາຈະເຫັນວ່າ ແຕ່ລະແຖວແມ່ນມີຄ່າ ແລະ ໝວດໝູ່ພຽງແຕ່ອັນດຽວເທົ່ານັ້ນ ທັງນີ້ທັງນັ້ນ ກໍເພື່ອການງ່າຍໃນການທີ່ເຮົາຈະນຳຂໍ້ມູນມາ filter ເພື່ອການວິເຄາະ.
ຄຳແນະນຳ:
- ປ່ຽນຊ່ອງທີ່ເປັນແບບ merge cell ໃຫ້ເປັນແຖວດຽວ
- ບໍ່ຄວນເຮັດໃຫ້ຊ່ອງໜຶ່ງມີຫຼາຍ 2 ຕົວປ່ຽນ (ໝວດໝູ່)
- ພະຍາຍາມຂຽນຕົວປ່ຽນຂອງເຮົາເປັນໂຕນ້ອຍ ແລະ ບໍ່ໃຫ້ຍະຫວ່າງ. ຖ້າຍະຫວ່າງໃຫ້ໃຊ້ຂີດກ້ອງ (_) ເພາະໂປຣແກຣມວິເຄາະສ່ວນໃຫຍ່ຈະບໍ່ອ່ານຄ່າທີ່ເປັນຍະຫວ່າງ. ຖ້າບໍ່ຢາກຍະຫວ່າງສາມາດຂຽນໃນຮູບແບບຂອງ lower secondary => lower_secondary => lowerSecondary