16318421757084_กลุ่ม big data - PDF Flipbook

16318421757084_กลุ่ม big data

384 Views
100 Downloads
PDF 649,550 Bytes

Download as PDF

REPORT DMCA


รายงาน เรื่ อง BIG DATA เสนอ อาจารย์ สุ รพล ศรี ศิลป์ จัดทาโดย นางสาวหทัยทิพย์ ชัยสิ ทธิ์

6590051004

นางสาวทักษพร คงแดง

6590051009

นางสาวนัทธมน สว่างโคกกรวด 6590051022 รายงานนี้เป็ นส่ วนหนึ่ งของรายวิชา เทคโนโลยีดิจิทลั เพื่อการจัดการเรี ยนรู ้ TLR 202 หลักสู ตรศึกษาศาสตรมหาบัณฑิต สาขาวิชาวิจยั และเทคโนโลยีการจัดการเรี ยนรู ้



คานา รายงานนี้ เป็ นส่ วนหนึ่ งของรายวิชา TLR 202 เทคโนโลยีดิจิทลั เพื่อการจัดการเรี ยนรู ้ คณะ ผูจ้ ดั ทาได้ทาการศึกษาเรื่ อง BIG DATA คณะผูจ้ ดั ทาได้พยายามศึกษาค้นคว้าจากหนังสื อต่าง ๆ และ ประสบการณ์ที่ได้รับจากการศึกษากับอาจารย์ ประกอบกับเป็ นเรื่ อ งที่อ ยู่ในความสนใจ ซึ่ งสามารถ นาไปใช้สาหรับการเรี ยนการสอนหรื อการศึกษาค้นคว้าเพิม่ เติมในวิชา TLR 202 เทคโนโลยีดิจิทลั เพื่อ การจัดการ ของนักศึกษาระดับปริ ญญาโท ชั้นปี ที่ 1 ผูเ้ รี ยนได้แบ่งเนื้อหาสาระออกเป็ น 5 บท ประกอบด้วย บทที่ 1 ความเป็ นมาของ BIG DATA บทที่ 2 การทางานของ BIG DATA บทที่ 3 เทคโนโลยีและระบบที่เกี่ยวข้องกับ BIG DATA บทที่ 4 การนาไปใช้ประโยชน์ บทที่ 5 การสัมภาษณ์จากนักศึกษา IT คณะผูจ้ ดั ทาขอกราบขอบพระคุ ณ อาจารย์ สุ รพล ศรี ศิลป์ ที่ได้กรุ ณาประสิ ทธิ์ประสาทวิชา ความรู ้ให้แก่คณะผูจ้ ดั ทารายงานเล่มนี้ได้สาเร็จตามที่ตอ้ งการและคณะผูจ้ ดั ทาหวังว่ารายงานฉบับนี้ จะ ให้ความรู ้และเป็ นประโยชน์แก่ผอู ้ ่านทุก ๆ ท่าน คณะผู้จัดทา



สารบัญ เรื่ อง

คานา สารบัญ สารบัญภาพ บทที่ 1 ความเป็ นมาของ BIG DATA บทที่ 2 การทางานของ BIG DATA 2.1 กระบวนการทางานของ Big Data 2.2 แผนภาพเกี่ยวกับการทางานของ Big Data 2.3 ตัวอย่างข้อมูลที่ทาให้เกิด Big Data บทที่ 3 เทคโนโลยีและระบบที่เกี่ยวข้องกับ BIG DATA 3.1 เทคโนโลยีการเก็บข้อมูล 3.2 เทคโนโลยีการประมวลผลข้อมูล 3.3 Big Data เกี่ยวข้องกับ บทที่ 4 การนาไปใช้ประโยชน์ 4.1 ประโยชน์ของ Big Data 4.2 ข้อ ควรระวัง ในการใช้ Big Data 4.3 BIG DATA สาคัญอย่างไร บทที่ 5 การสัมภาษณ์จากนักศึกษา IT บรรณานุกรม

หน้ า ก ข ค 1 4 4 5 9 10 10 12 13 14 14 15 16 19 20



สารบัญภาพ ภาพที่ 2.1 2.2 2.3 2.4 2.5 2.6 3.1 4.1 4.2

ขั้นตอนการทางานของ Big Data………………………………………….. ลักษณะพิเศษ 3 ประการของ Big Data……………………………………… Big Data ประกอบด้วย 3V…………………………………………………... การทางานงานของแอพพลิเคชัน่ ต่าง ๆ……………………………………… การวิเคราะห์ขอ้ มูลโดยใช้กระบวนการ Batch……………………………….. ปริ มาณข้อมูลที่ผลิตขึ้นในทุก 60 วินาที……………………………………... Big Data Technology……………………………………………………….. Big data กับผูป้ ระกอบการ สู่การก้าวข้ามทางรอดของธุรกิจ………………... การทางานของ BIG DATA ใน Social Media………………………………..

หน้ า 4 5 6 6 7 9 10 17 17

1

บทที่ 1 ความเป็ นมาของ BIG DATA Big Data การวิเ คราะห์ เก็บ รวบรวมข้อ มูล ในปริ ม าณมหาศาล (ทั้ง ข้อ มูล ข้อ ความ รู ป ภาพ วิดีโ อ รวมถึงข้อมูลในรู ปแบบอื่น ๆ ) เนื่ อ งจากการพัฒนาของเทคโนโลยีที่กา้ วกระโดด มีอุปกรณ์ไฮเทค จานวนมากที่พร้อมจะผลิตข้อมูลออกมา จึงทาให้มีการขยายตัวข้อมูล เหล่านี้ มีปริ มาณที่มากขึ้น เพื่อ นามาใช้ให้เกิดประโยชน์สูงสุ ดทาให้เราเข้าใจโลกมากขึ้นและเปลี่ยนแปลงวิถีการใช้ชีวิตของเราไป จากเดิม ข้อ มู ล มากมายมหาศาลแค่ ไ หน Big Data คื อ การน าข้อ มู ล ที่ มี ป ริ ม าณมาก ๆ มาผ่า นการ ประมวลผล การวิเคราะห์ และแสดงผล ด้วยวิธีที่เหมาะสม ไม่ว่าจะเป็ นข้อมูลด้านการเงิน ข้อมูลการ ดาเนินงาน ข้อมูลเกี่ยวกับผูร้ ับบริ การ ข้อมูลเกี่ยวกับบุคลากร รวมไปถึงข้อมูลที่ได้มีการจัดเก็บในระบบ ฐานข้อมูลซึ่ งจะมีปริ มาณที่เพิ่มมากขึ้นเรื่ อย ๆ จนมากมายมหาศาล ทาให้ไม่สามารถใช้วิธีการจัดการ ทัว่ ไปได้อย่างมีคุณภาพ จึงต้องใช้แนวคิด Big Data ในการจัดการแทน ในปั จจุบนั ขนาดข้อมูลที่ถือว่ามี ขนาดใหญ่มาก เริ่ มต้นที่ขนาดมากกว่า Terabyte ขึ้นไป (เท่ากับ ๑,๐๒๔ Gigabyte) ถัดขึ้นไปก็เป็ น Petabyte (เท่ากับ ๑,๐๒๔ Terabyte) และ Exabyte (เท่ากับ ๑,๐๒๔ Petabyte) โดยการจัดเก็บข้อมูลทั้งที่เป็ นแบบ Structured หรื อ Unstructured ก็ได้ Big Data Analytics นอกจากจะมีคาศัพท์ว่า Big Data ที่หมายถึงการเก็บรวบรวมข้อมูลที่มีอย่างมหาศาลแล้ว ก็ยงั มีอีกหนึ่ งคาที่ควรรู ้ นัน่ ก็คือ “Big Data Analytics” ซึ่ งคานี้ จะมีความหมายว่า การวิเคราะห์เพื่อ การ จัด เก็บ ข้อ มูล ที ่มีข นาดใหญ่แ ละน าข้อ มูล เหล่า นั้ น มาเชื ่อ มโยงกัน เพื อ่ ให้ไ ด้ผ ลลัพ ธ์ที ่ต รงกับ พฤติกรรมของมนุ ษย์มากที่สุดนัน่ เอง ซึ่ งการทางานของ Big Data Analytics นั้น ส่ วนใหญ่จะใช้กนั ในสายงานที่เ กี่ย วข้อ กับ ธุร กิจ ต่า ง ๆ เพื ่อ การน าไปใช้ใ นการสร้า งก าไรเกี่ย วกับ การตลาด และ สามารถนาเสนอสิ่ งที่ลูกค้าของเราสนใจได้มากยิง่ ขึ้น

2

Big Data ในชี วิตประจาวัน สาหรับ ในเรื่ องของ Big Data ในชีว ิต ประจาวันนั้น เป็ นอะไรที่เ ราเห็นได้ชดั เจนมาก เช่น “พฤติกรรมการใช้สื่อโซเชียล” ที่เราใช้กนั อยูใ่ นปั จจุบนั ซึ่ งการใช้โซเชียลนั้นก็เป็ นเรื่ องปกติที่ผคู ้ น ส่ วนใหญ่มกั จะใช้งานกันอยูแ่ ล้ว แล้วคุณรู ้หรื อไม่ว่า Facebook , Twitter , หรื อแม้กระทัง่ Instagram ที่คุณ ใช้ก นั อยูใ่ นปั จ จุบ นั นั้น มีก ารเก็บข้อ มูล พฤติก รรมการใช้งานของคุณอยูต่ ลอดเวลา ว่า คุณมี พฤติกรรมในการใช้งานบนแอพพลิ เคชัน่ นั้น ๆ หรื อเว็บไซต์น้ ัน ๆ อย่างไรบ้างและทางผูพ้ ฒั นาก็จะ นาข้อมูลต่าง ๆ ของคุณมาปรับปรุ งและแสดงสิ่ งที่คุณสนใจขึ้นมา Big Data กับธุรกิจ Big Data ถื อ ว่า เป็ นสิ่ งที่ ส าคัญ เป็ นล าดับต้น ๆ ในการท าธุ ร กิ จ เพราะสามารถช่ ว ยให้การ วิเคราะห์ขอ้ มูลของลูกค้านั้นถูกต้องและแม่นยามากขึ้นนั่นเอง ซึ่ ง Big Data กับธุรกิจนั้นจะต้องมีอี ก หนึ่ งองค์ประกอบที่สาคัญเลยนั่นก็คือ Data Science ที่แปลเป็ นภาษาไทยได้ว่า “วิทยาศาสตร์ ข อ้ มู ล ” เพราะองค์ประกอบนี้จะมีการใช้เครื่ องมือทางคณิ ตศาสตร์และวิทยาศาสตร์เข้ามาช่วยใน การเก็บรวบรวมข้อมูล ทาให้สามารถได้ขอ้ มูลเชิงสถิติที่ดียง่ิ ขึ้นและสามารถเชื่อมโยงรวมถึง หาความสัมพันธ์เกี่ยวกับพฤติกรรมการใช้งานสื่อของลูกค้า เพือ่ นาไปใช้ประโยชน์ทางธุรกิจได้ BIG DATA มีขนาดใหญ่ มาก

มีความสาคัญ

ประมวลผลด้วยซอฟต์ แวร์ คอมพิวเตอร์ ทั่วไปไม่ ได้

บอกข้ อมูลคุณได้ ท้งั หมด

3

สภาพแวดล้ อมสาหรับ Big Data - รองรับและจัดเก็บข้อมูลมากกว่า Petabyte ขึ้นไป - มีการจัดเก็บข้อมูลชนิดที่มีระบบทดแทน รวมทั้งให้บริ การแบบกระจาย - การประมวลผลข้อมูลเป็ นแบบขนาน - มีการประมวลผลข้อมูลข่าวสารที่มีขีดความสามารถแบบ Map Reduce หรื อเทียบเท่า - มีการบริ หารจัดการแบบรวมศูนย์และเป็ นระบบผสานการทางานกับทรัพยากรประมวลผล ต่าง ๆ - ระบบต้องไม่มีค่าใช้จ่ายสูง - ความสามารถในการเข้าถึงข้อมูลใช้งานง่าย และมีความพร้อมของข้อมูลอยูเ่ สมอ - ขีดความสามารถในการให้บริ การจะต้องสามารถแปรผันไปตามความต้องการใช้งานเสมอ

4

บทที่ 2 การทางานของ BIG DATA 2.1 กระบวนการทางานของ Big Data

ภาพที่ 2.1 ขั้นตอนการทางานของ Big Data ที่มา sayhi (2565:ออนไลน์) ขั้นตอนและกระบวนการทางานของ Big Data มีอยู่ 3 ขั้นตอนหลักๆ ดังนี้ 1. จัดเก็บข้ อมูล (Storage) เป็ นขั้นตอนการจัดเก็บรวบรวมข้อมูลทั้งหมดจากแหล่งต่าง ๆ ไม่วา่ จะเป็ น ข้อมูลทีม่ ีคุณภาพรวมถึงข้อมูลที่คาดว่าอาจจะเป็ นประโยชน์ ไม่วา่ จะเป็ นข้อมูลที่เป็ นตัวอักษร ไฟล์ เอกสาร ไฟล์รูปภาพ ไฟล์วดี ีโอ ไฟล์เสียงที่ถูกบันทึก จะถูกเก็บรวบรวมไว้ที่นี่ 2. การประมวลผลข้ อมูล (Processing) การประมวลผลข้อมูล หลังจากที่นาข้อมูลมารวบรวมไว้ได้ในที่ เดียวแล้ว ข้อมูลต่าง ๆ จะถูกนาไปจัดหมวดหมู่ให้อยูใ่ นกลุ่มที่มีความเกี่ยวข้องกันหรื อความสัมพันธ์ ใกล้เคียงกัน ให้ผลลัพธ์คล้ายคลึงกันมากที่สุด แล้วจึงนามาเปลี่ยนเป็ นรู ปแบบข้อมูลเพือ่ นาเอาข้อมูลทีม่ ี อยูเ่ หล่านี้เข้าระบบข้อมูลที่ผา่ นการประมวลผลแล้ว

5

3. การวิเคราะห์ ข้อมูล (Analyst) การวิเคราะห์ขอ้ มูลและนาเสนอข้อมูล หลังจากที่ขอ้ มูลทั้งหมดได้ถูก จัดกลุ่มและแยกประเภทเรี ยบร้อยแล้วนั้น ต่อจากนั้นจะนามาวิเคราะห์หา Pattern ความเกี่ยวข้อ งกัน ทั้งหมด ที่อาจมองไม่เห็นได้เลยด้วยตา ไม่ว่าจะเป็ นการหา แนวโน้มของการตลาด ความต้องการของ ลู กค้า กระแสที่อ าจเกิ ดขึ้นได้ในอนาคต และข้อ มู ล ด้านอื่ นที่เป็ นประโยชน์ และจัดมานาเสนอใน รู ปแบบต่าง ๆ ไม่วา่ จะเป็ นรู ปภาพหรื อกราฟ 2.2 แผนภาพเกี่ยวกับการทางานของ Big Data Big Data จะมีคุณลักษณะสาคัญ ๓ ประการ หรื อ เรี ยกว่า 3Vs Model 1.ปริมาตร (Volume) ข้อมูลที่มีปริ มาณมหาศาล 2.อัตราเพิ่มขึ้นของข้ อมูล (Velocity) จะมีการเปลี่ยนแปลงตลอดเวลาและรวดเร็ ว มักเป็ นแบบ Realtime เช่น ข้อมูลจาก Social Media ข้อมูลการทาธุรกรรมการทางเงิน เป็ นต้น 3. รู ปแบบที่หลากหลาย (Variety) ข้อมูลมีรูปแบบที่หลากหลายทั้งที่เป็ นรู ปแบบมีโครงสร้าง (จัดเก็บ ในระบบฐานข้อมูล) ไม่มีโครงสร้าง (เช่น ไฟล์รูปภาพ วิดีโอ เป็ นต้น) หรื อกึ่งโครงสร้าง

ภาพที่ 2.2 ลักษณะพิเศษ 3 ประการของ Big Data ที่มา บริ ษทั นี้ดี จากัด (2565:ออนไลน์)

6

ภาพที่ 2.3 Big Data ประกอบด้วย 3V ที่มา Diya Soubra (2565:ออนไลน์) 1.ปริมาณ (Volume) Big Data เป็ นข้อมูลที่มีขนาดใหญ่หรื อเป็ นข้อมูลที่มีปริ มาณมากมายมหาศาลไม่ว่าจะอยู่ใน รู ปแบบออนไลน์หรื อออฟไลน์ โดยข้อมูลเหล่านี้จะมีปริ มาณมากกว่าหน่วย TB (Terabyte) ขึ้นไป

ภาพที่ 2.4 การทางานงานของแอพพลิเคชัน่ ต่าง ๆ ที่มา: nattapon (2565:ออนไลน์)

7

2. ความเร็ว (Velocity) ความเร็ วในการประมวลผลและผลิตข้อ มูล ขึ้นมาเพื่อ ให้ทนั กับความต้อ งการของผูใ้ ช้ง าน ซึ่ ง Big Data คือข้อมูลที่ได้มาแบบ Real-Time และประมวลผลอยู่ตลอดเวลา แตกต่างจาก Small Data ที่ไม่สามารถทาได้ Big Data จะมีค วามถี่ใ นการประมวลผลที่ม ากกว่า การบัน ทึก ข้อ มูล ที่ม ากกว่า และเผยแพร่ ข้อมูลที่มากกว่า ข้อมูลของ Big Data ที่มีอตั ราการเพิ่ม ขึ้นของข้อมูล ที่มีการเพิ่มขึ้นได้อ ย่างรวดเร็ ว โดยไม่ว่าจะเป็ น -

ข้อมูลตัวอักษรการสนทนา ข้อมูลการบันทึกเสี ยง ข้อมูลการถ่ายภาพวีดีโอ ข้อมูลอัตราการสั่งซื้ อสิ นค้า ข้อมูลโปรโมชัน่ ต่าง ๆ

ภาพที่ 2.5 การวิเคราะห์ขอ้ มูลโดยใช้กระบวนการ Batch ที่มา: บริ ษทั นี้ดี จากัด (2565:ออนไลน์)

8

โดยปกติองค์กรมีการวิเคราะห์ขอ้ มูลโดยใช้กระบวนการ Batch หรื อการประมวลผลที่ต่อเนื่ อง ตามลาดับโดยมีขอ้ มูลที่ถูกจัดเตรี ยมไว้เรี ยบร้อยแล้ว เหมาะสาหรับข้อมูลที่หลัง่ ไหลมาแบบช้า ๆ ปั จจุบนั แหล่ งของข้อ มู ลมาจากสื่ อ สังคม และอุ ปกรณ์ มื อ ถื อ รวมทั้งอุ ปกรณ์ คอมพิว เตอร์ เคลื่อนที่ การประมวลผลแบบ Batch Processing ไม่สามารถรองรับลักษณะการไหลของข้อมูลแบบนี้ เนื่ อ งจากเป็ นกระแสของข้อมู ลข่าวสารที่หลั่งเข้ามายัง Server และเป็ นแบบ Real-Time และมี ความ ต่อเนื่อง แต่ผลลัพธ์ยงั ใช้งานได้ดี ปี 2000 มีการจัดเก็บข้อมูล 800,000 Petabytes (PB) ปี 2020 มีมากถึง 35 Zettabytes (ZB) Twitter มีการจัดสร้างข้อมูล มากกว่า 7 Terrabytes (TB) ต่อวัน Facebook 10 Terrabytes ต่อวัน องค์กรขนาดวิสาหกิจทัว่ ไป 1 Terrabytes ต่อชัว่ โมงต่อวันทางาน 3. ความหลากหลาย (Variety) ความหลากหลายของประเภทของข้อมูล โดยสามารถเพิ่มประสิ ทธิ ภาพในการนาข้อมูลไป วิเคราะห์ต่อยอดได้ ไม่ว่าจะเป็ นข้อมูลที่เป็ นตัวหนังสือ, รู ปภาพ, ข้อมูลเสียงที่ถูกบันทึกไว้, วีดีโอหรื อ ไฟล์ประเภทอื่นจากหลากหลายแหล่งที่มา ก็สามารถเป็ นส่ วนหนึ่งในการเพิ่มประสิ ทธิภาพการทางาน ของ Big Data ได้ ซึ่งจะเป็ นข้อมูลจากทุกฝ่ ายไม่วา่ จะเป็ นการเงิน ฝ่ ายขาย การตลาด ลูกค้าสัมพันธ์ บัญชี รวมถึง ตัวหนังสื อ ที่อ าจเป็ นบทสนทนาระหว่างแผนก หรื อ ระหว่างบริ ษทั ซึ่ งอาจเป็ นข้อ ความจาก Social Media รวมถึง URLs ที่มีขอ้ มูลเข้ามาอยูใ่ นทุกวัน ปั จจุบนั โครงสร้างข้อมูลนับวันจะมีความสู ญเสี ยความเป็ นโครงสร้างมากขึ้น และมี Format เพิม่ มากยิง่ ขึ้นนับร้อยแบบ เริ่ มตั้งแต่ขอ้ ความเปล่าๆ ภาพถ่าย แฟ้มข้อมูลเสี ยงเพลง แฟ้มข้อมูลวิดีโอ ข้อ มู ล Web ข้อ มู ล GPS ข้อ มู ล จาก Sensor ต่ า ง ๆ ข้อ มู ล จากฐานข้อ มู ลเชิ ง สัม พันธ์ เอกสารทั่วไป ข่าวสาร SMS แฟ้มข้อมูลประเภท pdf แฟ้มข้อมูล Flash และอื่น ๆ มากมาย Veracity ข้อมูลที่ได้มานั้นมีความถูกต้องแม่นยาเพียงใด เนื่องจากข้อมูลมีความหลากหลายและมาจาก แหล่งต่าง ๆ ที่อยูเ่ หนือการควบคุมของเราเช่น Facebook, Twitter, YouTube

9

ภาพที่ 2.6 ปริ มาณข้อมูลที่ผลิตขึ้นในทุก 60 วินาที ที่มา Lorem Ipsum (2565: ออนไลน์) 2.3 ตัวอย่ างข้ อมูลที่ทาให้ เกิด Big Data - ปูมบันทึกการใช้งานเว็บ (Web log) - ข้อมูลจาก RFID - เครื อข่ายเซ็นเซอร์ - เครื อข่ายสังคม, ข้อมูลสังคม (social data) - เอกสารและข้อความบนอินเทอร์เน็ต, การทาดัชนีคน้ หา อินเทอร์เน็ต - บันทึกการรับโทรศัพท์ - ดาราศาสตร์, วิทยาศาสตร์สภาพอากาศ, จีโนมิคส์ - การวิจยั ทางชีวธรณี เคมี ชีววิทยา และการวิจยั ทางวิทยาศาสตร์ที่ ซับซ้อน - การสอดส่องทางการทหาร, เวชระเบียน, คลังภาพถ่าย, คลังภาพ เคลื่อนไหว, และพาณิ ชย์ อิเล็กทรอนิกส์ขนาดใหญ่

10

บทที่ 3 เทคโนโลยีและระบบทีเ่ กีย่ วข้ องกับ BIG DATA

ภาพที่ 3.1 Big Data Technology ที่มา: ชนชาติ นุ่มนนท์ (2565:ออนไลน์) เทคโนโลยีต่าง ๆ ในการเก็บและประมวลผลข้อมูลที่เป็ น Big Data สามารถแบ่งเทคโนโลยี เป็ นสองด้านคือ การเก็บข้อมูล (Storage) และการประมวลผล/วิเคราะห์ขอ้ มูล (Process/Analytics) เรา อาจสามารถจาแนกเทคโนโลยีต่าง ๆ ได้ดงั นี้ 3.1 เทคโนโลยีการเก็บข้ อมูล ข้อมูลที่เป็ น Big Data อาจจะมีขนาดใหญ่เกินกว่าที่เทคโนโลยีการเก็บข้อมูลแบบเดิมที่เรามีอยู่ เก็บได้หรื ออาจเจอปั ญหาในแง่โครงสร้างของข้อมูลที่อาจไม่เหมาะกับเทคโนโลยี RDBMS ตัวอย่างเช่น Telecom operator อาจต้องการเก็บข้อมูล Call Detail Records (CDR) ที่อาจมีปริ มาณสู งถึง 1 Terabytes ต่อวันเป็ นระยะเวลายาวนานขึ้น หรื อเราอาจต้องเก็บข้อมูลในอีเมล์จานวนมากที่เป็ นรู ปแบบของ Text File หรื อเก็บภาพจากกล้อง CCTV จานวนหลายสิ บ TB หรื ออาจต้องการเก็บข้อมูลจาก Facebook ซึ่ ง

11

ข้อมูลต่าง ๆ เหล่านี้ ที่กล่าวมา อาจไม่เหมาะกับเทคโนโลยีฐานข้อมูลแบบเดิม RDBMS ที่เป็ น Vertical Scaling จากที่กล่าวมาจึ่งได้มีการนาเทคโนโลยีต่าง ๆ เข้ามาเพื่อที่จะให้เก็บข้อมูลได้มากขึ้น โดยมีเทคโนโลยี ต่าง ๆ อาทิเช่น - ฐานข้ อมู ล RDBMS แบบเดิม ก็ยงั เป็ นเทคโนโลยีที่ เ หมาะสมที่ สุด ในการเก็บ ข้อ มู ล แบบ Structure แต่ถา้ ข้อมูลมีขนาดใหญ่มากก็จะเจอปั ญหาเรื่ องต้นทุนที่สูง และหากข้อมูลมีจานวน เป็ น Petabytes ก็คงยากที่จะเก็บ ถึ งแม้ในปั จจุบนั จะมี MPP Datanbase อย่าง Oracle ExaDta หรื อ SAP HANA แต่ราคาก็สูงมาก - Hadoop HDFS เป็ นเทคโนโลยีที่มีการคาดการณ์ว่าหน่ วยงานส่ วนใหญ่จะต้องใช้ในอนาคต เพราะมี ค วามต้อ งการเก็ บข้อ มู ล ขนาดใหญ่ ท้ งั ที่ เ ป็ น Unstrucure Data หรื อ น าข้อมู ลที่เป็ น structure มาเก็บไว้ โดยสามารถจะเก็บข้อมูลได้เป็ น PetaByte ทั้งนี้ ข้ ึนอยูก่ บั จานวนเครื่ องที่มี อยูใ่ นลักษณะ scale-out ข้อสาคัญ Hadoop มีตน้ ทุนที่ค่อนข้างต่าเมื่อเทียบกับเทคโนโลยีการ เก็บข้อมูลแบบอื่น - NoSQL เป็ นเทคโนโลยีที่ตอ้ งการเก็บข้อมูลจานวนมากกว่าของ RDBMS ในลักษณะ scale-out เป็ นจานวนหลาย TeraByte แต่อาจไม่ได้เน้นเรื่ อง Consistency หรื อ ACID ของข้อมูลมากนัก เหมาะกับ Application บางประเภท ทั้งนี้ เราสามารถจะแบ่งเทคโนโลยี NoSQL ออกไปได้สี่ กลุ่มคือ Column Oriented, Document Oriented, Key-Value และ Graph - Cloud Storage ข้อมูลขนาดใหญ่ขององค์กรบางส่ วนอาจต้องเก็บไว้ใน Public Cloud Storage เช่ น Amazon S3 โดยเฉพาะข้อ มู ล ภายนอกอาทิ เ ช่ น Social Media Data หรื อ ข้อ มู ล ที่ เ ป็ น Archiving ที่ไม่ได้มีความสาคัญมาก เพราะ Cloud Storage จะมีราคาในการเก็บที่ถูกสุ ด และ สามารถที่จะเก็บได้โดยมีขนาดไม่จากัด แต่ขอ้ เสี ยคือเรื่ องความปลอดภัยและความเร็ วในการ ถ่ายโอนข้อมูล

12

3.2 เทคโนโลยีการประมวลผลข้ อมูล การประมวลผลข้อมูลที่เป็ น Big Data จะมีท้ งั การวิเคราะห์ขอ้ มูลที่เป็ น business intelligence (BI) เพื่อที่จะดึงข้อมูลมานาเสนอ หรื อการทา Predictive Analytics โดยใช้หลักการของ Data Science ความ ยากของการประมวลผลคือต้องการความเร็ ว ในการประมวลผลข้อมู ลที่นอกจากมี ขนาดใหญ่ แ ล้ว บางครั้งยังเป็ นข้อ มู ลที่ไม่ มีโครงสร้าง ดังนั้นต้อ งจึงมี การนาเทคโนโลยีหรื อ ภาษาต่าง ๆ มาเพื่อให้ สามารถประมวลผลข้อมูลได้ ซึ่งในบางครั้งหน่วยงานอาจต้องพิจารณาต้องเลือกใช้ อาทิเช่น - SQL ก็เป็ นภาษาที่ยงั ต้องใช้ในการประมวลผลข้อมูลโดยเฉพาะ Structure Data ที่เก็บอยูใ่ น RDBMS และสามารถประมวลผลแบบ Real-Time ได้ - APIs ข้อมูลที่เก็บอยูใ่ น Storage ต่าง ๆ ที่กล่าวมาข้างต้นเช่น NoSQL หรื อ Cloud Storage อาจ ต้องพัฒนาโปรแกรมด้วยภาษาคอมพิวเตอร์ต่าง ๆ ในการประมวลผลข้อมูลโดยใช้ APIs ใน การเข้าถึงข้อมูล - Map Reduce เป็ นเทคโนโลยีที่พฒั นาโดย Google ในการประมวลผลข้อมูลที่อยูใ่ น HDFS โดย ใช้ภาษาคอมพิวเตอร์อ ย่าง Java ในการพัฒนาโปรแกรม โดยจะประมวลผลแบบ Batch และ เป็ นวิธีการประมวลผลที่มากับเทคโนโลยี Hadoop - Hive หรื อ Pig เป็ นภาษาคล้าย SQL หรื อ Scripting ที่ทาให้เราสามารถประมวลผลข้อมูลที่อยู่ ใน Hadoop HDFS ได้โดยไม่ ตอ้ งพัฒนาโปรแกรม MapReduce แต่ท้ งั นี้ ข้อ มู ลจะต้อ งอยู่ใ น รู ปแบบที่เหมาะสมเช่น ไฟล์ csv หรื อ ไฟล์ขอ้ ความบางประเภท - Impala เป็ นภาษาคล้าย SQL ที่ทาให้เราสามารถประมวลผลข้อมูลที่อยูใ่ น Hadoop HDFS ได้ โดยทางานได้รวดเร็วกว่า Hive มาก แต่มีขอ้ เสียคือเป็ นภาษาที่เป็ น proprietary ของ Cloudera - Spark เป็ นเทคโนโลยีที่สามารถประมวลผลข้อมูลขนาดใหญ่แบบ Real-time โดยอาจมี Data Source มาจากหลากหลายแหล่ ง เช่ น RDBMS, Cloud Storage, NoSQL หรื อ Hadoop ซึ่ ง สามารถเขียนโปรแกรมโดยใช้ภาษา Scala, Java, Python หรื อจะเขียนโดยใช้ภาษาคล้าย SQL ก็ไ ด้ และมี Library สาหรับการทา Data Science คือ MLib เป็ นเทคโนโลยีที่น่าสนใจมาก อันหนึ่ง

13

- ภาษาและเทคโนโลยีในการทา Machine Learning ซึ่ งก็จะมีหลากหลายทั้ง R Hadoop, Mahout, Azure Machine Learning หรื อ AWS ML - เทคโนโลยีสาหรับการทา Data Visualisation และ BI อาทิเช่น Tableau, Pentaho, SaS, Excel และ อื่น ๆ 3.3 Big Data เกี่ยวข้ องกับ - ข้อมูลของบริ ษทั - ข้อมูลติดต่อของลูกค้า - ข้อมูลติดต่อของผูร้ ่ วมธุรกิจ - ลักษณะของผูบ้ ริ โภค - การทารายการธุรกิจต่างๆ ในแต่ละวัน - ตัวอักษร ไฟล์เอกสาร รู ปภาพ - รวมถึงข้อมูลอื่นๆ แทบทุกประเภทที่อยูบ่ นโลกออนไลน์

14

บทที่ 4 การนาไปใช้ ประโยชน์ 4.1 ประโยชน์ ของ Big Data 1. Big Data ช่ วยในการวิเคราะห์พฤติกรรมการใช้งานแอพพลิเคชั่นและเว็บไซต์ของมนุ ษย์ได้ ดีกว่าการใช้แบบสารวจ 2. Big Data สามารถวิเคราะห์ขอ้ มูลในด้านต่าง ๆ ของลูกค้าได้ เช่น ความชอบในผลิตภัณฑ์ตวั นั้น ๆ ของลูกค้า ซึ่งเมื่อลูกค้าทาการค้นหาสิ นค้าตัวนั้นบ่อย ๆ Big Data ก็จะเข้ามาช่วยในเรื่ อง ของการทาให้สินค้าตัวนั้น ๆ แสดงให้ลูกค้าดูบ่อย ๆ นัน่ เอง 3. ช่วยทาให้การทาธุรกิจเป็ นเรื่ องง่ายขึ้น เพราะ Data Scientist สามารถวิเคราะห์ขอ้ มูลทางสถิติ รวมถึ งใช้ภาษาทางคอมพิวเตอร์ ที่เกี่ ยวข้องมาเชื่ อมโยงกับข้อมู ลของลูกค้า และสามารถนา ข้อมูลเหล่านั้นมาใช้ให้เกิดประโยชน์สูงสุดต่อธุรกิจได้ 4. สร้างธุรกิจใหม่ที่ตอบสนองความต้องการของลูกค้าได้ตรงจุด Big Data ส่งผลเป็ นอย่างมากต่อ การเริ่ มต้นธุรกิจใหม่ดว้ ยชุดข้อมูลที่มีอยูแ่ ล้ว ทาให้มองเห็น pain point ของธุรกิจที่กาลังจะเริ่ ม เข้าไปได้ง่ายขึ้น และสามารถสร้างธุรกิจที่ตอบสนองต่อความต้องการของผูบ้ ริ โภคได้อ ย่าง ตรงจุด 5. เข้าใจพฤติกรรมของลูกค้ามากยิง่ ขึ้น การทาความเข้าใจในตัวลูกค้า (Customer Insight) จะทา ให้ธุรกิ จของคุ ณสามารถนาเสนอบริ การที่ตรงใจลูกค้าได้มากยิ่งขึ้น ซึ่ งธุ รกิ จในปั จจุบนั ใช้ ประโยชน์จาก Big Data ในแง่ของการทาให้เกิด Data-Driven หรื อการขับเคลื่อนด้วยข้อมูลที่ องค์กรหรื อแบรนด์ต่าง ๆ นามาใช้วเิ คราะห์เพือ่ ให้เข้าใจพฤติกรรมลูกค้าให้มากยิง่ ขึ้น 6. พัฒนาศักยภาพธุรกิจ และก้าวนาหน้าคู่แข่ง Big Data ทาให้แต่ละธุรกิจมีขอ้ มูลจานวนมหาศาล อยูใ่ นมือ ซึ่งจะสามารถสร้างกลยุทธ์ที่เหนือกว่าคู่แข่ง และใช้มนั เพือ่ เข้าถึงตัวลูกค้าได้ก่อนใคร อีกทั้งการมีทีมงานที่มีความเชี่ยวชาญในการวิเคราะห์ขอ้ มูล จะเป็ นกาลังสาคัญให้กบั ธุรกิ จใน

15

อนาคต เพื่อช่วยให้คุณสามารถตัดสิ นใจทางธุ รกิจได้อ ย่างชาญฉลาด จนสามารถแข่งขันกับ คู่แข่งอื่นได้ 4.2 ข้ อ ควรระวังในการใช้ Big Data 1. เลือกเชื่ อตัวเองมากกว่ าข้ อมูลที่ได้ จาก Big Data ความล้มเหลวหลัง จากที่เลื อกใช้ Big Data ทีม บริ หารยัง คงเลือ กที่จะเชื่อ ตัว เองมากกว่า ถึงแม้ว ่า ข้อมูลที่ได้มากจาก Big Data นั้นจะเป็ นข้อมูลที่เป็ นเหตุเป็ นผลแล้วก็ตาม 2. เลือกใช้ เครื่ องมือแก้ ไขปัญหาที่ผิด หลังจากที่เริ่ มต้นใช้ Big Data เข้ามาใช้ในองค์กรแล้วแต่ดว้ ย Big Data อาจเป็ นเทคโนโลยีใหม่ใน องค์กร คนในองค์กรอาจจะยังเลือ กใช้เทคโนโลยีในรุ่ นเก่าที่คุน้ ชินมากกว่า เข้ามาแก้ไ ขปั ญหาทา ให้การใช้เทคโนโลยี Big Data ในองค์กรไม่สาเร็ จ 3. ขาดแคลนบุคลากรที่มีทักษะด้ าน IT เนื่ องจากเทคโนโลยี Big Data เป็ นเทคโนโลยีที่มี ความทันสมัย จึงจาเป็ นต้องใช้บุคลากรที่มีค วามรู ้ และความชานาญในด้าน IT เป็ นอย่างมาก หากขาดบุคลากรด้านนี้ ไ ปก็อ าจทาให้การใช้ Big Data ในองค์กรสาเร็ จได้ยาก 4. อาจเกิดปัญหาที่ Big Data ก็ไม่ สามารถแก้ ไขได้ การใช้เ ทคโนโลยี Big Data ในองค์ก รก็อ าจเกิด ปั ญ หาขึ้ น มาได้ซ่ึ ง Big Data ก็ไ ม่ส ามารถแก้ไ ข ปั ญ หาในส่ ว นนี้ ไ ด้ โดยอาจจะเป็ นปั ญ หาด้า นอิน เตอร์เ น็ต หรื อ ขาดบุค ลากรที ่ม ีค วามรู ้ ความสามารถด้าน IT 5. การใช้ เทคโนโลยี Big Data ที่อาจสวนทางกับการวางแผนขององค์ กร การนา Big Data ไปปรับใช้ในองค์กร จะไม่สามารถประสบสาเร็ จได้เลยหากขาดการสนับสนุ น ที่ดี จากองค์กร หรื อให้ความสาคัญกับแผนอื่นมากกว่า

16

6. ขาดการเก็บข้ อมูลที่เพียงพอ ในหลายองค์ก รอาจขาดการเก็บ ข้อ มูล เพิ ่ม เติม ซึ่ ง ในหลายองค์ก รหลีก เลี ่ย งที ่จ ะหาข้อ มูล เอง เนื่ อ งจากการเพิ่มขั้นตอนในการทางาน อาจทาให้ขอ้ มูล ที่วิเคราะห์มาอาจคลาดเคลื่อนได้เนื่ องจาก ขาดข้อมูลที่สาคัญไป 4.3 BIG DATA สาคัญอย่ างไร 4.3.1 การนา BIG DATA มาใช้ ในด้ านธุรกิจ ศึกษาลักษณะพฤติกรรมของผูบ้ ริ โภคจากฐานข้อมูลใน BIG DATA

วิเคราะห์การตลาดในอนาคต โดยนาข้อมูลมาจาก อินเตอร์เน็ต, social media อื่นๆ ที่เกิดขึ้นใหม่เรื่ อยๆในปั จจุบนั

- คาดการณ์ปัญหาที่จะเกิดขึ้นได้ โดยวิเคราะห์จากอินเตอร์เน็ต , social media - ลดต้นทุนไปจานวนมาก เช่น ลดจ้างงานพนักงาน IT เพราะเราใช้ BIG DATA มาแทนที่แล้ว

17

ภาพที่ 4.1 Big data กับผูป้ ระกอบการ สู่การก้าวข้ามทางรอดของธุรกิจ ที่มา: Published online (2565:ออนไลน์) 4.3.2 BIG DATA เพิ่มประสิ ทธิภาพ social media ช่วยในเรื่ องของธุรกิจ และการเผยแพร่ ขอ้ มูล เพราะ BIG DATA เป็ นวิธีที่จะช่วยในเรื่ องของการส่ ง หรื อแบ่งปั นข้อมูลไปยังผูร้ ับในจานวนมากซึ่งทั้งคุณและผูช้ มจะได้เจอกันแบบเรี ยลไทม์

ภาพที่ 4.2 การทางานของ BIG DATA ใน Social Media ที่มา: https://digitalmarketingwow.com (2565:ออนไลน์)

18

4.3.3 BIG DATA กับการศึกษา ช่วยให้สถาบันการศึกษาพัฒนาระบบเทคโนโลยีของตนเองได้ เช่น สร้างแอพพลิเคชัน่ หรื อ แพลตฟอร์มเกี่ยวกับการศึกษาเพื่อ ให้ขอ้ มูลกับนักศึกษาหรื อ บุคลากรในองค์กรได้อ ย่างรวดเร็ วและ เข้าถึงง่าย รวมถึงประหยัดเวลา นอกจากนี้ยงั ช่วยให้สถาบันการศึกษาวางแผนเพื่ออนาคต คือ การเก็บ รวบรวมข้อมูล การตัดสิ นใจในการรับนักศึกษา และ สร้างหลักสู ตรเพื่อตอบสนองความต้องการของ ผูเ้ รี ยนในสถานการณ์ที่เปลี่ยนแปลงในแต่ละยุคสมัย

19

บทที่ 5 การสั มภาษณ์ จากนักศึกษา IT 1. ชื่ อ นามสกุล นายวันเฉลิม ชมภูใส 2. เรียนสาขา สถาบันการศึกษา สาขาเทคโนโลยีสารสนเทศ สถาบัน เทคนิคเชียงใหม่ 3. ความหมายของ BIG DATA จากห้ องเรียน BIG DATA คือการเก็บข้อมูลขนาดใหญ่ ไว้ในที่เดียว เช่นข้อมูลนักศึกษา ข้อมูลการเรี ยนฯลฯ 4. ทางานเกี่ยวกับ พนักงาน office 5. องค์กรใช้ งาน BIG DATA หรื อไม่ ปรับใช้ ในการทางานหรื อชีวิตประจาวันอย่างไร BIG DATA ในองค์กร ยังถือว่าได้ใช้อยูค่ ่อนข้างน้อย เพราะระบบการทางาน ไม่ได้มีการเก็บข้อมูลที่ มากมาย

20

บรรณานุกรม เอกสารอิเล็กทรอนิกส์ Rijul Singh Malik. (2565). Big data in Social Media: How Big Data can be used to better Analyze Social Media Participation. สื บ ค้ น เ มื่ อ 2 1 มิ ถุ น า ย น 2 5 6 5 , สื บ ค้ น จ า ก dhttps://medium.datadriveninvestor.com/big-data-in-social-media-how-big-data-can-be-used-tobetter-analyze-social-media-participation-9ff2702de43d sayhi. (2565). Big Data คืออะไร อธิ บายแบบเข้ าใจง่ าย. สื บค้นเมื่ อ 21 มิ ถุนายน 2565, สื บค้นจาก https://1stcraft.com/what-is-big-data/ The Chapt. (2565). Big data คืออะไร มีประโยชน์ อย่ างไร. สื บค้นเมื่อ 21 มิถุนายน 2565, สื บค้นจาก https://thechapt.com/big-data/ Wayne Thompson. (2565). บิ๊กดาต้ านิยามและความสาคัญ. สื บค้นเมื่อ 21 มิถุนายน 2565, สื บค้นจาก https://www.sas.com/th_th/insights/big-data/what-is-big-data.html wikipedia. ( 2 5 6 1 ) . Big data. สื บ ค้ น เ มื่ อ 2 1 มิ ถุ น า ย น 2 5 6 5 , สื บ ค้ น จ า ก https://en.m.wikipedia.org/wiki/Big_data ธนชาติ นุ่มนนท์. (2558). เทคโนโลยีสาหรับ Big Data: Storage และ Analytics. สืบค้นเมื่อ 21 มิถุนายน 2565.สืบค้นจาก https://thanachart.org/2015/08/17/%E0%B9%80%E0%B8%97%E0%B8%84%E0%B9%82%E0%B8 %99%E0%B9%82%E0%B8%A5%E0%B8%A2%E0%B8%B5%E0%B8%AA%E0%B8%B3%E0% B8%AB%E0%B8%A3%E0%B8%B1%E0%B8%9A-big-data/ ศุลกากร (2558: ออนไลน์) สานักพิมพ์บิงโก. (2559). Big Data คืออะไร ทาไมถึงสาคัญกับชีวิตเรา. สื บค้นเมื่อ 21 มิถุนายน 2565, สืบค้นจาก https://bingobook.co/vision/big-data/

21

สั มภาษณ์ วันเฉลิม ชมภูใส, สั มภาษณ์, 20 มิถุนายน 2565.

Data Loading...