ทฤษฎี

Big Data คือ ข้อมูลขนาดใหญ่ ส่วนความหมายที่แท้จริงนั้นคือ การนำข้อมูลมหาศาลมาสรุปประมวลผลเพื่อทำความเข้าใจอย่างลึกซึ้ง และนำเสนอในรูปแบบที่ง่ายต่อการทำความเข้าใจ จุดสำคัญของ Big Data อยู่ที่คำว่า “Big” หรือมหาศาลนั่นเอง ที่ทำให้ Big Data แตกต่างจากการประมวลผลข้อมูลในรูปแบบเก่า คำว่ามหาศาลนั้น META Group (ปัจจุบันคือ Gartner) ได้นิยามไว้สามรูปแบบ (3V) นั่นคือ Volume (ปริมาณ), Velocity (ความรวดเร็วในการนำข้อมูลเข้าออก), และ Variety (ข้อมูลหลากหลายประเภท) [1] เช่น ในด้านปริมาณนั้นโปรเจ็กต์ทางดาราศาสตร์ขื่อ GALEX [2] ที่ถ่ายภาพของท้องฟ้าทั้งหมด 360 องศา โดยใช้กล้องส่องดูดาว ซึ่งนักวิจัยจะนำภาพถ่ายเหล่านี้มาวิเคราะห์จำแนกประเภทของดวงดาวที่ถ่ายภาพมาได้ ภาพถ่ายท้องฟ้านั้นมีความละเอียด 2400 พิกเซลต่อหนึ่งองศา คำนวณคร่าวๆ ว่าภาพถ่ายทรงกลมของท้องฟ้าจะมีจำนวนพิกเซลประมาณ 238 กิกะพิกเซล (ขอข้ามรายละเอียดการคำนวณนะครับ) นี่คือต่อหนึ่งภาพเท่านั้น ขนาดข้อมูลของภาพถ่ายทั้งหมดของโปรเจ็กต์ GALEX รวมกันประมาณ 20 เทอราไบต์ครับ และโปรเจ็กต์นี้เริ่มขึ้นเมื่อปี 2003 คือสิบปีที่แล้วพอดี ปัจจุบันนี้กล้องดูดาวรุ่นใหม่จะผลิตข้อมูลขนาดมหาศาลถึงหลักเพตาไบต์แล้ว (1 เพตาไบต์เท่ากับหนึ่งล้านกิกะไบต์) ปริมาณมหาศาลในอีกรูปแบบคือ จำนวนจุดข้อมูลที่มหาศาล ตัวอย่างเช่น จำนวนทวีตที่ผู้ใช้ส่งกันในหนึ่งสัปดาห์นั้น อยู่ที่ประมาณหนึ่งพันล้านทวีต (ข้อมูลเมื่อปี 2011) ถ้าเราต้องวิเคราะห์จำนวนครั้งเฉลี่ยที่ทวีตหนึ่งถูกรีทวีตต่อๆ กันไป ก็ต้องวิเคราะห์ข้อมูลหนึ่งพันล้านข้อมูลนี้

ไม่มีความคิดเห็น:

แสดงความคิดเห็น