Big Data คือ ข้อมูลขนาดใหญ่ ส่วนความหมายที่แท้จริงนั้นคือ
การนำข้อมูลมหาศาลมาสรุปประมวลผลเพื่อทำความเข้าใจอย่างลึกซึ้ง
และนำเสนอในรูปแบบที่ง่ายต่อการทำความเข้าใจ จุดสำคัญของ Big Data อยู่ที่คำว่า
“Big” หรือมหาศาลนั่นเอง ที่ทำให้ Big Data แตกต่างจากการประมวลผลข้อมูลในรูปแบบเก่า คำว่ามหาศาลนั้น META Group (ปัจจุบันคือ Gartner) ได้นิยามไว้สามรูปแบบ (3V) นั่นคือ Volume (ปริมาณ), Velocity (ความรวดเร็วในการนำข้อมูลเข้าออก),
และ Variety (ข้อมูลหลากหลายประเภท) [1]
เช่น ในด้านปริมาณนั้นโปรเจ็กต์ทางดาราศาสตร์ขื่อ GALEX [2] ที่ถ่ายภาพของท้องฟ้าทั้งหมด 360 องศา
โดยใช้กล้องส่องดูดาว
ซึ่งนักวิจัยจะนำภาพถ่ายเหล่านี้มาวิเคราะห์จำแนกประเภทของดวงดาวที่ถ่ายภาพมาได้
ภาพถ่ายท้องฟ้านั้นมีความละเอียด 2400 พิกเซลต่อหนึ่งองศา
คำนวณคร่าวๆ ว่าภาพถ่ายทรงกลมของท้องฟ้าจะมีจำนวนพิกเซลประมาณ 238 กิกะพิกเซล (ขอข้ามรายละเอียดการคำนวณนะครับ) นี่คือต่อหนึ่งภาพเท่านั้น
ขนาดข้อมูลของภาพถ่ายทั้งหมดของโปรเจ็กต์ GALEX รวมกันประมาณ
20 เทอราไบต์ครับ และโปรเจ็กต์นี้เริ่มขึ้นเมื่อปี 2003
คือสิบปีที่แล้วพอดี ปัจจุบันนี้กล้องดูดาวรุ่นใหม่จะผลิตข้อมูลขนาดมหาศาลถึงหลักเพตาไบต์แล้ว
(1 เพตาไบต์เท่ากับหนึ่งล้านกิกะไบต์)
ปริมาณมหาศาลในอีกรูปแบบคือ จำนวนจุดข้อมูลที่มหาศาล ตัวอย่างเช่น
จำนวนทวีตที่ผู้ใช้ส่งกันในหนึ่งสัปดาห์นั้น อยู่ที่ประมาณหนึ่งพันล้านทวีต
(ข้อมูลเมื่อปี 2011) ถ้าเราต้องวิเคราะห์จำนวนครั้งเฉลี่ยที่ทวีตหนึ่งถูกรีทวีตต่อๆ
กันไป ก็ต้องวิเคราะห์ข้อมูลหนึ่งพันล้านข้อมูลนี้
ไม่มีความคิดเห็น:
แสดงความคิดเห็น