คำนี้มีมาเกือบสองทศวรรษแล้ว แต่โลกเพิ่งเริ่มพูดถึง
‘ข้อมูลขนาดใหญ่’ 666slotclubในช่วงสองสามเดือนแรกของปี 2011 เท่านั้น เรารู้เรื่องนี้เพราะเราสามารถค้นหาได้ใน Google เทรนด์ (ดู ‘เครื่องหมายไบต์’)
เครื่องหมายไบต์: ความสนใจในข้อมูลขนาดใหญ่ที่เพิ่มขึ้นอย่างรวดเร็วตั้งแต่ปี 2011 สามารถติดตามได้อย่างชัดเจนในที่เก็บถาวรของข้อความค้นหาของ Google เครดิต: ที่มา: Google Trends; กราฟฟิค: Claire Welsh/Nature
Google สร้างอาณาจักรด้วยการรวบรวมและวิเคราะห์ข้อมูลในเชิงลึกที่แทบจะหยั่งรู้ ทุกข้อความค้นหาที่เคยพิมพ์ลงในเครื่องมือค้นหาจะอยู่ในที่เก็บข้อมูลหลายเอ็กซาไบต์ของ Google ร้านค้าเหล่านี้ยังมีหนังสือหลายสิบล้านเล่ม รูปภาพความละเอียดสูงของถนนทั่วโลก และอีเมล วิดีโอ เอกสารประมวลผลคำ และสเปรดชีตมากมาย สิ่งใดก็ตามที่สามารถแสดงผลเป็นบิตและไบต์และสามารถเข้าถึงได้จากเซิร์ฟเวอร์ของบริษัท จะถูกผลัก จัดเก็บ ประทับตรา จัดทำดัชนี บรรยายสรุป ซักถาม และกำหนดหมายเลขโดยตัวแทนรวบรวมข้อมูลกึ่งอิสระ ป้อน ‘ข้อมูลขนาดใหญ่’ ลงในเว็บไซต์ Google เทรนด์ และเสี้ยววินาทีต่อมา กราฟความถี่จะปรากฏขึ้น เส้นของกราฟนั้นสูงขึ้นอย่างรวดเร็วในช่วงไตรมาสแรกของปี 2011 คุณกำลังกลั่นกรองข้อมูลนั้นจากชุดข้อมูลขนาดมหึมาที่ประกอบด้วยข้อมูลทั้งหมด คำค้นหาจากเครื่องมือค้นหาของโลกในช่วงสิบปีที่ผ่านมา
การอัพเกรดที่ราบรื่นในอินเทอร์เฟซของคอมพิวเตอร์ปิดบังช่วงเวลาจำกัด: ในอีกไม่กี่ปีข้างหน้า เราได้ย้ายจากข้อมูลที่มนุษย์สร้างขึ้น รวบรวม และเข้าใจได้โดยลำพัง — กิโลไบต์ เมกะไบต์ และกิกะไบต์ — สู่อาณาจักรระดับเพตาไบต์และเอ็กซาไบต์ที่ไม่เคยจินตนาการได้มาก่อน terahertz เร่งความเร็วและประมวลผลเกือบจะเร็วพอๆ กัน การเปลี่ยนแปลงได้ก้าวข้ามขอบเขตไปสู่การปฏิวัติ
ใน Big Data, Little Data, No Data, ผู้เชี่ยวชาญด้านการศึกษาข้อมูล Christine Borgman พิจารณาข้อมูลขนาดใหญ่ผ่านเลนส์ที่ค่อนข้างแคบ: การวิจัยเชิงวิชาการ ในแต่ละวัน นักวิทยาศาสตร์ต้องต่อสู้กับปริมาณข้อมูลที่น่าตกใจมากขึ้นเรื่อยๆ เครื่องตรวจจับ ATLAS บน Large Hadron Collider ที่ CERN ห้องปฏิบัติการฟิสิกส์อนุภาคของยุโรปใกล้เมืองเจนีวา ประเทศสวิตเซอร์แลนด์ ต้องจัดเรียงข้อมูลหลายสิบเทราไบต์ทุก ๆ วินาทีในขณะที่ทำงาน และกรองข้อมูลนั้นตามลำดับความสำคัญห้าระดับก่อนที่มนุษย์จะจัดการได้ กับมัน กล้องโทรทรรศน์รุ่นต่อไป เช่น Square Kilometer Array จะรวบรวมข้อมูลขนาดเอ็กซาไบต์ในแต่ละวัน ซึ่งเป็นจำนวนที่จะเติมเต็มความจุรวมของอุปกรณ์พกพาข้อมูลทั้งหมดของโลก (รวมถึงหนังสือ ภาพถ่าย และวิดีโอ) จนถึงกลาง ทศวรรษ 1980
Borgman เป็นนักมานุษยวิทยาข้อมูล
เธอไปท่ามกลางนักวิจัยในสาขาวิทยาศาสตร์กายภาพ สังคมศาสตร์ และมนุษยศาสตร์ เพื่อค้นหาว่าพวกเขารวบรวม จัดการ และแบ่งปันข้อมูลจำนวนมากได้อย่างไร บทความของเธอน่าสนใจแต่น่าหงุดหงิด เธอมีปัญหาในการเปลี่ยนชุดข้อมูลขนาดใหญ่ของเธอให้กลายเป็นการเล่าเรื่องที่กว้างพอที่จะครอบคลุมหัวข้อต่างๆ และให้ลึกพอที่จะแสดงความยุติธรรมกับพวกเขา บ่อยครั้ง ดูเหมือนว่าเธอจะพยักหน้าอย่างรวดเร็วถึงองค์ประกอบที่จำเป็น ตัวอย่างเช่น เธอกล่าวถึงสิ่งพิมพ์และข้อมูลแบบเปิด แต่ไม่ได้บอกใบ้ถึงการต่อสู้รอบตัวพวกเขาในโลกการวิจัยและการเผยแพร่ เธอเสนอข้อมูลเชิงลึกที่สำคัญ — ว่าการเผยแพร่ผลการวิจัยและข้อมูลดิบมีพลวัตที่แตกต่างกัน และมีความเข้าใจสั้นที่จะมุ่งเน้นไปที่การเปิดตัวชุดข้อมูลใหม่มากกว่าที่จะรักษาและนำข้อมูลไปใช้ซ้ำ แต่หนังสืออาจกล่าวได้มากกว่านี้ แทบไม่มีคำกล่าวใดๆ เกี่ยวกับการโต้เถียงครั้งใหญ่เกี่ยวกับการบุกรุกขององค์กรการค้าในการรวบรวม เผยแพร่ และควบคุมข้อมูลทางวิชาการ
ใน Data-ism Steve Lohr ดำเนินการตามนัยทางการค้าของข้อมูลขนาดใหญ่ แต่ผ่านเลนส์ที่แคบเท่ากัน ในฐานะผู้มีประสบการณ์ด้านเทคโนโลยีและนักข่าวธุรกิจ เขาสนใจเรื่องราวที่ว่าข้อมูลสามารถช่วยขจัดความไร้ประสิทธิภาพที่ขัดขวางไม่ให้ธุรกิจเข้าถึงศักยภาพของตนได้อย่างไร เขายกตัวอย่างของ McKesson ผู้จัดจำหน่ายยาและเวชภัณฑ์ที่ใช้ที่เก็บถาวรของผลิตภัณฑ์และข้อมูลการจัดส่งเพื่อสร้างแบบจำลองห่วงโซ่อุปทาน ซึ่งนำไปสู่การลดลงหลายพันล้านดอลลาร์ในสินค้าคงคลังและประสิทธิภาพที่เพิ่มขึ้นอย่างมาก ดังที่ Lohr กล่าวว่า “ข้อมูลถูกใช้จริงๆ เพื่อ … ตัดสินใจได้ดีขึ้น ข้อมูลที่เหนือกว่าการคาดเดาและความรู้สึกลึกล้ำ ประสบการณ์ และสัญชาตญาณ”
อนิจจา Data-ism เป็นหนังสือธุรกิจทั่วไป เต็มไปด้วยเกร็ดเล็กเกร็ดน้อย โปรไฟล์ขนาดเล็ก และคำพังเพยที่น่าสนใจน้อยลง แต่พวกเขาจะพูดถึง TEDx talk ได้ดีเพียงใด สัญชาตญาณนักข่าวของลอห์มักจะหักหลังเขา เขารู้สึกไม่ประทับใจกับการรวบรวมข้อมูลจำนวนมหาศาลและการทำโปรไฟล์ผู้บริโภคของ Acxiom ยักษ์ใหญ่ด้านข้อมูล แต่กลับตกตะลึงกับโปรแกรมดูดวงบุคลิกภาพแบบธรรมดาที่ดูเหมือนจะดูถูกฟีด Twitter และสำหรับ 81% ของอาสาสมัคร “ค่อนข้างตรงกับผลลัพธ์ของ แบบทดสอบอย่างเป็นทางการสำหรับประเภทบุคลิกภาพ ค่านิยมพื้นฐาน และความต้องการ”
ทั้ง Borgman และ Lohr ต่างก็ไม่สามารถรับมือกับความใหญ่โตของเรื่องราวข้อมูลขนาดใหญ่ได้อย่างแท้จริง โดยพื้นฐานแล้วบิ๊กดาต้าไม่ใช่การปฏิวัติทางธุรกิจหรือการวิจัยเป็นหลัก แต่เป็นการปฏิวัติทางสังคม ในทศวรรษที่ผ่านมา เราได้อนุญาตให้เครื่องจักรทำหน้าที่เป็นตัวกลางในเกือบ666slotclub