“Garbage in – Garbage Out (GIGO) หมายถึง ป้อนขยะเข้ามา ก็จะได้ขยะออกไป” เป็นนิยามที่มักพบได้บ่อยในโลกของ Computer Science และ Data Analytics ที่สะท้อนถึงปัญหาที่หลายองค์กรอาจกำลังเผชิญอยู่ จากการใช้ข้อมูลที่ขาดคุณภาพและความถูกต้องแม่นยำจนทำให้การตัดสินใจทางธุรกิจผิดพลาด แม้ว่าข้อมูลเหล่านั้นได้ผ่านกระบวนการวิเคราะห์ขั้นสูงของเทคโนโลยีปัญญาประดิษฐ์อย่าง Artificial Intelligence: AI หรือ Machine Learning: ML มาแล้วก็ตาม
กระแสความต้องการนำ AI หรือ ML มาใช้ยกระดับขีดความสามารถในการแข่งขันธุรกิจเป็นหนึ่งในเทรนด์เทคโนโลยีที่หลายองค์กรอยากมีไว้ในครอบครอง แต่โดยหลักการแล้ว การใช้ปัญญาประดิษฐ์ หรือ Data Analytics เพื่อวิเคราะห์ข้อมูลขั้นสูงนั้น เปรียบได้กับภาพกระบวนการท้ายๆ ของการใช้ประโยชน์จากข้อมูล นั่นหมายความว่า องค์กรส่วนใหญ่กำลังมุ่งไปสู่ปลายทางของการใช้งานโดยมองข้ามขั้นตอนสำคัญในการสร้างพื้นฐานที่แข็งแกร่งและเพิ่มคุณค่าให้กับข้อมูลด้วยการสร้าง “Data Architecture หรือ สถาปัตยกรรมข้อมูล” เพราะการนำข้อมูลที่ยังไม่ผ่านกระบวนการตรวจสอบความถูกต้องหรือได้มาตรฐาน ไปใช้ประมวลผลหรือวิเคราะห์ด้วยปัญญาประดิษฐ์ ผลลัพธ์ที่ได้อาจคลาดเคลื่อนจนถึงผิดพลาด ส่งผลต่อการตัดสินใจทางธุรกิจในที่สุดและอาจสร้างความสูญเสียหรือเสียหายที่ยากจะคาดเดาได้ในอนาคต
ด้วยเหตุนี้ บลูบิค จึงอยากนำเสนอบทความเกี่ยวกับ “Data Architecture”สถาปัตยกรรมที่เข้ามาสร้างขุมพลังแห่งข้อมูล ซึ่งเป็นรากฐานสำคัญในการสร้างมาตรฐานข้อมูลและการใช้งาน ที่จะนำไปสู่การปลดล็อกพลังแห่งปัญญาประดิษฐ์ และผลักดันให้ภาคธุรกิจสามารถปรับเปลี่ยนเป็นองค์กรที่ขับเคลื่อนด้วยข้อมูล หรือ Data-Driven Organization ได้ตามเป้าหมาย
DATA Architecture คืออะไร ?
“Data Architecture” เปรียบเสมือนการมีพิมพ์เขียวที่กำหนดทิศทาง มาตรฐานข้อมูลและองค์ประกอบอื่นๆ ในการบริหารจัดการข้อมูลให้มีประสิทธิภาพ มีมาตรฐานและเป็นไปในทิศทางเดียวกัน รวมถึงมีความคล่องตัวและความยืดหยุ่นในการเรียกใช้งานข้อมูลเพื่อตอบสนองความต้องการทางธุรกิจได้อย่างถูกต้องแม่นยำและรวดเร็ว โดยองค์ประกอบสำคัญของ “Data Architecture” มีดังต่อไปนี้
1. Data Sources แหล่งข้อมูลต้นน้ำขององค์กรที่จะนำเข้าสู่ระบบ หรือ Input ที่มาจากแหล่งต่างๆ และหลากหลายรูปแบบทั้งแบบที่มีโครงสร้าง (Structured Data) กึ่งโครงสร้าง (Semi-structured Data) และแบบที่ไม่มีโครงสร้าง (Unstructured Data) อาทิ ข้อมูลในฐานข้อมูล (Database) ข้อมูลจากแอปพลิเคชัน และข้อมูลรูปภาพ เป็นต้น
2. Data Modeling เป็นการออกแบบจำลองข้อมูลให้สอดรับกับความต้องการใช้งานทางธุรกิจ
3. Data Integration วิธีการเชื่อมต่อไปยังแหล่งข้อมูลดิบเพื่อที่จะนำเข้าข้อมูลต่างๆ มายังแหล่งเก็บข้อมูลกลาง Data Lake และ Data Warehouse
4. Data Pipeline and Data Flow กำหนดรูปแบบการนำเข้าข้อมูล ว่าจะเป็นแบบ Batch หรือ Realtime พร้อมทั้งจัดการควบคุมการนำเข้าข้อมูล และปรับเปลี่ยนรูปแบบ (Transform) ข้อมูลให้อยู่ในรูปแบบ Data Model ที่ออกแบบไว้แล้ว
5. Data Storage แหล่งเก็บข้อมูล อาจจะเป็น Data Lake ที่เป็นแหล่งของข้อมูลดิบ หรือ Data Warehouse ซึ่งเป็นแหล่งเก็บข้อมูลที่ผ่านกระบวนการ Data Cleansing ที่อยู่ในรูปแบบพร้อมนำไปวิเคราะห์ต่อ หรือจะเป็น Data Mart ที่เป็นแหล่งเก็บข้อมูลที่พร้อมนำไปใช้ในการนำเสนองาน ทำรายงาน (Report) หรือ การทำ Dashboard ให้ผู้บริหาร
6. Data Serving ช่องการให้บริการข้อมูลที่พร้อมใช้กับหน่วยการต่างๆ อาจจะอยู่ในรูปแบบต่างๆ เช่น Database และ Application Programming Interface (API) เป็นต้น
บทบาทหน้าที่ของ “Data Architecture” สู่การสร้างมาตรฐาน “Data of Truth”
- การทำความเข้าใจภาพธุรกิจ เพื่อใช้ในการออกแบบ Data Modeling (แบบจำลองข้อมูล) ให้มี Attribute หรือข้อมูลลักษณะเฉพาะที่ใช้แบ่งหมวดหมู่ของข้อมูล และ Identify Data ให้ตรงกับความต้องการใช้งานขององค์กร
- การสร้างมาตรฐานการจัดเก็บข้อมูลให้อยู่ในรูปแบบเดียวกัน เพื่อให้ง่ายต่อการนำไปใช้งานและการเชื่อมต่อข้อมูลต่างๆ นอกจากนั้นยังสามารถรองรับการทำงานของระบบใหม่ๆ ในอนาคต
- การกำหนดวิธีการจัดเก็บและการดำเนินการของข้อมูล (Data Storage and Operation) เป็นการกำหนดแหล่งข้อมูล หรือ Data Source ที่จะนำมาวางเป็นแกนกลางของ Data Model และออกแบบ Flow ของข้อมูลที่ใช้ในการประมวลผล (Process) ซึ่งในกระบวนการนี้จะต้องมีการคิดเป็นภาพและกำหนดขั้นตอนการบริหารจัดการข้อมูลให้ชัดเจน ตั้งแต่ สถานที่จัดเก็บข้อมูล เทคโนโลยีที่ใช้ จนถึงแหล่งข้อมูลที่ใช้สำหรับการประมวลผล
- การเชื่อมโยงและแลกเปลี่ยนข้อมูล โดยการออกแบบเทคโนโลยีที่ใช้ในการเชื่อมต่อและแลกเปลี่ยนข้อมูลให้กับ Data Source ที่มาจากหลายแหล่ง ซึ่งอาจจะต้องใช้วิธีการเชื่อมต่อที่แตกต่างกัน เช่น บางแอปพลิเคชันอาจต้องเชื่อมต่อโดยใช้ API ในขณะที่บางแอปฯ สามารถเชื่อมต่อตรงกับฐานข้อมูลที่มีอยู่ได้เลย
- การออกแบบความปลอดภัยให้ข้อมูล (Data Security) โดยการกำหนดสิทธิ์การเข้าถึงข้อมูล ด้วยการทำ Data Classify ให้กับข้อมูลอย่างชัดเจนว่า ข้อมูลไหนเป็นข้อมูลสาธารณะ (Public) ข้อมูลไหนเป็นข้อมูลเฉพาะแผนก และข้อมูลไหนสามารถเข้าถึงได้เฉพาะผู้บริหารเท่านั้น เพื่อสร้างมาตรฐานความปลอดภัยเบื้องต้นให้ข้อมูลองค์กร
- การแยกแยะข้อมูลโดยการแยกประเภทข้อมูลว่า ข้อมูลใดเป็น Master Data และข้อมูลใดเป็น Reference Data เพื่อให้การเรียกใช้ข้อมูลสามารถทำได้อย่างถูกต้องแม่นยำมากขึ้น ยกตัวอย่างเช่น บริษัทที่จำเป็นต้องใช้ ข้อมูลอัตราแลกเปลี่ยน (Exchange Rate) ที่มีการเปลี่ยนแปลงตลอดเวลา ถ้าหากไม่มีการกำหนด Reference Data ให้ชัดเจนอาจทำให้อัตราแลกเปลี่ยนที่นำมาใช้อ้างอิงของแต่ละแผนก (Business Units) คลาดเคลื่อนไม่ตรงกันเพราะมาจากแหล่งอ้างอิงต่างกัน เป็นต้น
- การกำหนดเงื่อนไขการทำ Data Cleansing เป็นการสร้างมาตรฐานคุณภาพให้กับข้อมูลแต่การทำ Data Cleansing นั้นไม่สามารถทำได้ทุก Attribute ดังนั้นสถาปนิกข้อมูลจำเป็นต้องทำงานร่วมกับผู้ใช้งานในการกำหนดข้อมูลหลักที่จำเป็นต้องมีคุณภาพ (Critical Data Element: CDE) ว่าข้อมูลใดมีความสำคัญและจำเป็นต้องมีความถูกต้องสูงสุด เพื่อนำไปใช้ในกระบวนการวิเคราะห์ขั้นสูง
- การออกแบบการนำข้อมูลออกไปใช้วิเคราะห์ เป็นอีกหนึ่งขั้นตอนสำคัญในการสร้างสถาปัตยกรรมข้อมูล ซึ่งจะต้องออกแบบให้การเรียกใช้งานข้อมูลใน storage นั้นทำได้อย่างยืดหยุ่นและตอบโจทย์กระบวนการนำข้อมูลไปวิเคราะห์ต่อได้อย่างสะดวกและราบรื่น
การออกแบบ Data Architecture ด้วยมืออาชีพ เพิ่มแต้มต่อพร้อมลดความเสี่ยงให้องค์กร
เมื่อการสร้าง “Data Architecture” ไม่ใช่แค่การวาง Framework ที่มี Best Practice เป็นกรอบการทำงานให้กับองค์กร แต่การออกแบบสถาปัตยกรรมข้อมูลนั้นต้องอาศัยความเข้าใจทั้งด้านธุรกิจและเทคโนโลยี ดังนั้นการเลือกใช้ Vendor ที่มีความเชี่ยวชาญด้านเทคโนโลยีเป็นหลักนั้นอาจตอบโจทย์การออกแบบโมเดลข้อมูลได้ตรงตามความต้องการของแต่ละอุตสาหกรรม ปัญหาที่พบบ่อยในการออกแบบจำลองข้อมูลคือ บาง Attribute ที่จำเป็นต้องมีกลับไม่มีอยู่ใน Common Model นั้นๆ เพราะขาดความรู้ความเข้าใจในธุรกิจขององค์กร ด้วยเหตุนี้ การออกแบบสถาปัตยกรรม ที่สามารถต่อยอดในมุมของ Data Analytics ได้อย่างแท้จริง ลดความเสี่ยงจาก Human Error จนถึงการลดต้นทุนในการดำเนินงานและชั่วโมงการทำงานของพนักงานลงได้นั้น จำเป็นต้องใช้บุคคลากรที่มีประสบการณ์มีความรู้ความเข้าใจในธุรกิจนั้นๆ อย่างถ่องแท้ และมีเชี่ยวชาญด้านเทคโนโลยี เพื่อปิดความเสี่ยงต่างๆ ที่อาจเกิดขึ้น
วินาทีคงไม่มีใครสามารถปฏิเสธได้ว่า “ข้อมูล หรือ Data” เป็นหัวใจสำคัญในการดำเนินธุรกิจ การใช้สัญชาติญาณและประสบการณ์ที่ผ่านมาเหมือนในอดีตอาจกลายเป็นความเสี่ยงต่อการเติบโตขององค์กรในอนาคต โดยเฉพาะในวันที่คู่แข่งสามารถปรับเปลี่ยนเป็นองค์กรที่ขับเคลื่อนด้วยข้อมูลได้อย่างแท้จริง ดังนั้นองค์กรใดที่เริ่มวางรากฐานข้อมูลด้วยการทำ “Data Architecture” อย่างมืออาชีพได้ก่อนนั้น ถือเป็นการสร้างความได้เปรียบในการทำธุรกิจในยุคที่ทุกอย่างหมุนเร็วกว่าที่เคย