โครงสร้างข้อมูล

         โครงสร้างข้อมูลมีรูปแบบเป็นลำดับชั้นโดยเริ่มด้วยหน่อยที่เล็กที่สุดคือ บิต (Bit) ไบต์ (Byte) เขตข้อมูล (Field) ระเบียบข้อมูล (Record) และไฟล์ (File) ตามลำดับ

         บิต (Bit) เป็นหน่วยที่เล็กที่สุดของข้อมูลที่จัดเก็บในระบบคอมพิวเตอร์ ประกอบด้วยเลขฐานสองซึ่งมีสถานะเป็น 0 กับ 1

         ไบต์ (Byte) ประกอบด้วยบิตหลาย ๆ บิตมาเรียงต่อกัน เช่น นำ 8 บิตมาเรียงต่อกันเป็น 1 ไบต์ ทำให้สามารถสร้างรหัสแทนข้อมูลเพื่อใช้แทนอักขระ ซึ่งอาจเป็นตัวเลข ตัวอักษร หรือสัญลักษณ์ได้ทั้งหมด 28 ตัว หรือตัวกับ 256 ตัว

          เขตข้อมูล (Field) เป็นการนำข้อมูลหลายอักขระมารวมกันเป็นคำเพื่อให้เกิดความหมาย เช่น ชื่อพนักงาน และเงินเดือนพนักงาน

         ระเบียบข้อมูล (Record) คือ กลุ่มของเขตข้อมูลที่มีความสัมพันธ์ กัน ถูกนำมาไว้รวมกัน เช่นระเบียนข้อมูลของพนักงาน ประกอบด้วยเขตข้อมูล รหัสพนักงาน ชื่อ-นามสกุล เงินเดือน และแผนก

         ไฟล์ (File) คือ กลุ่มของระเบียนข้อมูลที่มีความสัมพันธ์กันถูกนำมาจัดเก็บไว้ด้วยกัน เช่น ไฟล์ประวัติพนักงาน ประกอบด้วยระเบียนข้อมูลของพนักงานทั้งหมดในองค์การ

 

ปัญหาเกี่ยวกับแฟ้มข้อมูล

         • ความซ้ำซ้อนของข้อมูล (Data Redundancy)

         • ความผูกพันระหว่างข้อมูลและโปรแกรม (Program-Data Dependence)

         • การไม่สามารถใช้ข้อมูลร่วมกันได้ (Lack of Data Sharing)

         • การขาดความคล่องตัว (Lack of Flexibility)

         • การขาดระบบรักษาความปลอดภัยที่ดี (Poor Security)

 

แนวทางในการใช้ฐานข้อมูลในการบริหารจัดการข้อมูล

         จากปัญหาของระบบแฟ้มข้อมูลดังกล่าวข้างต้น จึงมีแนวคิดในการจัดการข้อมูลให้มีประสิทธิภาพมากยิ่งขึ้นด้วยการนำเทคโนโลยีฐานข้อมูลมาใช้ในการบริหารจัดการข้อมูล การนำข้อมูลมาเก็บไว้ที่เดียวกันช่วยลดความซ้ำซ้อนของข้อมูลได้

         โดยสรุป ประโยชน์ของระบบจัดการฐานข้อมูล

                • ลดความซ้ำซ้อนของข้อมูล (Minimum Redundancy)

                • มีความเป็นอิสระของข้อมูล (Data Independence)

                • สนับสนุนการใช้ข้อมูลร่วมกัน (Improved Data Sharing)

                • มีความคล่องตัวในการใช้งาน (Improved Flexibility)

                • มีระบบรักษาความปลอดภัยของข้อมูลสูง (High Degree of Data Integrity)

 

องค์ประกอบของระบบฐานข้อมูล

         ระบบฐานข้อมูลประกอบด้วยองค์ประกอบหลัก 4 ส่วนคือ

         ข้อมูล (Data)  หมายถึง ข้อมูลและความสัมพันธ์ของข้อมูลที่จัดเก็บอยู่ในฐานข้อมูล

         าร์ตแวร์ (Hardware)  ได้แก่ เครื่องคอมพิวเตอร์และอุปกรณ์รอบข้าง (Peripherals)

         ซอฟต์แวร์ (Software)  ได้แก่ ระบบปฏิบัติการ (Operating Systems) และระบบจัดการข้อมูล (Database Management System : DBMS) รวมทั้งโปรแกรมยูทิลิตี้ต่าง ๆ

         ผู้ใช้ (Users)  ได้แก่ บุคลากรที่เกี่ยวข้องกับระบบฐานข้อมูล เช่น ผู้บริหารฐานข้อมูล นักวิเคราะห์ระบบ ผู้เขียนโปรแกรมประยุกต์ และผู้ใช้งาน เป็นต้น

 

รูปแบบของฐานข้อมูล (Database Model)

         แบบจำลองฐานข้อมูลอธิบายถึงโครงสร้างและความสัมพันธ์ระหว่างข้อมูล แบบจำลองฐานข้อมูลมีหลายรูปแบบ ในที่นี้จะกล่าวถึงแบบลำดับชั้น แบบเครือข่าย และแบบเชิงสัมพันธ์

แบบจำลองฐานข้อมูลลำดับชั้น (Hierarchical Database Model)

         มีโครงสร้างคล้ายโครงสร้างของต้นไม้ (Tree Structure) ข้อมูลมีความสัมพันธ์กันในลักษณะ One-to-Many ข้อมูลจะได้รับการจัดเก็บในรูปของ Segment โดย Segment ที่อยู่บนสุดเรียกว่า Root Node ถัดลงมาเรียกว่า Child Node 

 
แบบจำลองฐานข้อมูลลำดับชั้น

         ข้อดีคือ เข้าใจง่าย มีความซับซ้อนน้อยและเหมาะกับข้อมูลที่มีการเรียงลำดับอย่างต่อเนื่อง  แต่ไม่สามารถรองรับความสัมพันธ์ของข้อมูลในลักษณธ Many-to-Many และการเข้าถึงข้อมูลจะมีความคล่องตัวน้อย เพราะจะเริ่มจาก Root Segment เสมอ

แบบจำลองฐานข้อมูลเครือข่าย (Network Database Model)

         โครงสร้างของข้อมูลที่นำเสนอเป็นลักษณะ Multi-List Structure โดยมีความสัมพันธ์ของข้อมูลเป็นแบบ Many-to-Many จะต่างจากแบบจำลองฐานข้อมูลลำดับชั้นตรงที่แต่ละ Segment สามารถมี Parent ได้มากกว่าหนึ่ง และจะเรียก Parent ว่า Owner ส่วน Child จะเรียกว่า Member


 
แบบจำลองฐานข้อมูลเครือข่าย
 

         ข้อดีคือ ความซ้ำซ้อนของข้อมูลมีน้อยกว่าแบบจำลองฐานข้อมูลลำดับชั้นและสนับสนุนความสัมพันธ์ของข้อมูลในลักษณะ Many-to-Many ซึ่งสามารถเชื่อมโยงข้อมูลแบบไป-กลับได้ โดยจะใช้พอยน์เตอร์(Pointer) ในการเชื่อมโยงและเข้าถึงข้อมูล แต่จะเปลืองเนื้อที่ในการจัดเก็บพอยน์เตอร์ และมีความยุ่งยากในการเปลี่ยนแปลงโครงสร้างข้อมูลที่มีความซับซ้อน อีกทั้งผู้เขียนต้องเข้าใจในโครงสร้างข้อมูลเป็นอย่างดี

แบบจำลองฐานข้อมูลเชิงสัมพันธ์ (Relational Database Model)

         แบบจำลองฐานข้อมูลเชิงสัมพันธ์แสดงโครงสร้างของข้อมูลในรูปแบบของตารางและจะเรียกตารางว่า รีเลชัน (Relation) โดยแต่ละรีเลชันจะประกอบด้วย แถวหรือทัพเพิล (Tuple) และ คอลัมน์ซึ่งเรียกว่า แอตทริบิวต์ (Attribute) ในแต่ละรีเลชันจะมีแอตทริบิวต์หรือกลุ่มของแอตทริบิวต์ ซึ่งเรียกว่า คีย์ (Key) เป็นตัวบอกถึงความแตกต่างของแต่ละทัพเพิล



แบบจำลองฐานข้อมูลเชิงสัมพันธ์
 
         ข้อดีคือ มีโครงสร้างที่เข้าใจง่าย มีระบบจัดการฐานข้อมูลที่ช่วยให้การจัดการกับข้อมูลทำได้โดยง่าย ใช้งานง่าย และข้อมูลมีความเป็นอิสระจากโปรแกรม แต่จำเป็นต้องใช้ฮาร์ดเวร์แบะซอฟต์แวร์ที่มีความสามารถสูง

 

ระบบฐานข้อมูลแบบกระจาย(Distributed Database)

        บางองค์การอาจมีการกระจายข้อมูลจัดเก็บไว้ที่เครื่องคอมพิวเตอร์หลายเครื่องตามพื้นที่ต่างๆ แทนที่จะเก็บข้อมูลไว้ที่ส่วนกลางเพียงแห่งเดียว  เพื่อความคล่องตัวในการดำเนินงาน โดยจะเรียกระบบการจัดการฐานข้อมูลแบบกระจายว่า Distributed Database Management System หรือ DDBMS โดย DDBMS จะช่วยอำนวยความสะดวกให้แก่ผู้ใช้งานบนฐานข้อมูลแบบกระจายเสมือนว่าเป็นฐานจ้อมูลของตนนั่นเอง  ซึ่งขึ้นอยู่กับคุณสมบัติของ DDBMS ในด้านการมองผ่าน(Transparency) ในระดับใด       

         ข้อดีคือ สามารถเรียกใช้ข้อมูลได้เร็ว และช่วยลดความเสี่ยงจากการเก็บข้อมูลไว้ที่ส่วนกลางเพียงเห่งเดียว แต่จะมีความซับซ้อนในการประมวลเผลเพื่อเรียกใช้ข้อมูล การฟื้นสภาพและการออกแบบฐานข้อมูลมากกว่าระบบฐานข้อมูลแบบรวม  และต้องมีการรักษาความปลอดภัยของข้อมูลที่กระจายอยู่ตามที่ต่างๆ รวมถึงการมีระบบสื่อสารข้อมูลที่มีประสิทธิภาพด้วย

ฐานข้อมูลแบบออบเจ็กต์(Object-Oriented Database)

         เทคโนโลยีฐานข้อมูลแบบออบเจ็กต์ หรือเรียกว่าฐานข้อมูลเชิงวัตถุ  กเกิดจากแนวคิดการเขียนโปรแกรมเชิงวัตถุ(Object-Oriented Program : OOP) เพื่อตอบสนองต่อความต้องการในการจัดเก็บข้อมูลที่มีความสลับซับซ้อน  มีขนาดใหญ่ และมีความหลากหลายมารกกว่าเดิม  เช่น ข้อมูลเสียง รูปภาพ และวิดีทัศน์

         วิธีนี้จะมองข้อมูลที่จัดเก็บในรูปแบบของวัตถุ(Object)  ที่ประกอบด้วย แอตทริบิวต์(Attributes) ซึ่งแสดงคุณสมบัติหรือรายละเอียดของข้อมูลที่สนใจ และเมธอด(Methods) ซึ่งแสดงฟังก์ชันพื้นฐานที่ประมวลผลกับข้อมูลภายในออบเจ็กต์นั้น  โดยกลุ่มของออบเจ็กต์ที่มีคุณสมบัติ(Property) และพฤติกรรม(Behavior) ที่เหมือนกันจะจัดอยู่ในคลาส(Class)เดียวกัน

          ข้อดีคือ สามารถเก็บข้อมูลได้ง่าย แต่การประมวลผลรายการ(Transactions) ข้อมูลทั่วๆไปอาจจะไม่รวดเร็วเท่ากับระบบฐานข้อมูลเชิงสัมพันธ์ จึงมีการพัฒนาโดยการนำเอาข้อดีของระบบฐานข้อมูลเชิงสัมพันธ์มาใช้ร่วมกันข้อเด่นหรือจุดแข็งของระบบฐานข้อมูลแบบออบเจ็กต์ โดยใช้ชื่อว่า Object-Relational Database Management System (ORDBMS)

สรุป 


 

 

คลังข้อมูล (Data Warehouse)

         คลังข้อมูล หรือเรียกว่า ดาต้าแวร์เฮาส์ (Data Warehouse) คือที่เก็บรวบรวมข้อมูลจากหลายแหล่งและหลากหลายชนิดเข้าด้วยกัน เข้าเป็นฐานข้อมูลขนาดใหญ่ขององค์การ โดยข้อมูลในคลังข้อมูลอาจได้มาจากฐานข้อมูลของระบบปฏิบัติการในองค์การ และฐานข้อมูลจากแหล่งภายนอกองค์การ ซึ่งข้อมูลเหล่านี้จะได้รับการเลือก การกลั่นกรอง การปรับแก้ไข และทำให้เป็นมาตรฐานเดียวกัน

ลักษณะของคลังข้อมูล

• การแบ่งโครงสร้างตามเนื้อหา (Subject Oriented)

                คลังข้อมูลถูกออกแบบมาให้มีโครงสร้างตามเนื้อหาหลัก เช่น ตามรายการสินค้า ตามพื้นที่ เป็นต้น

• การรวมเป็นหนึ่งเดียว (Integration)

                ข้อมูลที่รวบรวมมาจากหลากหลายฐานข้อมูลจะถูกทำให้เอยู่ในรูปแบบข้อมูลมาตรฐานเดียวกัน

        • ความสัมพันธ์กับเวลา (Time Variant)

                ข้อมูลที่จัดเก็บในคลังข้อมูลต้องกำหนดช่วงเวลาเอาไว้ เช่น อาจจัดเก็บข้อมูลย้อนหลัง 3 ปี หรือ 5 ปี เนื่องจากในการตัดสินใจจำเป็นต้องใช้ข้อมูลในการเปรียบเทียบในแต่ละช่วงเวลา หรือต้องใช้ข้อมูลในอดีตสำหรับคาดการณ์ในอนาคต

        • ความเสถียรของข้อมูล (Nonvolatile)

                ข้อมูลที่ถูกบันทึกไว้ในคลังข้อมูลจะไม่มีการเปลี่ยนแปลงค่าหรือปรับปรุงข้อมูลเดิมที่มีอยู่แล้ว เนื่องจากเป็นข้อมูลที่ไม่มีการะบวนการทางธุรกิจมากระทบอีก

 

ดาต้ามาร์ท (Data Mart)

         การจัดทำคลังข้อมูลมีค่าใช้จ่ายที่ค่อนข้างสูง จึงเป็นข้อจำกัดในการใช้คลังข้อมูลขององค์การขนาดใหญ่ ทางเลือกที่หลาย ๆ องค์การนิยมนำมาประยุกต์ใช้สำหรับองค์กรขนาดกลาง และขนาดย่อม หรือระดับแผนกต่าง ๆ คือ การจัดทำดาต้ามาร์ท ซึ่งก็คือคลังข้อมูลขนาดเล็กที่มีลักษณะเฉพาะเจาะจงมากกว่าสำหรับใช้ในองค์การธุรกิจ

 

ธุรกิจอัจฉริยะ (Business Intelligence : BI)

         ธุรกิจอัจฉริยะ คือ การใช้ข้อมูลขององค์การที่มีคุณค่ามาช่วยสนับสนุนการตัดสินใจในการดำเนินงานของธุรกิจ ซึ่งโดยทั่วไปจะเกี่ยวข้องกับการเข้าใช้งานข้อมูล การวิเคราะห์ข้อมูล และการค้นพบโอกาสใหม่ ๆ ในการดำเนินการทางธุรกิจ กระบวนการหลัก ๆ ของธุรกิจอัจฉริยะคือ การสนับสนุนการตัดสินใจ การคิวรีการรายงาน การประมวลผลเชิงวิเคราะห์แบบออนไลน์ หรือโอแลป (OLAP) การวิเคราะห์ทางสถิติการพยากรณ์ และการทำดาต้าไมนิ่ง (Data Mining)

 

การวิเคราะห์ข้อมูลหลายมิติและการค้นหาความรู้ในคลังข้อมูล

         เครื่องมือวิเคราะห์ข้อมูลและค้นหาความรู้ในคลังข้อมูลที่จะกล่าวถึงมี 2 ประเภท คือ การประมวลผลเชิงวิเคราะห์แบบออนไลน์ หรือ โอแลป (Online Analytical Processing : OLAP) และดาต้าไมนิ่ง (Data Mining)

 

การประมวลผลเชิงวิเคราะห์แบบออนไลน์ (OLAP)

         การประมวลผลข้อมูลในคลังข้อมูลมักจะเกี่ยวข้องกับข้อมูลปริมาณมาก ๆ และข้อมูลหลายมิติ เช่น ข้อมูลยอดขายตามมิติของสินค้า ตามภูมิภาค และตามเวลา

         OLAP เป็นเครื่องมือที่มีความสามารถในการค้นหาและวิเคราะห์ข้อมูลจากคลังข้อมูลเพื่อตอบสนองความต้องการของผู้ใช้ได้อย่างรวดเร็ว โดยสามารถใช้ OLAP ในการวิเคราะห์ข้อมูลในลักษณะต่าง ๆ เช่น

         • การหมุนมิติ (Rotation)

         • การเลือกช่วยข้อมูล (Ranging)

         • การเลือกระดับชั้นของข้อมูล (Gierarcy)

 

ดาต้าไมนิ่ง (Data Mining)

          ดาต้าไมนิ่ง  เป็นเครื่องมือและเทคนิคในการสกัด(Extract) ข้อมูล  และประมวลผลข้อมูลในเชิงวิเคราะห์ขั้นสูงจากฐานข้อมูลขนาดใหญ่  โดยสามารถค้นหารูปแบบ  แนวโน้ม  พฤติกรรมและความสัมพันธ์ที่ซ่อนอยู่ภายในข้อมูลเพื่อให้ได้ความรู้ใหม่หรือคำตอบในลักษณะสิ่งต่อไปนี้

          - ความสัมพันธ์ที่เกี่ยวข้อง(Association)

          - ลำดับของข้อมูล (Sequence)

          - การหากฎเกณฑ์ในการจัดกลุ่ม(Classification)

          - การจัดกลุ่มของความคล้ายคลึง(Cluster)

          - การพยากรณ์(Forecasting)

 

edit @ 17 Jan 2009 01:07:51 by Zigmagirl

edit @ 17 Jan 2009 01:09:02 by Zigmagirl

edit @ 20 Jan 2009 14:39:10 by Zigmagirl

edit @ 21 Jan 2009 00:49:31 by Zigmagirl

edit @ 26 Jan 2009 22:48:18 by Zigmagirl

Comment

Comment:

Tweet