ڈیٹا ویئر ہاؤسنگ انفارمیشن ٹیکنالوجی کی دنیا میں ایک اہم موضوع ہے۔مختلف لوگوں کا ڈیٹا ویئر ہاؤس کے بارے میں مختلف نظریہ ہے۔ اس تصور کو سب سے بہتر انداز میں Bill Inmon نے بیان کیا ہے۔ ان کے مطابق ’’ڈیٹا ویئر ہاؤس ڈیٹا کا ایک ایسا موضوعاتی، ضم یا پیوستہ، وقت کے حساب سے علیحدہ اورناقابل تبدیل مجموعہ ہے جو کہ منیجمنٹ کو فیصلہ لینے کے عمل میں مدد کرتا ہے‘‘
اب ہم ذرا اس تعریف کو مثال کی مدد سے سمجھتے ہیں۔
موضوعاتی
ڈیٹا ویئر ہاؤس کو کسی مخصوص موضوع کی معلومات کے لیے استعمال کیا جا سکتا ہے۔ مثال کے طور پر ’’Sales‘‘ اس میں سے ایک موضوع ہو سکتا ہے۔
ضم یا پیوستہ
ڈیٹا ویئر ہاؤس ڈیٹا کے مختلف منبعوں (Sources) کو آپس میں ملاتا ہے۔ مثال کے طور پر ایک ڈیٹابیس الف میں پراڈکٹس (مصنوعات) کی شناختی علامت دوسرے ڈیٹا بیس ب سے مختلف ہوسکتی ہے۔ لیکن جب دونوں ڈیٹا بیسس کا ڈیٹا ایک جگہ ضم ہوتا ہے تو دونوں میں موجود پراڈکٹس کو ایک ہی طریقے سے شناخت کیا جاسکتا ہے۔
وقت کے مطابق علیحدہ
ڈیٹا ویئر ہاؤس میں پرانا ڈیٹا بھی رکھا جاتا ہے۔ مثال کے طور پر ایک مہینے، تین مہینے، چھ مہینے، بارہ مہینے یا اس سے بھی پرانا ڈیٹا بھی نکالا جا سکتا ہے یا ٹرانزیکشن سسٹم سے مختلف ہے، کیونکہ ٹرانزیکشن سسٹم میں نیا ڈیٹا رکھا جاتا ہے۔ مثال کے طور پر ٹرانزیکشن سسٹم میںایک کسٹمر کا نیا پتا (Address) محفوظ ہوگا، پرانا نہیں لیکن ڈیٹا ویئر ہاؤس میں کسٹمر کے تمام پتے موجود ہونگے۔ ان میں نیا پتا بھی شامل ہوگا اور تمام پرانے پتے بھی۔
ناقابل تبدیل
جب ڈیٹا ایک دفعہ ڈیٹا ویئر ہاؤس میں آجاتا ہے تو وہ تبدیل نہیں ہو سکتا۔ اس لیے ڈیٹا ویئر ہاؤس میں پرانے ڈیٹا کو کبھی تبدیل نہیں کرنا چاہیے۔
مختلف ڈیٹا ویئر ہاؤس سسٹم کے مختلف ڈھانچے ہوتے ہیں۔ کچھ ODS یعنی آپریشنل ڈیٹا سورس (operational data Source) استعمال کرتے ہیں اور ایک سے زیادہ جگہوں پر جہاں ڈیٹا رکھا ہوتا ہے وہ استعمال کرتے ہیں، اس کو ڈیٹا مارٹس (Data marts) کہا جاتا ہے۔ اس ڈھانچے (Structure) کو دیکھتے ہوئے یہ بہت مناسب رہتا ہے کہ ہم ڈیٹا ویئر کی ساخت وبناوٹ (architecture) میں مختلف تہوں (Layers) کا استعمال کریں۔
عام طور پر ہر ڈیٹا ویئر ہاؤس میں مندرجہ ذیل تہوں کا استعمال ہوتا ہے:
ڈیٹا کی منبع پرت (Data source layer)
یہ مختلف ڈیٹا کہ جگہ کو ظاہر کر رہی ہوتی ہے جہاں سے ڈیٹا ویئر ہاؤس میں ڈیٹا آ رہا ہوتا ہے۔ ڈیٹا کسی بھی قسم کا ہو سکتا ہے سادہ ٹیکسٹ فائل(Raw Data)، ریلیشنل ڈیٹا بیس (relational database)اور مختلف طرح کے ڈیٹا بیسز جیسے کہ مائیکرو سافٹ ایکسل وغیرہ۔ یہ سب ایک ڈیٹا ہاؤس ہو سکتے ہیں۔
بہت سی مختلف جگہوں کا ڈیٹا ایک ڈیٹا سورس کا کام کر سکتا ہے۔ جیسے کہ آپریشن، فروخت (sales) کا ڈیٹا، ہیومن ریسورس کا ڈیٹا، کسی خاص چیز کا ڈیٹا، انوینٹری کا ڈیٹا، مارکیٹنگ کا ڈیٹا، ویب سرور کے لاگز اور یوزر کی براؤزنگ کا ڈیٹا وغیرہ وغیرہ۔ یہ سب ڈیٹا سورس ملا کر ایک ڈیٹا سورس لیئر (layer) بناتی ہیں۔
کشید پرت (Extraction layer)
ڈیٹا کو مختلف جگہوں سے نکال کر ڈیٹا ویئر ہاؤس میں ڈالا جاتا ہے۔ تھوڑی بہت ڈیٹا کی صفائی بھی کی جاتی ہے، مگر ڈیٹا کو تبدیل بالکل نہیں کیا جاتا۔
اسٹجنگ لیئر(Staging Layer)
یہ وہ لیئر ہے جہاں پر ڈیٹا کو ڈیٹا ویئر ہاؤس یا ڈیٹا مارٹ میں ڈالنے اور اُس پر کچھ بھی کرنے سے پہلے رکھا جاتا ہے۔ ایک مشترکہ جگہ ہونے سے ڈیٹا کو ضم(intergrate) کرنے میں آسانی ہوتی ہے۔
ای ٹی ایل لیئر
یہ وہ جگہ ہے جہاں پر ایک عام سے ڈیٹا پر کام کر کے اُس کو intelligent بنایا جاتا ہے اور اسی لیئر میں ڈیٹا کی صفائی بھی کی جاتی ہے اور اسے عام فہم بنایا جاتا ہے تا کہ درکار ڈیٹا بہ آسانی دستیاب ہوسکے۔
ڈیٹا اسٹوریج لیئر
یہ وہ جگہ ہے جہاں پر صاف کیا ہوا اور intelligent ڈیٹا رکھا جاتا ہے۔ ضرورت کے ماتحت تین طرح کی چیزیں یہاں ملتی ہیں ڈیٹا ویئر ہاؤس، ڈیٹا مارٹ اور آپریشنل ڈیٹا سورس۔ مگر ضر وری نہیں کہ سب سسٹم میں تینوں چیزیں ملیں۔
ڈیٹا لوجک لیئر
اسے بزنس لوجک لیئر بھی کہا جاتاہے۔ یہ وہ جگہ ہے جہاں بزنس کے قوانین رکھے جاتے ہیں۔ خیال رہے کہ یہ بزنس کے قوانین جو ڈیٹا پر لاگو کرنے کے لئے رکھے گئے ہیں، اصل ڈیٹا کو تبدیل نہیں کرتے۔ یہ تبدیلیاں صرف رپورٹ پر دکھاتے ہیں۔
ڈیٹا پرزینٹیشن لیئر
یہ جگہ وہ ڈیٹا رکھتی ہے جو استعمال کرنے والوں کو نظر آ رہا ہوتا ہے۔ یہ ڈیٹا ایک ٹیبل کی شکل میں بھی ہو سکتا ہے،ویب برائوزر میں نظر آنے والی ایک گرافیکل رپورٹ بھی ہو سکتی ہے اور خود کار طور پر روزانہ بننے والی فائل بھی جو صارف کو بذریعہ ای میل وصول ہوتی ہو۔
میٹا ڈیٹا لیئر
یہ وہ جگہ ہے جہاں سسٹم میں رکھی ہوئی معلومات کی معلومات (data about data) رکھی جاتی ہے۔ لوجیکل ڈیٹا ماڈل اس چیز کی ایک مثال ہو سکتی ہے۔
سسٹم آپریشن لیئر
سسٹم کے چلنے کے طریقے کار کی معلومات یہاں رکھی ہوتی ہیں۔ جیسے سسٹم کی کارکردگی اور صارفین کا ڈیٹا ویئر ہاؤس استعمال کرنے کی تاریخ وغیرہ وغیرہ۔