Big Data در مقابل انبارهای داده. تفاوت در چیست؟

پیشرفت فناوری با سرعتی انجام می شود که غیرممکن نیست و مدیران پیری فناوری به زودی می فهمند که تمام آن کلاسهای فناوری در مقطع کارشناسی به سرعت منسوخ می شوند. اگر شما یک مدیر ارشد فناوری (CTO) در یک شرکت بزرگ هستید ، وقت زیادی برای آموختن در مورد فن آوری های جدید ندارید ، زیرا بیش از حد مشغول آتش سوزی هستید و مطمئن هستید که در جلسه بعدی هیئت مدیره خوب به نظر می رسید. در مقابل همه افراد دیگر که سعی در انجام همان کارها دارند. در بعضی مواقع ممکن است خودتان سؤال کنید: تفاوت بین داده های بزرگ در مقابل انبارهای داده چیست؟

هر متخصص فن آوری در حال آشنایی با یک بانک اطلاعاتی است. این به سادگی مجموعه ای از داده ها است که به مرور زمان رشد می کند ، و از طریق جستجوی آنها چیزهای جالب را یاد می گیرید. سپس مفهوم انبار داده وجود دارد که همان معنی است که نام دارد. بیایید وارد کل گفتگو "Kimball vs Inmon" نشویم و این مسئله را ساده نگه داریم.

انبار داده تعدادی پایگاه داده متفاوت در یک سازمان است که می تواند با یک کلید مشترک به هم وصل شود. به عنوان مثال ، ممکن است ما با استفاده از یک زمینه منحصر به فرد به نام CUSTOMER_ID ، سوابق را در چندین پایگاه داده متصل کنیم. در اینجا دیتابیس های مختلفی در بخش های مختلف وجود دارد که پرونده هایی در آنها وجود دارد که ممکن است بخواهیم با استفاده از CUSTOMER_ID به آن پیوند بزنیم:

با استفاده از CUSTOMER_ID ، می توانید به راحتی در یک صفحه ، لیستی از تمام فاکتورهایی که پرداخت نشده است ، چاپ کنید و لیستی از 10 درخواست اخیر سرویس که شخص فروش می تواند همراه خود به یک جلسه فروش ببرد. البته ، امروز ما فقط از Salesforce برای همه این موارد استفاده می کنیم ، اما این مثال ساده این ایده را به شما می دهد که چگونه می توانید اتصال به داده های نامتناسب مفید باشد. این مربوط به انبارهای داده است ، به جز اینکه آنها یک قدم جلوتر بروند و از داده های متصل برای تصمیم گیری در سطوح بسیار بالا استفاده کنند. هنگام ساختن یک انبار داده ، معمولاً می دانید به کدام سؤال می پردازید زیرا ممکن است برخی از افراد سطح C بخواهند شاخص های کلیدی عملکرد (KPI) را اندازه گیری کنند. شما فقط به خاطر ساختن آنها نمی توانید انبارهای داده بخرید زیرا این یک کار گران است. حال ، اجازه دهید در مورد "داده های بزرگ" و انبار داده ها صحبت کنیم.

اولین چیزی که ما باید تعریف کنیم عبارت "داده های بزرگ" است که تقریباً خودش را تعریف می کند. شما احتمالاً آماری را که اغلب ذکر شده است ، شنیده اید که 98٪ از کل داده ها در 2 سال گذشته ایجاد شده است. این داده های بزرگ است کلیه مجموعه های عظیم اگزوز داده ها که اکنون تولید می شوند ، می توانند استخراج شوند (داده کاوی را به خاطر بسپارید؟) برای استخراج بینش. در دنیای پیشرفته امروزی ، ممکن است بخواهیم بینشی ایجاد کنیم که نمی دانیم وجود داشته باشد. دونالد رامسفلد هوشمندانه از این موارد به عنوان "ناشناخته های ناشناخته" یاد می کند ، چیزهایی که ما نمی دانیم از آنها نمی دانیم. در دنیای روانشناسی ، از این مفهوم به عنوان پنجره یوهاری یاد می شود. شما می دانید که آن شخص در فروش که از این واقعیت غافل است که وجود خود باعث می شود همه افراد اطراف خود بخواهند پیتر پن را از نزدیکترین طبقه بلند بیرون بکشند؟ این واقعیت که شخص آگاه نیست که چقدر آزار دهنده است - و این واقعیت که افراد اطراف آن شخص دقیقا نمی توانند انگشت خود را بکشند چرا "ناشناخته ای ناشناخته" است در این که هیچ کس نمی داند که چرا Rob در فروش فقط بزرگ است. ، چربی ، خاردار چاقی به هر حال ، حرکت کردن

ارسال شده در 7wData.be.