کلان داده یا BIG DATA چیست؟

BIG DATA چیست ؟

مقدمه ، انواع ، ویژگیها و مثالها

قبل از اینکه به معرفی کلان داده بپردازیم ، ابتدا باید بدانید:

دیتا چیست؟

مقادیر ، کاراکترها یا نمادهایی که عملیات توسط آنها توسط رایانه انجام می شود ، که ممکن است در قالب سیگنال های الکتریکی ذخیره و منتقل شده و در رسانه های ضبط مغناطیسی ، نوری یا مکانیکی ثبت شوند.

اکنون ، بیایید مقدمه Big Data را بیاموزیم

بیگ دیتا چیست؟

کلان داده مجموعه ای از داده ها است که حجم زیادی دارد ، اما با گذشت زمان به طور تصاعدی در حال رشد است. این داده با اندازه و پیچیدگی بسیار زیاد است و هیچ یک از ابزارهای سنتی مدیریت داده نمی توانند آن را ذخیره یا پردازش مثر کنند. کلان داده نیز یک داده است اما دارای حجم عظیمی است.

در این مقاله ، یاد می گیرید ،

  • دیتا چیست؟
  • بیگ دیتا چیست؟
  • نمونه هایی از داده های بزرگ
  • انواع داده های بزرگ
  • ویژگی های کلان داده
  • مزایای پردازش داده های بزرگ

بیگ دیتا چیست؟

نمونه هایی از داده های بزرگ

در زیر برخی از نمونه های داده های بزرگ آمده است-

بورس اوراق بهادار نیویورک نمونه ای از Big Data است که روزانه حدود یک ترابایت داده تجاری جدید تولید می کند.

 

رسانه های اجتماعی

این آمار نشان می دهد که روزانه بیش از 500 ترابایت اطلاعات جدید در پایگاه های داده شبکه اجتماعی فیس بوک وارد می شود. این داده ها عمدتا از نظر بارگذاری عکس و فیلم ، تبادل پیام ، ارسال نظر و غیره ایجاد می شود.

یک موتور جت می تواند در 30 دقیقه پرواز 10+ ترابایت داده تولید کند. با هزاران پرواز در روز ، تولید داده ها به تعداد زیادی پتابایت می رسد.

انواع داده های بزرگ

در زیر انواع کلان داده آمده است:

  1. ساختار یافته
  2. بدون ساختار
  3. نیمه ساختار یافته

ساختار یافته

هرگونه داده ای که می تواند در قالب ثابت ذخیره ، دسترسی و پردازش شود ، داده ای “ساختار یافته” نامیده می شود. با گذشت زمان ، استعداد در علوم رایانه در توسعه تکنیک های کار با چنین داده هایی (که فرمت از قبل به خوبی شناخته شده است) و همچنین استخراج ارزش از آن ، به موفقیت های بیشتری دست یافته است. با این حال ، امروزه ، ما در حال پیش بینی مسائلی هستیم که حجم چنین داده هایی تا حد زیادی افزایش می یابد ، اندازه های معمولی در حال خشم چند زتابایت هستند.

 1021 بایت برابر با 1 زتابایت یا یک میلیارد ترابایت یک زتابایت تشکیل می دهد.

با نگاهی به این ارقام می توان به راحتی علت نامگذاری داده های بزرگ را درک کرد و چالش های مربوط به ذخیره و پردازش آن را تصور کرد.

داده های ذخیره شده در یک سیستم مدیریت پایگاه داده رابطه ای ، نمونه ای از داده های “ساختار یافته” است.

 

برای مطالعه مقاله متاورس و کسب اطلاعات درموردآن از اینجا وارد شوید .

متاورس در کشاورزی

نمونه هایی از داده های ساختار یافته

جدول “Employee” در پایگاه داده نمونه ای از Structured Data است

بدون ساختار

هرگونه داده با فرم یا ساختار ناشناخته به عنوان داده های بدون ساختار طبقه بندی می شود. علاوه بر حجم عظیم ، داده های بدون ساختار از نظر پردازش برای استخراج ارزش از آن ، چالش های متعددی را ایجاد می کند. یک مثال معمولی از داده های بدون ساختار ، یک منبع داده ناهمگن است که شامل ترکیبی از فایل های متنی ساده ، تصاویر ، فیلم ها و غیره است. امروزه سازمان های زیادی اطلاعات زیادی در اختیار دارند اما متأسفانه ، آنها نمی دانند چگونه از آن ارزش بگیرند. این داده ها به صورت خام یا بدون ساختار هستند.

نمونه هایی از داده های بدون ساختار

خروجی توسط “جستجوی Google” بازگردانده می شود

نیمه ساختار یافته

داده های نیمه ساختار یافته می توانند شامل هر دو نوع داده باشند. ما می توانیم داده های نیمه ساختار یافته را به صورت ساختار یافته مشاهده کنیم اما در واقع با مثال تعریف نشده است. تعریف جدول در DBMS رابطه ای نمونه ای از داده های نیمه ساختار یافته داده ای است که در یک فایل XML نشان داده شده است.

برای کسب اطلاعات درمورد مقاله هوش مصنوعی چیست از این جا وارد شوید . 

هوش مصنوعی چیست؟

نمونه هایی از داده های نیمه ساختار یافته

اطلاعات شخصی ذخیره شده در یک فایل XML-

<rec><name>Prashant Rao</name><sex>Male</sex><age>35</age></rec>

<rec><name>Seema R.</name><sex>Female</sex><age>41</age></rec>

<rec><name>Satish Mane</name><sex>Male</sex><age>29</age></rec>

<rec><name>Subrato Roy</name><sex>Male</sex><age>26</age></rec>

<rec><name>Jeremiah J.</name><sex>Male</sex><age>35</age></rec>

رشد داده ها طی یکسال

لطفاً توجه داشته باشید که داده های برنامه وب ، بدون ساختار ، شامل فایل های log ، پرونده های سابقه تراکنش ها و غیره است.

ویژگی های کلان داده

داده های بزرگ را می توان با ویژگی های زیر توصیف کرد:

  • حجم Volume
  • تنوع Variety
  • سرعت Velocity
  • تنوع Variability

(I) حجم

نام Big Data خود مربوط به اندازه ای است که بسیار زیاد است. حجم داده ها نقش بسیار مهمی در تعیین ارزش داده ها دارد. همچنین اینکه آیا می توان یک داده خاص را به عنوان یک داده بزرگ در نظر گرفت یا نه ، بستگی به حجم داده دارد. بنابراین ، “حجم” یکی از ویژگی هایی است که هنگام برخورد با راه حل های داده بزرگ باید مورد توجه قرار گیرد.

(II) تنوع

جنبه بعدی Big Data تنوع آن است.تنوع به منابع ناهمگن و ماهیت داده ها ، ساختار یافته و بدون ساختار اشاره دارد. در روزهای گذشته ، صفحات گسترده و پایگاه های داده تنها منابع داده ای بودند که اکثر برنامه ها در نظر گرفته بودند. امروزه داده هایی به شکل ایمیل ، عکس ، فیلم ، دستگاه های نظارت ، PDF ، صوت و غیره نیز در برنامه های تجزیه و تحلیل مورد توجه قرار می گیرند. این تنوع داده های بدون ساختار مسائل خاصی را برای ذخیره ، استخراج و تجزیه و تحلیل داده ها ایجاد می کند.

(III) سرعت

اصطلاح “سرعت” به سرعت تولید داده ها اشاره دارد. سرعت تولید و پردازش داده ها برای برآوردن خواسته ها ، پتانسیل واقعی را در داده ها تعیین می کند.

Big Data Velocity با سرعتی که داده ها از منابعی مانند فرایندهای تجاری ، گزارش برنامه ها ، شبکه ها و سایتهای رسانه های اجتماعی ، سنسورها ، دستگاه های تلفن همراه و غیره وارد می شود سرایت می کند. جریان داده ها عظیم و پیوسته است.

(iv) متغیر بودن – این به ناسازگاری اشاره می کند که می توان داده ها را در مواقعی نشان داد ، بنابراین روند مدیریت و مدیریت موثر داده ها را مختل می کند.

مزایای پردازش داده های بزرگ

توانایی پردازش داده های بزرگ در DBMS مزایای متعددی را به همراه دارد ، مانند:

  • مشاغل می توانند هنگام تصمیم گیری از هوش بیرونی استفاده کنند

دسترسی به داده های اجتماعی از موتورهای جستجو و سایت هایی مانند فیس بوک ، توییتر ، سازمان ها را قادر می سازد تا استراتژی های تجاری خود را دقیق تنظیم کنند.

بهبود خدمات به مشتریان

سیستم های بازخورد سنتی مشتریان جایگزین سیستم های جدیدی می شوند که با فناوری های Big Data طراحی شده اند. در این سیستم های جدید ، از داده های بزرگ و فناوری های پردازش زبان طبیعی برای خواندن و ارزیابی پاسخ های مصرف کننده استفاده می شود.

  • شناسایی زودهنگام خطر برای محصول/خدمات ، در صورت وجود
  • بهره وری عملیاتی بهتر

از فناوری های کلان داده می توان برای ایجاد منطقه یا منطقه فرود برای داده های جدید قبل از شناسایی اینکه چه داده هایی باید به انبار داده منتقل شوند ، استفاده کرد. علاوه بر این ، چنین ادغامی از فناوری های کلان داده و انبار داده ها به سازمان کمک می کند تا داده های نادر دسترسی را بارگیری کند.

برای مطالعه و کسب اطلاعات درمورد مقاله اینترنت اشیاء چیست؟(iot) از اینجا وارد شوید .

اینترنت اشیاء (IoT) چیست؟

جمع بندی

  • تعریف کلان داده: کلان داده به معنای داده ای است که حجم زیادی دارد. بیگ دیتا اصطلاحی است که برای توصیف مجموعه ای از داده ها استفاده می شود که حجم زیادی دارند و با گذشت زمان به طور تصاعدی در حال رشد هستند.
  • مثالهای تجزیه و تحلیل داده های بزرگ شامل بورس سهام ، سایتهای رسانه های اجتماعی ، موتورهای جت و غیره است.
  • کلان داده می تواند 1) ساختار یافته ، 2) بدون ساختار ، 3) نیمه ساختار یافته باشد
  • حجم ، تنوع ، سرعت و تغییر چند ویژگی بزرگ داده نیست
  • بهبود خدمات به مشتریان ، بهره وری عملیاتی بهتر ، تصمیم گیری بهتر از مزایای بیگ دیتا است .

 

محصولات شرکت دانش بنیان پرتوتاپ رایان

برای دریافت اطلاعات بیشتر وارد شوید و فرم های زیر را تکمیل بفرمایید

مشاوره

ورود بیشتر بدانید

آموزش

ورود بیشتر بدانید

اشتراک گذاری / مقالات دیگر