بیگ دیتا به معنی دارایی های اطلاعاتی است که حجم زیادی دارند، با سرعت زیاد تولید می شوند و تنوع گسترده ای دارند و نیازمند روش های پردازش نوآورانه با هزینه ای مناسب هستند تا بتوان از آن برای اتوماسیون فرایندها، تصمیم گیری و بهبود بینش در شرکت بهره گرفت.
در تعریف های کلان داده، سه اصطلاح حجم (Volume) و سرعت (Velocity) و تنوع (Variety) را می بینید. به طوریکه که گاهی برای تعریف بیگ دیتا از اصطلاح ۳V استفاده میکنند.
حجم داده
حجم داده هایی که در حال حاضر در سطح جهانی وجود دارد عملاً غیرقابل درک است. با ظهور فناوریها، شبکه های اجتماعی و دستگاههای جدید این روند صعودی ادامه خواهد داشت و احتمالاً حجم داده ها به طور مداوم افزایش مییابد. طبق تصویر بالا، دادهها در واحدهایی مانند کیلوبایت، مگابایت، گیگابایت، ترابایت و پتابایت تعیین میشوند.
سرعت داده
منظور از این ویژگی، سرعت پردازش دادهها است. دادهها با سرعتی بیسابقه تولید می شوند به طوریکه گاهی باید به موقع و به لحظه پردازش شوند. در اینجا تفاوت بین پردازش فوری و به لحظه، پردازش غیرفوری، روزانه و دوره ای آورده شده است:
پردازش به لحظه: زمانی که نیاز به پردازش فوری داده ها دارید.
پردازش غیر فوری: وقتی سرعت پردازش مهم است، اما شما فوراً به آن نیاز ندارید.
پزدازش روزانه: زمانی که می توانید روزها (یا بیشتر) برای پردازش صبر کنید.
تنوع داده
ویژگی تنوع به وجود انواع مختلف بیگ دیتا اشاره دارد. در چنین شرایطی لازم است با سازماندهی مناسب، انواع مختلف دادهها مدیریت شوند. شامل صدا، تصویر، پیامک، ایمیل، متن، فیلم و… است. برخی ساختاریافته و برخی غیرساخت یافته اند.