راهکارهای امنیت کلان داده

امنیت کلان داده یا Big Data ، به دلیل تنوع بسیار آن ، در سازمانها از دو نظر داده های شرکتی و داده های مشتری بررسی می شود. سازمان‌ها باید از امنیت داده‌های کسب‌وکار آگاه باشند، زیرا از دست دادن داده‌های اختصاصی و محرمانه برابر است با افشای نقاط ضعف شما در برابر رقبا و دادن مزیت رقابتی به آنها .

در کنار داده‌های شرکتی، شرکت‌ها داده‌های حساس مشتریان خود را نیز حفظ می‌کنند. در صورتی که این اطلاعات به دست عوامل مخرب بیفتد، چه بسا اتفاقات بحرانی زیادی رخ خوهد داد .

نشت داده‌های کاربران می تواند پیامدهای عمده‌ای برای شرکت SaaS از نظر هزینه غرامت و از دست دادن مشتریان به رقبایی که خدمات مشابه اما با سطوح امنیتی بالاتر را ارائه می‌دهند، داشته باشد. بزرگترین نقض اطلاعات ثبت شده ایالات متحده در بخش مراقبت های بهداشتی در سال 2015 در Anthem Inc یک ارائه دهنده بیمه سلامت در ایالات متحده بود که هکرهای جنایتکار اطلاعات حساسی را که 80 میلیون نفر را تحت تاثیر قرار می داد، سرقت کردند. پس از دو سال دعوای قضایی، Anthem 150 میلیون دلار برای حل و فصل دعاوی مربوط به این حادثه پرداخت کرد.

با توجه به تنوع ساختار و قالب داده ها، محل ذخیره سازی، منبع اصلی ، نوع دستگاه و غیره، از چه راه حل های امنیتی می توانید برای محافظت از کسب و کار و داده های مشتریان خود استفاده کنید؟ در ادامه برخی مشکلات رایج امنیت داده و راه حل های آنها به طور خلاصه آمده است.

برخی مشکلات رایج امنیت داده و راه حل های آنها

ناامنی محیط شبکه :

هنگامی که اطلاعات وارد شبکه یک شرکت می شود، این اطلاعات از طرق مختلف بررسی امنیتی می شوند. اما اگر سیستم شما نتواند داده‌های بالقوه مخرب را از بین داده‌های ورودی جدا کند، در آینده آسیب های زیادی به زیرساخت وارد شده و خسارت بسیار به سازمان وارد خواهد شد.



حملات سایبری به طور مداوم در حال توسعه و پیچیده تر شدن هستند، بنابراین سازمان ها باید در مدیریت امنیت کلان داده  تجدید نظر و راه حل های معماری اعتماد صفر را اتخاذ کنند. با درنظر گرفتن یک محیط و رویکرد مبتنی بر هویت دیجیتال پویا که در آن هر کاربر یا دستگاه، برنامه یا سیستم، خارج و داخل شبکه، به طور پیش فرض به عنوان غیرقابل اعتماد طبقه بندی می شود. در این حالت، منابع سازمان‌ها بدون در نظر گرفتن موقعیت مکانی آنها ایمن می‌شوند، زیرا کنترل دسترسی شبکه از محیط به هر دستگاه و کاربر منتقل می‌شود و شبکه به بخش‌های خرد تقسیم می‌شود تا حمله هکرها را سخت‌تر کند.

حملات مهندسی اجتماعی :

یک نمونه کلاسیک از مهندسی اجتماعی به عنوان فیشینگ شناخته می شود. فیشینگ زمانی رخ می دهد که مهاجمان پیام‌هایی را برای شما ارسال می‌کنند که به نظر می‌رسد از یک منبع شناخته شده و قابل اعتماد هستند، اما در واقع، مخرب هستند. اگر کارمند شما ناآگاهانه روی یک لینک غیرقابل اعتماد کلیک کند، هکرها می توانند به شبکه شرکت دسترسی پیدا کنند.

برای جلوگیری از ایمیل‌های کلاهبرداری که ممکن است حاوی هرزنامه، بدافزار یا تلاش‌های فیشینگ باشند، فایروال پیاده‌سازی کنید. دروازه های امن فایروال به دلیل عملکردهای آنتی ویروس، ضد اسپم و ضد فیشینگ برای شناسایی ایمیل های بد مفید هستند.



اما اگر پیوند مخرب در ایمیل نباشد بلکه در یک فایل PDF پیوست شده باشد چه؟ به این ترتیب، فایروالها ایمیل مشکوک را شناسایی و آن را قرنطینه نمی‌کنند. برای رویارویی با مشکلات و تهدیدات امنیتی فعلی داده ها، از ویژگی های اضافی که فایروال ها می توانند در اختیار شما قرار دهند، مانند سندباکسینگ بهره ببرید. در این صورت یک کپی ایمن ایزوله از محیط واقعی شما که در آن می توانید نامه های بالقوه مخرب را بدون تأثیرگذاری بر سیستم یا پلتفرمی که روی آن اجرا می شود باز کنید، خواهید داشت.

مشکلات پاکسازی داده ها :

Big Data به مزایای امیدوارکننده ای مانند بهبود تصمیم گیری معروف است، اما برای به دست آوردن داده های ارزشمند، ابتدا باید گندم را از کاه جدا کنید و با داده های کثیف و نامرتب مقابله کنید. در غیر این صورت، در یک چرخه معیوب از داده های ضعیف و یک تله زباله در زباله گیر خواهید کرد.

بنابراین یک فرآیند پاکسازی خودکار داده‌ها وارد میدان جنگ می‌شود تا داده‌های صحیح، کامل و با فرمت مناسب را از میان انبوهی از دادهها به شما ارائه دهد. اما اگر آن ابزارها به درستی پیکربندی نشده باشند، پاکسازی داده ها منجر به داده های متناقض می شود و نگرانی های امنیتی تجزیه و تحلیل داده های بزرگ به جایی نمی رسد. یک الگوریتم ممکن است در مرحله طبقه‌بندی داده‌ها شکست بخورد و یا ممکن است داده‌های حساس را عادی تعریف کند و آن را با طیف وسیعی از افراد به اشتراک بگذارد.

معیارهای پوشش داده های ناقص :

سازمان‌ها سیاست‌های ماسکینگ داده‌ها یا داده پوشانی را اتخاذ می‌کنند تا داده‌هایی را که مشتریان را شناسایی می‌کند مانند ویژگی‌های انحصاری یک فرد که شامل تاریخ تولد، نام، سن و … می باشد را از اطلاعات محرمانه مربوط به آن‌ها که اغلب شامل داده‌هایی که به مشتری مرتبط ، اما قابل تغییر هستند متمایز می‌کنند. مانند آدرس منزل، شماره گواهینامه رانندگی، شماره حساب بانکی.

هدف از داده پوشانی پیشگیری از خطرات امنیتی کلان داده از طریق متوقف کردن مجرمان سایبری در تطبیق مشتریان با اطلاعات حساس آنها است. اگر داده پوشانی به اشتباه انجام شود، می تواند توسط هکرها معکوس شود.

یک راه حل کلیدی برای ایمن سازی کلان داده ها، رمزگذاری داده ها است. اما اجرای موثر آن زمان می‌برد. بنابراین چگونه می‌توان سرعت پردازش داده‌ها را افزایش داد (از آنجایی که سرعت پردازش داده یکی از پنج هسته اصلی داده‌های بزرگ به همراه تنوع، حجم، ارزش و صحت است). از این تکنیک های رمزگذاری داده ها در آخرین مرحله پردازش داده ها برای اطمینان از امنیت داده های بزرگ استفاده کنید.

  • Data scrambling از تکنیک‌های رایج داده‌پوشانی می باشد .در این تکنیک کاراکترهای داده ورودی به طور تصادفی سازماندهی مجدد شده و در ذخیره سازی داده جایگزین می شوند.
  • Data substitution یا تکنیک جایگزینی داده ها ، داده‌های جعلی جایگزین اطلاعات واقعی می‌شوند، می‌توانید به جای نام‌های واقعی مشتریان از نام‌های تصادفی از دفترچه تلفن استفاده کنید.

در هر دو مورد، داده های اصلی هنوز در انبار یا دریاچه داده شما موجود است. شما از اطلاعات جایگزین یا درهم برای تصمیم‌گیری استفاده می‌کنید، زیرا نمی‌توانید از داده‌های حساس برای آن مقاصد طبق مقررات حفاظت از داده‌ها از جمله GDPR و D-DPA استفاده کنید.

علاوه بر این، برای اینکه تلاش‌های امنیتی شما از بین نرود، مطمئن شوید که کنترل‌های دسترسی را به گونه‌ای تنظیم کنید که تنظیمات الگوریتم داده پوشانی خاص فقط برای دارندگان داده در بخش‌های مربوطه در دسترس باشد و نه هیچ‌کس دیگری.

تولید داده های جعلی :

حملات جرایم سایبری می‌تواند منجر به نمایش دادههای غیرواقعی در داشبورد شود. همانطور که در مورد آمازون اتفاق افتاد، زمانی که الگوریتم‌های سایت با بررسی‌های محصولات جعلی دستکاری شدند و به طور مصنوعی محصولات و فروشندگان خاصی را بیش از حد ارزیابی می‌کردند. اگر نتوانید تصویر واقعی را ببینید، در نهایت بینش های اشتباهی دریافت خواهید کرد و تصمیمات ناقصی می گیرید که می تواند منجر به مشکلات امنیتی کلان داده شود.

داده‌های قدیمی نیز می توانند جعلی شوند و بر فرآیند تصمیم‌گیری و در نتیجه بر عملیات تجاری شما تأثیر منفی بگذارند. نمونه ای از تاثیر منفی دادههای قدیمی ، خطوط هوایی یونایتد بود .آنها سالانه یک میلیارد دلار از دست دادند زیرا یک مدل قیمت گذاری نادرست ، مبتنی بر ترجیحات صندلی مسافران مربوط به 10 سال قبل را استفاده می کردند.

اگر نتوانید داده های جعلی یا قدیمی را در مخزن مرکزی خود شناسایی کنید، توانایی شما برای ایمن سازی داده ها و محافظت از داده های مشتری و شرکت کاهش می یابد. از مدل های یادگیری ماشین (ML) برای یافتن ناهنجاری ها در داده های خود استفاده کنید و رویکرد تشخیص تقلب را اعمال کنید. سیستم‌های تشخیص کلاهبرداری مبتنی بر ML می‌توانند نرخ دقت تشخیص را تا 90% بهبود بخشند و زمان بررسی تقلب را تا 70% کاهش دهند.

تغییرات غیرمجاز در ابرداده :

با در نظر گرفتن حجم عظیم Big Data، تغییرات غیرمجاز متادیتا ، مدیریت تغییرات در «داده‌های مربوط به سایر داده‌ها» و شناسایی اطلاعات مربوطه پس از آن را چالش‌برانگیز می‌کند، زیرا مطمئناً نمی‌دانید کدام تغییرات قابل اعتماد هستند.

برای حذف دسترسی غیرمجاز و پیامدهای ناخوشایند آن، مانند مجموعه داده های اشتباه و منابع داده غیرقابل ردیابی:

  • اجرای کنترل دسترسی کاربر و فرآیندهای مجوز اجباری برای کارمندان
  • استفاده از nulling out (جایگزینی داده های حساسِ با ارزشِ تهی تا در محیط های آزمایشی یا برنامه نویسی قابل استفاده باشد.) برای کاربران غیرمجاز

از آنجایی که حتی اطلاعات حساس اولیه مانند نام نویسنده سند، تاریخچه ویرایش و نوع نرم‌افزار در دستان اشتباه می تواند منجر به نقض احتمالی داده‌ها شود. بنابراین بهتر است از یک اقدام دیگر برای ایمن‌سازی ابرداده‌های خود استفاده کنید . پاک‌سازی. این فرآیند حذف داده های حساس از سند است. پس از پاکسازی، فایل ممکن است برای مخاطبان گسترده تری توزیع شود.

اگر با کپی کردن فایل قبلی، پیشنهادی را برای مشتری آماده کنید، تغییرات غیرمجاز در متادیتا نیز می‌تواند امنیت داده‌ها را به خطر بیندازد و اوضاع را ناخوشایند کند. اگر سند از طریق پاکسازی نرود، مشتری فرضی شما به تاریخچه تغییرات دسترسی خواهد داشت و اصلاحات بودجه اصلی یا محدوده کار مشتری قبلی شما را پیدا می کند.

بنابراین، اهمیت این فعالیت را دست کم نگیرید. از ابزارهای پاکسازی خودکار داده ها استفاده کنید تا اطمینان حاصل کنید که فقط می توان به اطلاعات مورد نظر دسترسی داشت.

بی احتیاطی کارمندان :

فردی در بخش فناوری هشدارهای امنیتی را نادیده گرفته بود که منجر به افشای اطلاعات حساس نزدیک به 146 میلیون آمریکایی شد.

گاهی اوقات هکرها و سایر تهدیدات امنیتی خارجی در رتبه دوم پس از خطاهای انسانی از نظر آسیب وارد شده به شرکت قرار می گیرند. یک مطالعه CNBC بیان می کند که گم شدن تصادفی یک سند یا یک دستگاه توسط یک کارمند دلیل 47٪ از نقض اطلاعات در سازمان ها است. سطح سهل انگاری تصادفی کارکنان نیز همراه با افزایش تعداد دستگاه هایی که به داده های حساس شرکت و مشتریان دسترسی دارند، افزایش می یابد. اگر کارکنان شما بتوانند به داده‌ها از دستگاه‌های شخصی و از طریق شبکه‌های ناامن دسترسی داشته باشند، اشتراک‌گذاری فایل با طرف‌های غیرمجاز، به‌طور تصادفی یا بدخواه، به آسانی انگشتان دستتان است.

جنبه‌های فنی راه‌حل که به شما کمک می‌کند نقض‌های امنیتی را به موقع شناسایی کنید و امنیت داده‌های بزرگ را تضمین کنید، شامل اجرای احراز هویت چندلایه و رویکرد تشخیص تهدید داخلی برای دریافت اعلان‌ها درباره تهدیدات امنیتی توسط کارکنان است. در مورد بخش «افراد»، فضایی ایجاد کنید که در آن کارکنان احساس امنیت کنند تا درباره یک دستگاه گم شده یا دزدیده شده گزارش دهند و بلافاصله این کار را انجام دهند.