
بروزرسانی: 20 تیر 1404
بهترین روش ها برای حفظ قابلیت اطمینان سایت دولتی
برای آژانس های ،تی ایالات متحده که در تحول دیجیتال سرمایه گذاری می کنند، ارائه دهندگان خدمات ابری (CSP) نقشی محوری در یکپارچه سازی خطوط دفاعی امنیتی برای حفاظت از داده های حساس دارند. قابلیت اطمینان سایت- رشته ای که برای نظارت و نگهداری محیط های بسیار قابل اعتماد، کارآمد و مقیاس پذیر ایجاد شده است - در رویکرد Salesforce Government Cloud برای حفظ اعتماد سازمان های حیاتی که بیشترین نیاز را دارند، ضروری است.
ایجاد یک چارچوب قابل اعتماد سایت قوی که اتوماسیون و مدیریت ریسک فعال را ادغام می کند، برای مق، با چالش های حفاظت از اطلاعات حساس ،تی کلیدی است. در این وبلاگ، بهترین شیوه های قابلیت اطمینان سایت ،تی را که می تواند به تقویت امنیت، عملکرد و در دسترس بودن عملیات حیاتی در یک محیط پر خطر کمک کند، تشریح خواهیم کرد.
سه رکن اصلی قابلیت اطمینان سایت
قابلیت اطمینان سایت ابری ،تی (GovSR) با سه عملکرد اصلی مشخص می شود: مشاهده پذیری، پاسخ به حادثه، و عملکرد سیستم (شامل تریاژ بحر، و عملکرد تشخیصی). هر یک از این توابع برای GovSR منحصر به فرد است و برای رسیدگی و کاهش تأثیر مشتری با هم کار می کنند.
قابلیت مشاهده
تیم مسئول قابلیت مشاهده اطمینان حاصل می کند که معیارها و نقاط داده من، برای مهندس، که نیاز به تصمیم گیری مبتنی بر داده دارند در دسترس است. مشاهده پذیری بینش هایی درباره نحوه عیب یابی مشکلات و سنجش عملکرد کلی سیستم ارائه می دهد. سیستم های نظارتی معیارها را دریافت می کنند، تیم ها هشدارها را پیکربندی می کنند و داشبوردها این معیارها را تجسم می کنند. این رویکرد پایه ای قوی برای تیم ها برای تریاژ حوادث ایجاد می کند.
واکنش به حادثه
معماری چند مستاجر - که در آن یک پشته نرم افزاری از چندین آژانس و سازمان مشتری مستقل پشتیب، می کند - مزایای مشخصی را برای کاربران فراهم می کند. این مزایا شامل بهبود تجربه کاربر، صرفه جویی در هزینه و بهره وری عملیاتی می شود. با این حال، ممکن است سناریوهایی وجود داشته باشد که در آن فعالیت مشتری می تواند سلامت کلی یک پاد را در مرکز داده مختل کند. اینجاست که واکنش به حادثه برای درک مشکل و انجام اقدامات پیشگیرانه، مستقیماً با تیم های پشتیب، همکاری می کند.
عملکرد سیستم
هنگامی که محیط های ابری به آرامی اجرا می شوند و برنامه ها به سرعت پاسخ می دهند، سیستم ها در بالاترین سطح کارایی خود عمل می کنند. تیم عملکرد سیستم در نقشه برداری و به کارگیری تکنیک های سخت افزاری، مانند برنامه ریزی شده، متخصص است سوئیچ های سایت، برای انطباق با درجات مختلف اختلال خدمات. این امکان انتقال سایت فعال را برای اه، تعمیر و نگهداری فراهم می کند. این تیم همچنین تحقیقات تریاژ و پس از حادثه را برای شناسایی مسائل زیرساختی با هدف افزایش عملکرد و انعطاف پذیری سیستم هدایت می کند.
سیستم مدیریت حوادث چیست؟
مشاهده پذیری، واکنش به حادثه و عملکرد سیستم اجزای جدایی ناپذیری هستند که برای مدیریت موثر حوادث امنیتی با هم پیوند دارند. هنگامی که کاهش عملکرد سیستم شناسایی شد، تیم Incident Response هشدار را دریافت کرده و مشغول به کار می شود.
تیم فراخو، می کند سیستم مدیریت حوادث (IMS)، چارچوبی که به گرفتن داده های من، در حین کار بر روی حل حادثه کمک می کند. این به بازگرداندن زیرساخت به حالت عادی کمک می کند و توانایی تیم قابلیت اطمینان سایت را برای برآورده ، تمام قراردادهای سطح سرویس (SLA) یا ضمانت های عملکرد افزایش می دهد. این چارچوب برای اطمینان از سازگاری نقش ها و مسئولیت ها در مدیریت حادثه استفاده می شود.
نحوه ایجاد یک سیستم مدیریت حوادث
اساس IMS ایجاد یک رکورد حادثه و پل - یک جلسه حل مسئله است که کارشناسان موضوع (SMEs) را برای هماهنگ ، یک استراتژی واکنش به حادثه متحد می کند. در اینجا، تیم مکالمه را برای درک بهتر وضعیت تسهیل می کند، دقیقاً مانند یک کاپیتان آتش نش، که به یک صحنه پاسخ می دهد. هنگامی که آتش شروع می شود، تیم باید منابع من، را جمع آوری کند تا برنامه ای برای خاموش ، شعله ها ایجاد کند. در اینجا مراحلی وجود دارد که باید انجام دهید.

مرحله 1: بررسی و تشخیص تأثیر
تابع عملکرد سیستم اولین بار است که تریاژ و تشخیص اولیه را با استفاده از معیارها و منابع مشاهده پذیری انجام می دهد. بر اساس توصیه آنها، Incident Response بهترین مسیر را برای پا،ازی مشتریان از تأثیرگذاری تعیین می کند. این ممکن است شامل تشویق یک سوئیچ سایت یا راه اندازی مجدد یک گروه از سرورها باشد. گاهی اوقات، حادثه ممکن است پیچیده تر باشد - مثلاً توسط شخص ثالث ایجاد شده است - اما مهم نیست که شدت حادثه چقدر باشد، اولویت اصلی بازگرداندن سلامت زیرساخت در عرض 30 دقیقه یا کمتر است.
مرحله 2: با ذینفعان ارتباط برقرار کنید و به آنها اطلاع دهید
هنگامی که آتش نشانان به تماس پاسخ می دهند، از رادیو برای برقراری ارتباط با تیم خود و سایر پرسنل اورژانس در مورد وضعیت استفاده می کنند. به طور مشابه، Incident Response ارتباطات را پخش می کند تا ذینفعان داخلی را در طول یک حادثه مطلع کند. انجام این کار به اطلاع رهبران و مهندسان از وضعیت کمک می کند، که برخی از آنها ممکن است در پل حادثه نیز سهامداران باشند.
GovSR نمی تواند همه مسائل را به تنهایی حل کند. بلکه به ،وان دروازه بان ارتباط و انطباق برای اطمینان از مستندسازی و حفظ ا،امات جداسازی حادثه عمل می کند.
مرحله 3: تجزیه و تحلیل و حل حادثه
در حالی که بازیابی یک سیستم در سریع ترین زمان ممکن در طول یک حادثه زنده یک اولویت باقی می ماند، درک کاتالیزور حادثه نیز مهم است. تابع GovSR در تجزیه و تحلیل پس از حادثه همکاری می کند، که شامل هدایت یک تجزیه و تحلیل علت اصلی برای درک آنچه اتفاق افتاده و چرا است. برای اطمینان از عملکرد فرآیندها در بالاترین سطح، این تابع معیارها و مشاهدات داخلی را ارزیابی می کند تا نقاط قوت را شناسایی کند، کاستی ها را برطرف کند و گزارش های اقدام اصلاحی را برای رفع شکاف ها تهیه کند. این تحلیل ها برای بهبود مستمر خدمات و پاسخ دهی ضروری هستند.
قابلیت اطمینان سایت امن برای ،ت
GovSR شامل بسیاری از قطعات متحرک برای کاهش حوادث است. با عملیات های حیاتی در خط، یک رویکرد چند جانبه طراحی شده است تا بالاترین سطح امنیت و در دسترس بودن را در هر مرحله یکپارچه کند.
با استفاده از قابلیت مشاهده، پاسخ به حادثه و عملکرد سیستم، چارچوب سیستم مدیریت حادثه می تواند برای اطمینان از مدیریت به موقع و موثر حوادث امنیتی و همچنین بهبود قابلیت اطمینان سایت مورد استفاده قرار گیرد.
بیشتر بد،د:
- در مورد Salesforce بخو،د بهترین شیوه های امنیتی و تعهد به امنیت برای همه مشتریان.
- آیا می خواهید داستان های ،ت ابری بیشتری بخو،د؟ این وبلاگ را بررسی کنید تا ببینید ،ت Cloud چگونه به بخش عمومی کمک می کند تا به انطباق و سطوح بالای عملکرد دست یابد.
مهارت های امنیتی Salesforce خود را با بازی Bug Catcher ارتقا دهید



منبع: https://www.salesforce.com/blog/government-site-reliability/