ปัญหา IT แก้ไม่หาย มีเครื่องมืออะไรที่จะช่วยควบคุม ลด และแก้ปัญหาได้

ปัญหา หรือ incident ทางด้าน IT หลายครั้งเราแก้ปัญหาแบบชั่วคราว หรือแบบ workaround เช่น การ restart เพื่อให้บริการกลับมาใช้งานได้ปกติ แต่ไม่ได้แก้ที่สาเหตุ ทำให้ปัญหาดังกล่าวกลับมาเกิดขึ้นอีก เราทุกคนต้องการแก้ปัญหาที่สาเหตุ แต่บางครั้งเราตรวจสอบวิเคราะห์แล้วไม่สามารถหาสาเหตุที่แท้จริงได้ หรือทราบสาเหตุแต่ก็แก้ไม่ได้ เนื่องจากต้องรอ patch หรือเวอร์ชั่นใหม่จากผู้ผลิต หรือจากทีมพัฒนาแอพพลิเคชั่น หากเป็นเช่นนั้นแล้วเราจะควบคุม หรือลดผลกระทบได้อย่างไร
แนวทางการควบคุม หรือลดผลกระทบจาก incident ทางด้าน IT ที่ยังไม่สามารถถูกแก้ไขที่ต้นตอได้สามารถใช้แนวทางที่ ITIL 4 ได้กำหนดอยู่ใน Problem Management Practice ซึ่งเป็นแนวปฏิบัติของการลดโอกาสและผลกระทบจาก incident โดยการตรวจสอบวิเคราะห์หาสาเหตุและแก้ไขที่ต้นตอเพื่อไม่ให้เกิดซ้ำขึ้นมาอีก หรือหากแก้ไม่ได้ก็จะต้องทำ error control เพื่อ identify เป็น known error และควบคุม error เพื่อลดโอกาสและผลกระทบจาก error
ITIL 4 Problem Management Practice ประกอบด้วย 3 ขั้นตอนหลักๆ คือ problem identification (ทั้งแบบ proactive และ reactive), problem control และ error control
Problem identification คือการเฝ้าระวัง ตรวจสอบ วิเคราะห์ว่า incident ใดหรือหลาย incident มีโอกาสที่เกิดจากสาเหตุเดียวกัน หรือเป็น incident ที่เกิดซ้ำ จากนั้นเราก็ register problem record ในระบบ ซึ่งบางครั้งเราอาจจะต้องวิเคราะห์ข้อมูลที่ผู้ผลิตหรือทีมพัฒนาแจ้งมา เช่นข้อมูล bug, patch, new release, vulnerabilities ต่างๆ
Problem control คือการสืบสวน วิเคราะห์ problem record ที่เราได้จากขั้นตอน problem identification เพื่อให้ทราบอาการ ผลกระทบ องค์ประกอบ สิ่งแวดล้อมที่ทำให้เกิด incident แนวทางการบรรเทาปัญหา (workaround) ทั้งลดผลกระทบและลดโอกาสการเกิด ผลลัพธ์ที่ได้จาก problem control คือ known error เมื่อเราได้ข้อมูล known error ดังกล่าวแล้ว เราก็จะต้องทำการสื่อสารให้ผู้เกี่ยวข้องทราบ
Error control คือการบริหารจัดการ known error ที่เราได้จากขั้นตอน problem control โดยมีการประเมิน known error ว่ายังถูกต้อง update อยู่เป็นระยะจนกว่าเราจะแก้ปัญหาได้อย่างถาวร นอกจากนั้นแล้วขั้นตอน error control ยังครอบคลุมถึงการหาวิธีการแก้ปัญหาอย่างถาวร ค่าใช้จ่ายงบประมาณที่ต้องใช้ ตลอดจนการเปิด change request เพื่อดำเนินการแก้ปัญหาแบบถาวร
การปฏิบัติตามแนวทาง ITIL 4 Problem Management Practice ที่กล่าวมาเป็นคำตอบของการช่วยควบคุม ลด บรรเทา และแก้ปัญหาทางด้าน IT นั่นเอง
หากท่านใดสนใจเครื่องมือสำหรับ problem management หรือต้องการข้อมูลเพิ่มเติม ก็สามารถติดต่อมาที่ sales@netkasystem.com หรือที่ Line OA: @netkasystem