Sobald Ihre Organisation konsistent Bereitschaftsüberprüfungen durchführt, können diese Daten verwendet werden, um Serviceüberprüfungen auf Abteilungs- oder Abteilungsebene durchzuführen. Diese Überprüfungen bieten dem Management die Möglichkeit, Trends zu erkennen und notwendige Kurskorrekturen vorzunehmen, bevor die negativen Auswirkungen breiter und potenziell schädlicher werden.
Der Zweck dieser Überprüfung besteht darin, zu verstehen, welche technischen Dienstleistungen sich auf das Geschäft auswirken. Ziel ist es, nicht nur zu verstehen, woher die Auswirkungen kommen, sondern auch Art und Umfang der Auswirkungen auf das Unternehmen. Mit diesem Wissen kann sich das Management dann auf Investitionen in die Zuverlässigkeit des technischen Dienstes und Prozessverbesserungen konzentrieren, die zu besseren Geschäftsergebnissen führen.
Trittfrequenz #
Im Gegensatz zu Bereitschaftsüberprüfungen gibt es kein typisches Kalenderereignis, das eine logische Gelegenheit für ein Serviceüberprüfungsmeeting bietet. Die meisten Organisationen führen Service-Reviews jedoch monatlich durch.
Ein monatlicher Rhythmus lässt genügend Zeit, um Änderungen oder Verbesserungen an Prozessen und Werkzeugen, die in früheren Besprechungen identifiziert wurden, umzusetzen und quantifizierbar wirksam zu werden. Diese Trittfrequenz bietet auch die Möglichkeit, Anpassungen vorzunehmen, bevor die Probleme zu schwerwiegend werden, und respektiert dennoch die Zeitinvestition aller Beteiligten.
Geltungsbereich #
Serviceprüfungen sollten für ganze Abteilungen oder Abteilungen durchgeführt werden. Für eine große Organisation kann dies eine Serviceüberprüfung für alle Teams bedeuten, die für ein bestimmtes Produkt oder eine bestimmte Branche verantwortlich sind. Für mittelständische Unternehmen könnte dies eine Überprüfung für den Bereich Product Engineering, eine weitere für die IT-Abteilung und eine dritte für den Bereich Operations bedeuten. Für kleinere Unternehmen kann eine einzelne Überprüfung alle Teams in der Organisation abdecken, die an der Entwicklung und Bereitstellung digitaler Produkte beteiligt sind. Unabhängig von der Größe Ihrer Organisation sollte der Umfang der Serviceprüfungen den Betrieb von Services abdecken, die mehreren Teams gehören.
Die Metriken und Diskussionen in der Besprechung sollten alle technischen Dienste umfassen, die Teams gehören, die sich der Gruppe (oder Abteilung oder Abteilung) anschließen, die die Besprechung durchführt. Wenn nachgelagerte Abhängigkeiten von den Diensten bestehen, die den betreffenden Teams gehören, sollten diese Dienste ebenfalls Teil dieses Meetings sein.
Ähnlich wie bei Bereitschaftsüberprüfungen sollte jede Serviceüberprüfung den Zeitraum seit der letzten Besprechung abdecken (idealerweise einen Monat).
Besprechungseigentümer und Teilnehmer #
Diese Besprechung wird in der Regel von einem Abteilungs- oder Bereichsleiter organisiert und geleitet, normalerweise einem Direktor oder Vizepräsidenten für Technik, IT oder Betrieb. Die Teilnahme an diesem Treffen auf der Ebene der Geschäftsleitung gewährleistet nicht nur die Teilnahme, sondern bietet auch die Verpflichtung der Geschäftsleitung, Maßnahmen zu ergreifen und Änderungen der Investitionen in den Service-Betrieb umzusetzen.
Bei kleinen und mittleren Organisationen wird das Review Meeting von den Abteilungs-/Bereichsleitern selbst einberufen, eingerichtet und geleitet. Sie werden in der Regel von Datenanalysten, Programmmanagern oder Verwaltungsassistenten unterstützt, die für ihre Projekte relevant sind. Bei größeren Organisationen kann die Serviceüberprüfung vom Büro des CIO oder vom Büro des CTO gesponsert werden, wobei Programmmanager aus diesen Büros diese Überprüfungen mit jeder Abteilung oder Abteilung durchführen oder unterstützen.
An der Besprechung sollten alle funktionalen Leiter und / oder direkten Berichte des Abteilungs-, Abteilungs- oder Organisationsleiters teilnehmen, der den Umfang der Teams und Dienste besitzt, die in der Besprechung abgedeckt werden sollen. Dies sind in der Regel andere Vizepräsidenten, Direktoren und leitende Angestellte für Technik, IT und Betrieb. Es ist selten, dass technische Manager an diesem Meeting teilnehmen, außer in Organisationen, in denen es nicht mehrere Führungsebenen in den Bereichen Engineering, IT und / oder Betrieb gibt. On-Call-Responder müssen nicht an diesem Meeting teilnehmen.
Metriken #
Wie der Name schon sagt, betrachten Sie für die Serviceüberprüfung Metriken hauptsächlich durch die Service-Linse. Zusätzlich zu den Incident-Metriken durch die Linse der Services zeigen die Metriken, die Sie hier verwenden, direkter auf die Auswirkungen auf den Kunden durch die Serviceverfügbarkeit.
Ähnlich wie bei der Überprüfung auf Abruf können Sie möglicherweise zunächst nicht alle diese Metriken abrufen, und Sie haben möglicherweise andere Metriken, die Sie als wertvoll erachten. Verwenden Sie, was Sie haben und was Sie sammeln können, um loszulegen. Das Wichtigste ist, dass Sie anfangen.
Nachfolgend finden Sie vorgeschlagene Metriken für maximale Effektivität von Besprechungen:
- Serviceverfügbarkeit gegen SLA (insgesamt und nach Business Service)
- Zeit ohne größeren Vorfall (insgesamt, nach technischem Service und Business Service)
- Zeit ohne Vorfall mit hoher Dringlichkeit (insgesamt, nach technischem Service und Business Service)
- Anzahl der größeren Vorfälle (insgesamt, nach technischem Service und Business Service)
- anzahl der Dringlichkeitsvorfälle (insgesamt, nach technischem Service und Business Service)
- Mittlere Zeit bis zur Bestätigung (insgesamt und nach technischem Service)
- Mittlere Zeit bis zur Lösung (insgesamt und nach technischem Service)
- Eine Liste aller wichtigen Vorfälle mit Details zu Vorfallstyp, störendem technischen Service, betroffenen Business-Services, Dauer und Auswirkungen auf das Unternehmen (Schweregrad, Anzahl der Kundenauswirkungen usw.).)
Durchführung der Überprüfung #
Obwohl die Überprüfung auf Abruf länger dauert als die Besprechung, ist die Serviceüberprüfung immer noch eine stark fokussierte Aktivität. Im Allgemeinen sollte das Treffen dieser Art von Tagesordnung folgen:
- Verteilen Sie Metrikberichte zur Serviceprüfung im Voraus an alle Teilnehmer (dies bietet die Möglichkeit, zusätzliche Informationen, die hilfreich sein können, vorab zu lesen und zu sammeln)
- Überprüfen Sie übergeordnete zusammenfassende Metriken, die die gesamte Abteilung oder Abteilung abdecken
- Überprüfen Sie Metriken auf Business–Service-Ebene, um die Auswirkungen auf den Kunden zu verstehen
- Verwenden Sie dieselben Metriken wie auf der obersten Ebene, aber
- Überprüfen Sie Metriken und Incident-Trends für technische Services, die den größten Einfluss auf den Underperforming Business Service hatten metriken
- Gehen Sie alle wichtigsten Vorfälle für technische Dienste durch, die die größten Auswirkungen auf den Business Service hatten
- Konzentrieren Sie sich auf beitragende Faktoren, Dauer, Postmortem und Status von Folgeelementen
- Verwenden Sie den Rest des Meetings, um konkrete Aktionspläne zu erstellen, die sich auf eine verbesserte Verfügbarkeit von Business Services konzentrieren
Ein erfolgreiches Review-Meeting ermöglicht es Ihnen, die meisten oder alle dieser Fragen zu beantworten:
- Wie hoch war unsere Verfügbarkeit und Kundenverfügbarkeit für den Monat?
- Wie viele Zwischenfälle gab es? Tendieren sie nach oben oder unten?
- Waren Geschäftsdienste stärker von Vorfällen betroffen als andere Geschäftsdienste?
- Welche technischen Dienste hatten den größten negativen Einfluss auf die Zuverlässigkeit von Business Services?
- Wie viele Vorfälle gab es in diesem Monat bei technischen Diensten, die sich negativ auf Business Services ausgewirkt haben? Geht der Trend nach oben, unten oder bleibt er gleich?
- Was waren die Hauptursachen für unsere schweren Zwischenfälle? Wie effektiv war unsere Antwort? Werden sich diese großen Vorfälle wahrscheinlich wiederholen?
- Wo sollten wir mehr Personal, Prozess- und/oder Technologieressourcen investieren, wenn wir unsere Betriebszeit und Kundenverfügbarkeit in Zukunft verbessern wollen?
Maßnahmen ergreifen #
Wie bei allen operativen Überprüfungen hängt die geeignete Maßnahme in hohem Maße davon ab, was in der Serviceüberprüfung gelernt wurde, sowie von der Organisationskultur, dem aktuellen Fokus und den aktuellen Zielen. Es gibt jedoch einige allgemeine Tipps und allgemeine Schwerpunkte, um nach einer Serviceprüfung Maßnahmen zu ergreifen.
Das erste, was zu tun ist, ist zu verstehen, wo Maßnahmen priorisiert werden müssen. Durch die Konzentration auf Unternehmensdienstleistungen ist es einfacher, Investitionen zu priorisieren. Die Priorisierung sollte nicht allein auf der Anzahl der Vorfälle oder der Dauer basieren; Vielmehr sollte die Gesamtauswirkung auf die Unternehmensdienste die Höhe der Investitionen in die zugrunde liegenden technischen Dienste bestimmen.
Als nächstes müssen Sie die Art der Investition bestimmen, die ein technischer Service erfordert. Investitionen in die Verbesserung der Serviceverfügbarkeit können Dinge wie mehr Schulungen zu wichtigen Incident Response-Schulungen für verantwortliche Teams, den Austausch von mehr Kontextinformationen mit Warnungen, das Refactoring von Servicecode, das Abbezahlen technischer Schulden, das Durchführen von Infrastruktur-Upgrades und viele andere umfassen.
Unabhängig von der erforderlichen Maßnahme sollten Sie sicherstellen, dass Sie den Aufwand auf die Optimierung der Geschäftsergebnisse zurückführen können, indem Sie Klarheit darüber schaffen, wie sich dies auf die Kundenverfügbarkeit Ihrer digitalen Dienste auswirkt.
Abschließende Anmerkungen und Überlegungen #
Hoffentlich beginnen Sie zu sehen, dass die monatliche Serviceüberprüfung und die wöchentliche Bereitschaftsüberprüfung symbiotisch sind.
Wenn Ihre Teams Bereitschaftsprüfungen durchführen, sollte es keine Überraschungen darüber geben, welche Dienste Aufmerksamkeit benötigen. Wenn Sie an der Serviceüberprüfungsbesprechung teilnehmen, sollten Sie zur Vorbereitung auf diese Besprechung Zusammenfassungen der Bereitschaftslast / Schmerzen Ihres Teams im letzten Monat lesen. Bitten Sie Ihre Teams, ihre Bereitschafts-Überprüfungsmetriken mit Ihnen zu teilen.
Wenn Ihre Teams Bereitschaftsprüfungen durchführen und identifizierte Aktionen nachverfolgen, sollten in der monatlichen Serviceüberprüfung nur wenige nicht umsetzbare Vorfälle erwähnt werden. Wenn dies beispielsweise nicht der Fall ist, ist dies ein klarer Hinweis darauf, dass Sie sich darauf konzentrieren sollten, wöchentliche Bereitschaftsüberprüfungen durchzuführen , bei denen die Lösung nicht umsetzbarer Vorfälle priorisiert wird, sodass es kein Problem darstellt, wenn es Zeit für das nächste monatliche Serviceüberprüfungsmeeting ist.