Wie funktioniert die Zielverfolgung?

Zielverfolgung funktioniert durch die Angabe eines Zielwerts für eine Metrik, die durch die automatische Skalierung beibehalten werden soll. Die Autoskalierungsrichtlinie passt die Anzahl der Instanzen in Ihrer Autoskalierungsgruppe als Reaktion auf Änderungen in der Metrik an. Wenn Sie beispielsweise eine Zielverfolgungsrichtlinie festlegen, um eine durchschnittliche CPU-Auslastung von 50 % aufrechtzuerhalten, passt die automatische Skalierung die Anzahl der Instanzen automatisch an, um die CPU-Auslastung in der Nähe dieses Ziels, der Skalierung oder bei Bedarf zu halten.

Schrittskalierung und Zielskalierung sind zwei verschiedene Skalierungsrichtlinien in AWS Auto Scaling. Die Zielskalierung passt die Anzahl der Instanzen proportional zum Metrikwert an, um den Zielwert zu erreichen und beizubehalten. Im Gegensatz dazu werden bei der schrittweisen Skalierung Instanzen in größeren Schritten (Schritten) basierend auf vordefinierten Schwellenwerten und Skalierungsanpassungen hinzugefügt oder entfernt. Die Zielskalierung ist glatter und passt sich allmählicher an, während die schrittweise Skalierung zu abrupteren Änderungen der Befehlsanzahl basierend auf metrischen Schwellenwerten führen kann.

Die Abklingzeit der Zielverfolgungsrichtlinie ist eine Funktion, die verhindert, dass die automatische Skalierung weitere Instanzen startet oder beendet, bevor die vorherige Skalierungsaktivität wirksam wird. Diese Abklingzeit trägt dazu bei, die Instanzanzahl zu stabilisieren und schnelle Schwankungen durch aufeinanderfolgende Skalierungsereignisse zu vermeiden. Die Dauer der Abkühlphase kann basierend auf Ihren Anwendungsanforderungen und der Zeit konfiguriert werden, die benötigt wird, bis neue Instanzen gestartet und vollständig betriebsbereit sind.

Die schrittweise Skalierung in AWS Auto Scaling passt die Anzahl der Instanzen in Ihrer Autoscaling-Gruppe basierend auf der Größe der Alarmverletzung an. Wenn ein CloudWatch-Alarm aufgrund einer Metrikverletzung ausgelöst wird, führt Step Scaling Skalierungsaktivitäten basierend auf den vordefinierten Skalierungsanpassungen durch. Wenn beispielsweise die CPU-Auslastung einen Schwellenwert überschreitet, kann die Stufenskalierung eine feste Anzahl von Instanzen hinzufügen, um die erhöhte Last zu bewältigen. Es funktioniert in diskreten Schritten (Schritten) und passt sich nicht wie bei der Zielverfolgung kontinuierlich an, wodurch es für Anwendungen mit vorhersehbareren Skalierungsanforderungen geeignet ist.

Autoscaling in AWS automatisiert den Prozess der Anpassung der Anzahl von EC2-Instanzen in einer Autoscaling-Gruppe basierend auf benutzerdefinierten Richtlinien und sorgt so für optimale Leistung und Kosteneffizienz. Es überwacht Metriken wie CPU-Auslastung, Netzwerkverkehr und benutzerdefinierte Metriken, um die Anzahl der Instanzen dynamisch anzupassen. Autoscaling kann Instanzen vergrößern oder verkleinern, fehlerhafte Instanzen ersetzen und Instanzen über mehrere Verfügbarkeitszonen verteilen, um Fehlertoleranz und Verfügbarkeit zu verbessern. Diese Elastizität ermöglicht es Anwendungen, unterschiedliche Arbeitslasten ohne manuelle Eingriffe zu bewältigen, was sowohl die Leistung als auch die Kosteneffizienz in Cloud-Umgebungen verbessert.