Wytyczne dotyczące wysokiej dostępności i najlepsze praktyki VMware HA

VMware High Availability (HA) to narzędzie, które eliminuje potrzebę stosowania dedykowanego sprzętu i oprogramowania rezerwowego w środowisku zwirtualizowanym. VMware HA jest często używany do poprawy niezawodności, skrócenia przestojów w środowiskach wirtualnych i poprawy odzyskiwania po awarii/ciągłości działania.

Ten fragment rozdziału z egzaminu Vcp4: VMware Certified Professional, 2nd Edition by Elias Khnaser bada najlepsze praktyki VMware HA.

VMware High Availability zajmuje się przede wszystkim awarią hosta ESX / ESXi i tym, co dzieje się z maszynami wirtualnymi (vm) działającymi na tym hoście. HA może również monitorować i ponownie uruchamiać maszynę wirtualną, sprawdzając, czy narzędzia VMware nadal działają. Gdy host ESX / ESXi z jakiegokolwiek powodu zawiedzie, wszystkie uruchomione maszyny wirtualne również zawodzą. VMware HA zapewnia, że maszyny wirtualne z uszkodzonego hosta mogą być ponownie uruchamiane na innych hostach ESX/ESXi.

Wiele osób błędnie myli VMware HA z tolerancją błędów. VMware HA nie jest odporny na błędy, ponieważ jeśli host ulegnie awarii, maszyny wirtualne na nim również ulegną awarii. HA zajmuje się tylko restartem tych maszyn wirtualnych na innych hostach ESX/ESXi z wystarczającą ilością zasobów. Z drugiej strony odporność na awarie zapewnia nieprzerwany dostęp do zasobów w przypadku awarii hosta.

kliknij na zdjęcie okładki książki powyżej
Aby pobrać cały rozdział
na temat backupu i wysokiej dostępności.

VMware ha utrzymuje kanał komunikacji ze wszystkimi innymi hostami ESX / ESXi, które są członkami tego samego klastra, używając heartbeat, który wysyła co 1 sekundę w vSphere 4.0 lub co 10 sekund w vSphere 4.1 domyślnie. Gdy serwer ESX nie uderzy w bicie serca, inne hosty czekają 15 sekund, aż inny host ponownie zareaguje. Po 15 sekundach klaster inicjuje restart maszyn wirtualnych na zawodzącym hoście ESX / ESXi na pozostałych hostach ESX / ESXi w klastrze. VMware HA stale monitoruje również hosty ESX / ESXi należące do klastra i zapewnia, że zasoby są zawsze dostępne w celu spełnienia wymagań w przypadku awarii hosta.

monitorowanie awarii maszyny Wirtualnej

monitorowanie awarii maszyny Wirtualnej jest technologią domyślnie wyłączoną. Jego funkcją jest monitorowanie maszyn wirtualnych,które pyta co 20 sekund za pomocą tętna. Robi to za pomocą narzędzi VMware, które są zainstalowane wewnątrz maszyny wirtualnej. Gdy maszyna wirtualna nie trafia w serce, VMware HA uznaje tę maszynę za nieudaną i próbuje ją zresetować. Pomyśl o monitorowaniu awarii maszyn wirtualnych jako o wysokiej dostępności maszyn wirtualnych.

monitorowanie awarii maszyny Wirtualnej może wykryć, czy maszyna wirtualna została ręcznie wyłączona, zawieszona lub migrowana, a tym samym nie próbuje jej ponownie uruchomić.

wymagania wstępne konfiguracji VMware HA

HA wymaga następujących wymagań wstępnych konfiguracji, zanim będzie działać poprawnie:

vCenter: ponieważ VMware HA jest funkcją klasy korporacyjnej, wymaga vCenter, zanim będzie można go włączyć.
rozdzielczość DNS: wszystkie hosty ESX / ESXi należące do klastra HA muszą być w stanie rozwiązywać się nawzajem za pomocą DNS.
dostęp do współdzielonej pamięci masowej: wszystkie hosty w klastrze HA muszą mieć dostęp i widoczność do tej samej współdzielonej pamięci masowej; w przeciwnym razie nie mieliby dostępu do maszyn wirtualnych.
dostęp do tej samej sieci: Wszystkie hosty ESX / ESXi muszą mieć te same sieci skonfigurowane na wszystkich hostach, tak aby po ponownym uruchomieniu maszyny wirtualnej na dowolnym Hostie miała ona ponownie dostęp do właściwej sieci.

redundancja konsoli serwisowej

Zalecana Praktyka nakazuje redundancję konsoli serwisowej (SC). VMware HA skarży się i wyświetla ostrzeżenie, jeśli wykryje, że konsola usług jest skonfigurowana na vswitchu z tylko jednym vmnic. Jak pokazano na rysunku 1, możesz skonfigurować redundancję konsoli serwisowej na jeden z dwóch sposobów:

utwórz dwie grupy portów konsoli serwisowej, każda na innym przełączniku vSwitch.
przypisanie dwóch fizycznych kart interfejsu sieciowego (nic) w postaci zespołu NIC do konsoli serwisowej vSwitch.

konsola serwisowa nic Team redundancja — Rysunek 1. Redundancja konsoli usług

w obu przypadkach należy skonfigurować cały stos IP z adresem IP, podsiecią i bramą. Przełączniki vSwitch konsoli serwisowej są używane do bicia serca i synchronizacji stanu i używają następujących portów:

przychodzący port TCP 8042
przychodzący port UDP 8045
wychodzący port TCP 2050
wychodzący port UDP 2250
przychodzący port TCP 8042-8045
przychodzący port UDP 8042-8045
wychodzący port TCP 2050-2250
wychodzący port UDP 2050-2250

brak konfiguracji redundancji SC powoduje wyświetlenie komunikatu ostrzegawczego po włączeniu ha. Tak więc, aby uniknąć wyświetlania tego komunikatu o błędzie i stosować się do najlepszych praktyk, skonfiguruj SC jako redundantny.

planowanie pracy awaryjnej hosta

podczas konfigurowania HA należy ręcznie skonfigurować maksymalną tolerancję awarii hosta. Jest to zadanie, które należy starannie rozważyć podczas doboru sprzętu i fazy planowania wdrożenia. Zakłada to, że zbudowałeś hosty ESX/ESXi z wystarczającą ilością zasobów, aby uruchomić więcej maszyn wirtualnych niż planowano, aby móc pomieścić HA. Na przykład, na rysunku 2, zauważ, że klaster HA ma cztery hosty ESX i że wszystkie cztery hosty mają wystarczającą pojemność, aby uruchomić co najmniej trzy kolejne maszyny wirtualne. Ponieważ wszystkie są już uruchomione trzy maszyny wirtualne, oznacza to, że ten klaster może sobie pozwolić na utratę dwóch hostów ESX/ESXi, ponieważ pozostałe dwa hosty ESX/ESXi mogą zasilać sześć nieudanych maszyn wirtualnych bez problemu, jeśli wystąpi awaria.

planowanie mocy HA — Rysunek 2. Planowanie wydajności ha

podczas fazy konfiguracji klastra HA wyświetlany jest ekran podobny do tego pokazanego na rysunku 3, który monituje o zdefiniowanie dwóch konfiguracji dla całego klastra w następujący sposób:

Status monitorowania hosta:

Włącz monitorowanie hosta: to ustawienie pozwala kontrolować, czy klaster HA powinien monitorować hosty dla bicia serca. Jest to sposób klastra na określenie, czy host jest nadal aktywny. W niektórych przypadkach, gdy uruchamiasz zadania konserwacyjne na hostach ESX / ESXi, może być pożądane wyłączenie tej opcji, aby uniknąć izolowania hosta.

Kontrola dostępu:

Enable: nie włączaj maszyn wirtualnych naruszających ograniczenia dostępności: Zaznaczenie tej opcji oznacza, że jeśli nie ma dostępnych zasobów, aby zaspokoić potrzeby maszyny Wirtualnej, nie należy jej włączać.
Wyłącz: włączaj maszyny wirtualne, które naruszają ograniczenia dostępności: wybranie tej opcji oznacza, że powinieneś włączyć maszynę wirtualną, nawet jeśli musisz przełożyć zasoby.

zasady kontroli wstępu:

klaster toleruje błędy hosta: to ustawienie pozwala skonfigurować liczbę błędów hosta, które chcesz tolerować. Dozwolone Ustawienia to od 1 do 4.
procent zasobów klastra zarezerwowanych jako wolne moce przełączania awaryjnego: Zaznaczenie tej opcji oznacza, że rezerwujesz pewien procent całkowitych zasobów klastra w zapasie do przełączania awaryjnego. W klastrze czterech hostów rezerwacja 25% oznacza, że odkładasz pełnego hosta do przełączania awaryjnego. Jeśli chcesz odłożyć mniej, możesz zamiast tego wybrać 10% zasobów klastra.
Określ host przełączania awaryjnego: wybranie tej opcji oznacza wybranie konkretnego hosta jako host przełączania awaryjnego w klastrze. Może tak być, jeśli masz zapasowy host lub konkretny host, który ma znacznie więcej zasobów obliczeniowych i pamięci.

Ha clusterwide policies — Rysunek 4. Specyficzna dla maszyny wirtualnej Polityka izolacji

vm-specific isolation policy — Rysunek 4. Specyficzna dla maszyny wirtualnej Polityka izolacji

Wytyczne dotyczące wysokiej dostępności i najlepsze praktyki VMware HA