VMware High Availability (HA) to narzędzie, które eliminuje potrzebę stosowania dedykowanego sprzętu i oprogramowania rezerwowego w środowisku zwirtualizowanym. VMware HA jest często używany do poprawy niezawodności, skrócenia przestojów w środowiskach wirtualnych i poprawy odzyskiwania po awarii/ciągłości działania.
Ten fragment rozdziału z egzaminu Vcp4: VMware Certified Professional, 2nd Edition by Elias Khnaser bada najlepsze praktyki VMware HA.
VMware High Availability zajmuje się przede wszystkim awarią hosta ESX / ESXi i tym, co dzieje się z maszynami wirtualnymi (vm) działającymi na tym hoście. HA może również monitorować i ponownie uruchamiać maszynę wirtualną, sprawdzając, czy narzędzia VMware nadal działają. Gdy host ESX / ESXi z jakiegokolwiek powodu zawiedzie, wszystkie uruchomione maszyny wirtualne również zawodzą. VMware HA zapewnia, że maszyny wirtualne z uszkodzonego hosta mogą być ponownie uruchamiane na innych hostach ESX/ESXi.
Wiele osób błędnie myli VMware HA z tolerancją błędów. VMware HA nie jest odporny na błędy, ponieważ jeśli host ulegnie awarii, maszyny wirtualne na nim również ulegną awarii. HA zajmuje się tylko restartem tych maszyn wirtualnych na innych hostach ESX/ESXi z wystarczającą ilością zasobów. Z drugiej strony odporność na awarie zapewnia nieprzerwany dostęp do zasobów w przypadku awarii hosta.
Aby pobrać cały rozdział
na temat backupu i wysokiej dostępności.
VMware ha utrzymuje kanał komunikacji ze wszystkimi innymi hostami ESX / ESXi, które są członkami tego samego klastra, używając heartbeat, który wysyła co 1 sekundę w vSphere 4.0 lub co 10 sekund w vSphere 4.1 domyślnie. Gdy serwer ESX nie uderzy w bicie serca, inne hosty czekają 15 sekund, aż inny host ponownie zareaguje. Po 15 sekundach klaster inicjuje restart maszyn wirtualnych na zawodzącym hoście ESX / ESXi na pozostałych hostach ESX / ESXi w klastrze. VMware HA stale monitoruje również hosty ESX / ESXi należące do klastra i zapewnia, że zasoby są zawsze dostępne w celu spełnienia wymagań w przypadku awarii hosta.
monitorowanie awarii maszyny Wirtualnej
monitorowanie awarii maszyny Wirtualnej jest technologią domyślnie wyłączoną. Jego funkcją jest monitorowanie maszyn wirtualnych,które pyta co 20 sekund za pomocą tętna. Robi to za pomocą narzędzi VMware, które są zainstalowane wewnątrz maszyny wirtualnej. Gdy maszyna wirtualna nie trafia w serce, VMware HA uznaje tę maszynę za nieudaną i próbuje ją zresetować. Pomyśl o monitorowaniu awarii maszyn wirtualnych jako o wysokiej dostępności maszyn wirtualnych.
monitorowanie awarii maszyny Wirtualnej może wykryć, czy maszyna wirtualna została ręcznie wyłączona, zawieszona lub migrowana, a tym samym nie próbuje jej ponownie uruchomić.
wymagania wstępne konfiguracji VMware HA
HA wymaga następujących wymagań wstępnych konfiguracji, zanim będzie działać poprawnie:
- vCenter: ponieważ VMware HA jest funkcją klasy korporacyjnej, wymaga vCenter, zanim będzie można go włączyć.
- rozdzielczość DNS: wszystkie hosty ESX / ESXi należące do klastra HA muszą być w stanie rozwiązywać się nawzajem za pomocą DNS.
- dostęp do współdzielonej pamięci masowej: wszystkie hosty w klastrze HA muszą mieć dostęp i widoczność do tej samej współdzielonej pamięci masowej; w przeciwnym razie nie mieliby dostępu do maszyn wirtualnych.
- dostęp do tej samej sieci: Wszystkie hosty ESX / ESXi muszą mieć te same sieci skonfigurowane na wszystkich hostach, tak aby po ponownym uruchomieniu maszyny wirtualnej na dowolnym Hostie miała ona ponownie dostęp do właściwej sieci.
redundancja konsoli serwisowej
Zalecana Praktyka nakazuje redundancję konsoli serwisowej (SC). VMware HA skarży się i wyświetla ostrzeżenie, jeśli wykryje, że konsola usług jest skonfigurowana na vswitchu z tylko jednym vmnic. Jak pokazano na rysunku 1, możesz skonfigurować redundancję konsoli serwisowej na jeden z dwóch sposobów:
- utwórz dwie grupy portów konsoli serwisowej, każda na innym przełączniku vSwitch.
- przypisanie dwóch fizycznych kart interfejsu sieciowego (nic) w postaci zespołu NIC do konsoli serwisowej vSwitch.
w obu przypadkach należy skonfigurować cały stos IP z adresem IP, podsiecią i bramą. Przełączniki vSwitch konsoli serwisowej są używane do bicia serca i synchronizacji stanu i używają następujących portów:
- przychodzący port TCP 8042
- przychodzący port UDP 8045
- wychodzący port TCP 2050
- wychodzący port UDP 2250
- przychodzący port TCP 8042-8045
- przychodzący port UDP 8042-8045
- wychodzący port TCP 2050-2250
- wychodzący port UDP 2050-2250
brak konfiguracji redundancji SC powoduje wyświetlenie komunikatu ostrzegawczego po włączeniu ha. Tak więc, aby uniknąć wyświetlania tego komunikatu o błędzie i stosować się do najlepszych praktyk, skonfiguruj SC jako redundantny.
planowanie pracy awaryjnej hosta
podczas konfigurowania HA należy ręcznie skonfigurować maksymalną tolerancję awarii hosta. Jest to zadanie, które należy starannie rozważyć podczas doboru sprzętu i fazy planowania wdrożenia. Zakłada to, że zbudowałeś hosty ESX/ESXi z wystarczającą ilością zasobów, aby uruchomić więcej maszyn wirtualnych niż planowano, aby móc pomieścić HA. Na przykład, na rysunku 2, zauważ, że klaster HA ma cztery hosty ESX i że wszystkie cztery hosty mają wystarczającą pojemność, aby uruchomić co najmniej trzy kolejne maszyny wirtualne. Ponieważ wszystkie są już uruchomione trzy maszyny wirtualne, oznacza to, że ten klaster może sobie pozwolić na utratę dwóch hostów ESX/ESXi, ponieważ pozostałe dwa hosty ESX/ESXi mogą zasilać sześć nieudanych maszyn wirtualnych bez problemu, jeśli wystąpi awaria.
podczas fazy konfiguracji klastra HA wyświetlany jest ekran podobny do tego pokazanego na rysunku 3, który monituje o zdefiniowanie dwóch konfiguracji dla całego klastra w następujący sposób:
- Status monitorowania hosta:
- Włącz monitorowanie hosta: to ustawienie pozwala kontrolować, czy klaster HA powinien monitorować hosty dla bicia serca. Jest to sposób klastra na określenie, czy host jest nadal aktywny. W niektórych przypadkach, gdy uruchamiasz zadania konserwacyjne na hostach ESX / ESXi, może być pożądane wyłączenie tej opcji, aby uniknąć izolowania hosta.
- Kontrola dostępu:
- Enable: nie włączaj maszyn wirtualnych naruszających ograniczenia dostępności: Zaznaczenie tej opcji oznacza, że jeśli nie ma dostępnych zasobów, aby zaspokoić potrzeby maszyny Wirtualnej, nie należy jej włączać.
- Wyłącz: włączaj maszyny wirtualne, które naruszają ograniczenia dostępności: wybranie tej opcji oznacza, że powinieneś włączyć maszynę wirtualną, nawet jeśli musisz przełożyć zasoby.
- zasady kontroli wstępu:
- klaster toleruje błędy hosta: to ustawienie pozwala skonfigurować liczbę błędów hosta, które chcesz tolerować. Dozwolone Ustawienia to od 1 do 4.
- procent zasobów klastra zarezerwowanych jako wolne moce przełączania awaryjnego: Zaznaczenie tej opcji oznacza, że rezerwujesz pewien procent całkowitych zasobów klastra w zapasie do przełączania awaryjnego. W klastrze czterech hostów rezerwacja 25% oznacza, że odkładasz pełnego hosta do przełączania awaryjnego. Jeśli chcesz odłożyć mniej, możesz zamiast tego wybrać 10% zasobów klastra.
- Określ host przełączania awaryjnego: wybranie tej opcji oznacza wybranie konkretnego hosta jako host przełączania awaryjnego w klastrze. Może tak być, jeśli masz zapasowy host lub konkretny host, który ma znacznie więcej zasobów obliczeniowych i pamięci.