Udvidet linux - webserver
Forskellige opgaver vedr linux - skal ses som en udvidet af de mere trivielle skole-linux opg.
Slut resultatet når alle øvelser er lavet, skulle gerne være et fuldt Highly-Available web cluster udelukkende med opensource komponenter.
Requirements:
- Basal linux viden: skal kunne installere linux og navigere rundt, edit config filer mm
- Mulighed for at deploy'e 5-6 små linux vm'er á min 1 cpu/512mb ram - eller have tilsvarende antal raspberry Pi's ved hånden.
- I øvelserne bruger vi som udgangspunkt 1 rolle pr node - for at holde det simpelt og adskilt.
Contents
Basic webserver
- Find en web application du vil hoste i dit cluster.
- Skal være en applikation der bruger data fra en database
- Det er valgfrit hvad man vælger (kan være en php app på apache med mysql, ruby app på nginx med redis, java på tomcat med postgresql, nodejs med mongodb)
- Gå evt uden for comfort-zone og vælg en sprog/webserver/db som du ikke har prøvet før
- Installer 1 webserver node (web01) og 1 database node(db01)
- installer webserver og database server softwaren
- deploy din web application på web01, sæt den til at bruge db01
- sikre web applikationen virker efter hensigten
High Availability WebServer
Du begynder at få traffik på dit site. Ved spids-belastninger kniber det for web01 at følge med - desuden er du nervøs hvor hvad der sker hvis web01 crasher - derfor vil du gerne have en webserver mere.
- Installer endnu en webserver node (web02) eller lav en clon af web01 (husk at rette hostname, ip osv)
- Sikre at applicationen virker som forventet når du tilgår web02 i browseren
Du skal bruge en loadbalancer foran dine webservere til at dirigere trafikken. Sådan en node kaldes også en reverse proxy
Der er mange forskellige pakker der kan bruges her. Se f.eks. haproxy , apache mod_proxy , [1]
- Installer en node til din loadbalancer (lb01)
- installer en proxy/loadbalancer efter eget valg og sæt den til at kunne forwarde trafikken til både web01 og web02.
- For variationens skyld så lad være med at bruge samme server som på web01/web02, så du ikke bruger f.eks. nginx til både lb og web
- du skulle nu kunne tilgå din webapp gennem lb01
- haproxy har den en indbygget status side, apache mod_proxy kan sættes til at vise status igennem mod_status, og nginx har også en status side. Bruger du andet se om den kan rapportere status på lignende måde.
- Sæt proxy status siden op lb01
- test nu at din LB kan håndtere at en webserver ikke svarer
- ved hvert step følg med på status siden
- stop webserver på web01 og sikre at du stadig kan bruge din app gennem lb01
- start webserver på web01 og stop den på web02 - sikre at du stadig kan bruge din app gennem lb01
- start webserver igen på web02
De fleste reverse proxyer understøtter flere metoder til load balancing, når den skal finde ud af hvilen server der skal håndtere en given http request, f.eks. round-robin, by-source-ip, eller least-used.
- Undersøg hvilke metoder din reverse proxy understøtter.
Hver opmærksom på at hvis din applikation bruger logins eller sessions på anden vis, skal en bruger helst ramme samme server hver gang. (dog er det undtaget hvis at du har sat clustered sessions op i din applikation)
- Undersøg om du kan lave sticky-sessions eller om du vil lave balance by ip
Ud over at dom LB gerne selv skulle kunne detektere at en node ikke er tilgængelig, så vil du også gerne kunne disable en webserver i LB i forbindelse med servicevinduer, så at LB ikke forgæves prøver at sende trafik førend webserveren er klar igen.
- Undersøg hvordan du kan disable og enable en webserver i din LB pool
Synkronisering af webserver
Du har nu 2 webservere kørende, som helst skulle køre nøjagtig samme udgave af web applikationen. Så du skal overveje hvordan sikrer du dig at dette fortsætter med at være tilfældet i forbindelse med upgrade eller hvis du har behov for at deploye endnu en server. Hvis man kan uploade filer gennem applikationen så skal alle webserverne helst have samme view af upload mappen.
php filer kan synkroniseres, ved andre apps kan det være nødvendigt at undersøge config mgmt tools såsom salt,puppet eller ansible.
filer kan synkroniseres med f.eks. rsync - eller man kan lave replikerede filsystemer med f.eks. drbd/gluster - du kan også store dem på en seperat server og mounte via NFS (men hvordan påvirker det så dit mål om HA?)
- Hvad vil bruge for at sikre dine web servere er identiske ?
High Availability LB
Dine webservere er redundate og LB sørger for at omdirigere trafikken, hvis en crasher - men hvad med din LB? Så du skal nu lave en lb mere - men hvordan sikrer du HA mellem de 2? Måden der skal bruges her er at lave en shared virtual IP som de skal forhandle om at være primær på. Vær ops på at shared IP kan give problemer hvis din router/fw har lang levetid på arp cache !!
- Deploy en ny LB node (lb02) og sikre at configurationen matcher med lb01
- sikre at du kan tilgå dit website gennem lb02
- opsæt virtual shared IP på lb01 og lb02 med f.eks. heartbeat / pacemaker eller keepalived.
- test at din HA virker på shared IP (luk lb01 ned og test, start lb01 og luk lb02 osv ...)