Zápisky z povídání o clusterování

Je možné najít zajímavé informace v krátkém povídání o clusterech, když je to celé tak jednoduché? Určitě ano.

Takže clustering v Lotus Notes je opravdu jednoduchý k nastavení – pár kliků a už to jede. Použít se to dá k hrozné spoustě věcí, ať už k tomu proč je to myšleno (failover, load balancing) tak při upgradu serverů nebo pro jejich zálohování (jeden se vždy vypne a v klidu zazálohujete a nemusíte mít speciální zálohovací software pro Domino).

Vždycky se říká, že to funguje pro maximálně 6 serverů, ale funguje to i pro víc, problém je možná spíš otázka, zda to ještě výkonnostně dává smysl, nebo se na režii spotřebuje víc než nový server přinese. Každý server totiž replikuje se všemi dalšími, se kterými sdílí databázi, žádné nastavení do hvězdy či podobné věci.

Co se týká dedikované síťové karty, tak je to dost možná lepší, ale zatím jsme nikdo neviděli, aby ten clusterový provoz brzdil ten zbývající – ve velkých nasazeních je to ale pravděpodobné.

Problémem je výpadek delší jak 1 hodina, po kterém cluster zapomíná, co ještě nezreplikoval na ten spadnutý server a je potřeba provést běžnou replikaci, která to doplní. Běžná replikace má ale jeden problém u špatně navržených aplikací – cluster replikace ignoruje nastavení čtenářských políček a tak replikuje i ty dokumenty, které by třeba na dalších serverech být neměly. Normální replikace ovšem čtenářská pole respektuje, takže dokumenty pravděpodobně (nikdo z nás se na to nikdy nezaměřil) smaže, díky čemuž ale cluster není 100% stejný a v podstatě není řešení, jak dosáhnout opravy (kromě toho, že vývojáři opraví výpočet čtenářských polí).

V souboru loadmon.ncf se počítají hodnoty pro Availability index, problém je, když se v souboru objeví záporné hodnoty, protože s nimi Domino nepracuje správně. Takže pokud tam nějaké máte, tak normálně ručně vymazat a mělo by se to spravit.

Na clusteru je nutné sledovat dvě klíčové hodnoty Replica.Cluster.SecondsOnQueue, která by měla být do 10 vteřin a Replica.Cluster.SecondsOnQueue.Avg, která by měl být také do deseti. Pokud nejsou, tak pomůže přidání více cluster replikátorů, pomocí nastavení CLUSTER_REPLICATORS=x v notes.ini.

No a víc zápisků k tomu nemám, jedině mohu doporučit ještě povídání z Admin konference z roku 2006 nebo tip pro využití clusteru na jednom serveru.

1 komentáře

  1. Ahoj, já si dovolím doplnit trochu poznámku o souboru LOADMON.NCF, vzhledem k tomu, že jsem se povídání o clusteru na sutoLu nemohl zůčastnit, tak to tam asi nepadlo 🙂
    To, že v tom souboru jsou špatné hodnoty (nula nebo záporné) poznáte na konzoli serveru snadno tak, že Availability Index je neustále 100% a statistika Server.ExpansionFactor ukazuje ERROR.
    V KB Lotusu se dočtete, že pomůže smazat LOADMON.NCF, ale už jsem se setkal s tím, že to nepomohlo. Řešením bylo nechat vztvořit novou databázi STATREP.NSF, pak teprve došlo ke správnému výpočtu AI.

Leave a Reply