Vanmorgen (2 maart 2018, ca 12:15) is een van onze loadbalanced VMWare servers hard onderuit gegaan. Omdat de meeste diensten (websites, database-servers, storage omgeving) dubbel zijn uitgevoerd, zullen de gebruikers hier in principe niets van merken.

We gaan enkele hardware testen uitvoeren, om te achterhalen of het een hardware gerelateerd probleem betreft.

Gedurende deze testen draaien we dus met verminderde (respectievelijk geen) redundantie.

Update 3 maart 14:30

De storing is wellicht gerelateerd aan de recente aanpassingen aan de kernels ivm de Spectre vulnerabilities. Op advies van de leverancier van onze hardware (en na contact met VMWare) hebben we daarom de bios van de servers vervangen. Mocht dat niet het gewenste effect hebben, dan volgt er een hardware-vervanging (moederbord).

Alle systemen staan inmiddels weer aan, we draaien dus weer volledig redundant.