Kategorien
Ausfälle Probleme

Server viermal in nichtmal zwei Stunden gecrasht

Aus bisher ungeklärten Gründen ist der Server, auf dem die Jabber Dienste laufen, viermal in den letzten nichtmal zwei Stunden gecrasht. Von einer auf die andere Sekunde nimmt sich der ejabberd Prozess alle Resourcen, die er kriegen kann, und sogar mehr. 8GB RAM und 8GB virtueller Speicher, alles weg. Plus jede Menge CPU Load. Der Server war so überlastet, dass “top” sich ~ alle 5 Minuten aktualisierte nur letztendlich nur noch ein Hardware Reset half um den Server neu zu starten.

For the tech geeks:

top – 19:56:21 up 31 min,  1 user,  load average: 22.86, 13.11, 8.71
Tasks: 240 total,   3 running, 231 sleeping,   0 stopped,   6 zombie
Cpu(s):  1.4%us,  5.8%sy,  0.0%ni, 12.4%id, 80.3%wa,  0.0%hi,  0.1%si,  0.0%st
Mem:   8190900k total,  8138972k used,    51928k free,      796k buffers
Swap:  8393848k total,  7276916k used,  1116932k free,    42404k cached

PID USER      PR  NI  VIRT  RES  SHR S %CPU %MEM    TIME+  COMMAND
3239 ejabberd  20   0 15.7g 6.0g 460 S   23 76.7   3:06.65 beam.smp

Wir recherchieren nach wie vor an dem Problem. Eventuell ein kritischer Bug von ejabberd, eventuell eine DoS Attacke. Wir wissen es noch nicht.

Kategorien
Probleme Transportdienste

ICQ Transport wieder stabil

Wir hatten seit gestern morgen Stabilitätsprobleme mit dem ICQ Transport. Diese wurden dich eine bestimmte Version von libpurple verursacht. Die Probleme sollten nun gefixt sein.

Bitte beachte, dass bei Abstürzen der Spectrum Transports (also keine “normalen” Stops oder Neustarts) dazu kommen könnte, das der Client denkt, er wäre immer noch online. Aus diesem Grund könnten Kontakte online bleiben obwohl der Client in diesem Moment gar nicht mehr richtig beim Transport eingeloggt ist. Das Spectrum Team arbeitet an diesem Problem. Bis zu eine Lösung hoffe ich einfach, dass die Spectrum Transports stabil laufen. ;-)

Mit der neuen libpurple Version sollte der Gadu-Gadu Transport nun endlich auch stabil laufen. Aber wir werden sehen wie sich das entwickelt in den kommenden Tagen.

Kategorien
Ausfälle Probleme

Problem mit Jabber Datenbank

Es gab leider ein Problem mit der Datenbank aller Konten der jabber.hot-chilli.net Domain (Konten anderer Domains, wie jabber.hot-chilli.eu, sind nicht betroffen).

Zu guter Letzt mussten wir ein Backup vom 4./5. Mai 2010 (der Tag des Serverumzugs) einspielen und dafür den Jabber Server 2 Stunden herunterfahren.

Betroffen sind nur die Kontaktlisten sowie die Kontaktgruppen. Dies bedeutet, dass Du als betroffener Benutzer alle seitdem geänderten Kontakte neu hinzufügen oder auch löschen musst.

Bitte entschuldige vielmals die Unannehmlichkeiten, vor allem, weil das Backup leider eine Woche alt ist.

Die Frage bleibt, warum im aktuellen Datenbankbackup von heute morgen nur 20 von 150000 (!) Datensätze zu finden waren. Wir werden uns die Backupprozedur sehr genau anschauen.

Kategorien
Probleme Transportdienste Wartungsarbeiten

Jabber Disk, SMS Gateway und JMC umgezogen

Zu guter Letzt sind nun auch Jabber Disk, der SMS Gateway und JMC auf den neuen Server umgezogen. Jabber Disk und der SMS Gateway laufen wieder und stehen zur Verfügung.

Leider läuft JMC nach wie vor sehr instabil. Wir bitten um etwas Geduld. Ich bin mit dem Programmierer in Kontakt und wie es aussieht ist er bereit, etwas Zeit in den Programmcode zu stecken. Wir werden erleben wie das wird. Ich hoffe auf einige Verbesserungen, vor allem weil ich denke, dass JMC ein beliebter und vielgenutzter Dienst ist.

Kategorien
Ausfälle Probleme

Stundenlange Netzwerkprobleme

Unser Provider hatte Netzwerkstörungen, die gestern (06.05.2010) um 14 Uhr CEST begannen. Die Ausfälle betrafen viele Internetprovider. T-Online und Alice hier in Deutschland haben funktioniert, viele andere wie KabelBW und Strato haben nicht funktioniert. Diese massiven Probleme sind gegen 18 Uhr wieder weg gewesen, trotzdem traten weiterhin kleinere Probleme bis heute morgen auf. Laut unserem Provider gehört die Sache nun aber der Vergangenheit an. Die Probleme wurde von einer 50 Gbit Attacke verursacht.

Kategorien
Ausfälle Probleme

6 Stunden Ausfall…

Der Jabber Server ist eben nach einem 6-stündigen Ausfall um 9:00 Uhr CEST wieder hochgefahren.

Sorry, der Grund war ein Fehler in der Config, verursacht durch das Hinzufügen einer neuen Jabber Domain.

Wir bedauern die Unannehmlichkeiten.

Kategorien
Ausfälle Probleme Transportdienste Wartungsarbeiten

Serverumzug fast abgeschlossen

Ok, der Serverumzug ist nahezu abgeschlossen. JMC, jDisk und SMS müssen noch umgezogen werden, das passiert später am Tag… ;-)

Bei anderen Problemen bitte bei uns melden!

Kategorien
Ausfälle Probleme Wartungsarbeiten

Bevorstehender Jabber Server Umzug

Aufgrund massiver Hardwareprobleme werden wir den Jabber Server auf eine neue Maschine umziehen. Dies wird bald passieren, eventuell schon diese Nacht. Die Jabberdienste werden für zirka eine Stunde nicht erreichbar sein. Die neue IP-Adresse wird 178.63.27.18 sein – falls Dein DNS sich nicht rechtzeitig umstellen sollte. Entschuldige bitte die Unannehmlichkeiten.