Server schon wieder down

Dieses Thema im Forum "Fragen & Probleme" wurde erstellt von Ilai, 5 November 2006.

  1. Ilai

    Ilai Well-Known Member

    Beiträge:
    1.362
    Likes:
    1
    Seit etwa 22:30 gab es ein Routing Problem beim Provider.
    Vermutlich ist ihnen dort die Stromversorgung abgeraucht, denn die Uptime ist wieder bei 0.
    @André: Oder hast du den Server über das WI rebootet?


    Zwar lief das Routing bereits wieder, aber der plötzliche Reboot hat einige Tabellen des DB Servers mit in den Tod gerissen.

    Einen weiteren Reboot hab' ich eben gecancelled, um noch mehr Unheil zu verhindern.

    Ich hoffe, ich konnte alle Daten rekonstruieren.
     
  2. Anzeige für Gäste


    um diese Anzeige auszublenden!.
  3. André

    André Foren-Capo Administrator

    Beiträge:
    43.800
    Likes:
    2.730
    Hi Ilai, man hatte ich einen Hals auf unseren Hoster!

    Habe dann eben diese Nachricht gelesen:

    Stromausfall in Deutschland, Frankreich und Belgien | tagesschau.de

    Muss man wohl unter dem Deckmantel der höheren Gewalt einstufen! :motz:

    Server war dann für Pascal und mich (hatten uns im ICQ) über Ping wieder zu erreichen.

    FTP Zugang funzte auch aber über SSH hatten wir keinen Zugriff! :motz:

    Naja und die gleichen Sympthome wie beim letzten mal, mit dem fetch! :hammer2:

    Den zweiten Reboot wollten wir starten lassen, aber der war ja nach 20 Min noch nicht ausgeführt. Glaube die Jungs haben heute Nacht ordentlich was zu tun!

    Naja habeeben gelesen das Sie gerade ihr Betriebsgeönde am bebauen sind und wohl ab Anfang nächsten Jahres ein 1000 KW Diesel Aggregat zur Verfügung steht! :hammer2:
     
  4. Ilai

    Ilai Well-Known Member

    Beiträge:
    1.362
    Likes:
    1
    _Das_war das selbe Symptom nach dem Crash neulich??
    Jetzt brauch' ich 'nen Schnaps, denn das hätte man mit einer einfachen Reparatur korrupter Tabellen wieder beheben können, und alles wäre so gelaufen wie eh und je :-(
     
  5. André

    André Foren-Capo Administrator

    Beiträge:
    43.800
    Likes:
    2.730
    Will auch nen Schnaps! :hammer2:

    Jo also wenn ich nicht ganz daneben liege war das damals genau das gleiche, Pascal kann ja mal was dazu sagen!? Aber zu 95 % bin ich mir sicher!
     
  6. Schröder

    Schröder Problembär

    Beiträge:
    10.885
    Likes:
    971
    Ich trink `n Bier für euch mit. [​IMG]

    Das mit dem Stromausfall in einigen Teile Deutschlands stimmt, die Boxkämpfe auf ARD mussten auch verschoben werden, weil in der ganzen Stadt (irgendwo Nähe Essen, wo ebenfalls der Strom ausfiel) ebenfalls zappenduster war.

    Gruß
    Schröder
     
  7. Junker

    Junker Altborusse

    Beiträge:
    3.901
    Likes:
    55
    Ich hatte auch schon nen Hals, aber es gibt ja ne plausible Erklärung. Ich dachte schon die Masse der neuen User hätten den Crash ausgelöst:zwinker:
     
  8. André

    André Foren-Capo Administrator

    Beiträge:
    43.800
    Likes:
    2.730
    Hatte schon fast die Kündigung für den Server geschrieben! :motz: :zahnluec:

    Naja aber war ja nur 2 -3 Stündchen dann geht das ja noch! :hammer2:

    Hauptsache es läuft wieder!

    Trotzdem haben wir gestern nen neuen Rekord aufgestellt --> 651 Beiträge! :top:

    Denke mal angesichts wieviel Leute noch online waren, hätten wir auch die 800 er Marke noch geknackt, aber so haben wir wenigstens noch ein Ziel für die nächsten Tage! :top: :zwinker:
     
  9. Schröder

    Schröder Problembär

    Beiträge:
    10.885
    Likes:
    971
    @ Junker:
    Pssst, doch nicht jedem verraten...
     
  10. André

    André Foren-Capo Administrator

    Beiträge:
    43.800
    Likes:
    2.730
    *g* jo dachte ich mir schon das das einige dachten! (Was fürn Satz :vogel: )

    Aber wir haben ja zum Glück nen eigenen Rootserver, der wenn er denn läuft auch ein bissel was aushält *g*
     
  11. Ilai

    Ilai Well-Known Member

    Beiträge:
    1.362
    Likes:
    1
    Gegen 22:30 versuchte ich, auf den Server zu kommen, da war er schon weg. Das WI war da auch nicht zu erreichen.
    Um 22:03 war noch ein Posting, da muß er also noch da gewesen sein.

    Exakt um 0:00 kam er wieder hoch.
    Erst kurz vor 2:00 hab' ich noch mal geschaut, ob er wieder da ist. Eigentlich wollte ich ja heute mal früher in's Bett...
     
  12. André

    André Foren-Capo Administrator

    Beiträge:
    43.800
    Likes:
    2.730
    Dann wäre wieder alles perfekt gewesen! *g*

    Hab eben schon zu Pascal gesagt, hoffentlich ist Ilai jetzt on! :floet:

    Wenn Du jetzt noch in Deiner Umzugsphase gewesen wärst, hätten wir schon wieder ein Problem gehabt! :zahnluec:

    Glaube ich schick Dir mal so nen Feuerwehr Piepser womit ich Dich dann nachts immer aus em Bett schmeißen kann! :lachweg:
     
  13. Ilai

    Ilai Well-Known Member

    Beiträge:
    1.362
    Likes:
    1
    *g* naja, ich hab' aus meiner Zivi Zeit noch so'n Scall rumliegen, der ist mir durch den Umzug erst wieder in die Hände gefallen...

    K.A. ob die Dinger überhaupt noch unterstützt werden...
     
  14. André

    André Foren-Capo Administrator

    Beiträge:
    43.800
    Likes:
    2.730
    Hab ich letztens auch einen gefunden! ^^

    We ging das nochmal, da musste man so ne Nummer anrufen und den Text auf ein Band sprechen und der wurde dann umgewandelt und als SMS auf den Scall verschickt oder? :gruebel: :zahnluec:
     
  15. Junker

    Junker Altborusse

    Beiträge:
    3.901
    Likes:
    55
    @ schröder ich bin halt manchmal ein Plappermaul:zwinker:
     
  16. Ilai

    Ilai Well-Known Member

    Beiträge:
    1.362
    Likes:
    1
    der Scall konnte nur Rückrufnummern anzeigen - man konnte entweder auf eine Voicebox sprechen, oder eine Rückrufnumemr ansagen oder eintippen. Wenn die Voicebox benutzt wurde, bekam man die Abrufnummer der Voicebox angezeigt.

    Bevor Mobilfunk dermassen verbreitet war wie heute, waren die Dinger mal echt nützlich.
     
  17. André

    André Foren-Capo Administrator

    Beiträge:
    43.800
    Likes:
    2.730
    Sag bloß Du hast ein Handy! :suspekt: :zahnluec:

    Ne aber wenn ich mal fpür den Notfall Deine Nummer mal hätte wäre das nicht schlecht! :zwinker:

    Ich schicke Dir auch keine versauten SMS! :zahnluec:
     
  18. Ilai

    Ilai Well-Known Member

    Beiträge:
    1.362
    Likes:
    1
    ne, ich hab' kein Handy - aber ich werde berufsbedingt wohl nicht länger drum rum kommen, mir eins zulegen zu müssen :-/
     
  19. André

    André Foren-Capo Administrator

    Beiträge:
    43.800
    Likes:
    2.730
    Freut mich zu hören! :floet: :zahnluec:
     
  20. faceman

    faceman Europapokal-Tippspielsieger 2015

    Beiträge:
    15.459
    Likes:
    986
    Nee, für alles simma nicht verantwortlich.:zahnluec:
     
  21. Pascal12

    Pascal12 ______

    Beiträge:
    2.200
    Likes:
    2
    Wars letztes mal nicht so, dass wir garnichtmehr aufn Server connecten konnten? weder FTP noch Shell noch sonst irgendwas? :gruebel: Hmm naja ich weiß das jetzt garnich mehr so genau... habs schon verdrängt und bin froh, dass es wieder läuft :fress:
    Aber als die von ngz meinten, dass die Festplatte kaputt sei, dachte ich sofort daran , dass durch den plötzlichen Stromausfall Pakete auf der SWAP-Partition kaputt gegangen sind... was ja bei linux vorkommt wenn plötzlich der Strom weg is...
     
  22. André

    André Foren-Capo Administrator

    Beiträge:
    43.800
    Likes:
    2.730
    Ob wir Zugang hatten weiß ich auch schon nicht mehr. Auf jeden Fall meine ich war es der gleiche Datenbankfehler. Weißzwar nicht ob es jetzt auch line 29 war aber davor das mit dem fetch da kann ich mich dran erinnern!
     
  23. ammian

    ammian Tribünenhocker

    Beiträge:
    200
    Likes:
    0
    Warte mal auf heute Abend, da wird der Hals bestimmt noch dicker!:auslach: :huhu:
     
  24. Ilai

    Ilai Well-Known Member

    Beiträge:
    1.362
    Likes:
    1
    Also die Swap Partition ist eigentlich egal, wenn die zersägt wurde. So lange die Swap Signatur nicht odifiziert wurde, und das wird sie im Betrieb nicht, sondern wird nur einmalig beim Initiieren der Swap Partition angelegt.
    Die Swap Partition kann man vor jedem Boot auch mit Datenmüll füllen, das kümert nicht.

    Das Problem ist folgendes:
    Kein Datenträger der Welt ist derzeit in der Lage, Daten sicher zu speichern, wenn wäöhrend des Speichervorgangs die Energiezufuhr momentan gekappt wird. Workarounds sind Journaling Dateisysteme, aber auch die können das nur begrenzt kompensieren.
    Journale von Dateisysteen und Journale von DB SErvern, die ihr eigenes Journal haben, kommen sich auch schon gerne mal in's Gehege...



    Da bei der aktuellen Serverbelastung quasi immer geschrieben wird, aber auf jeden Fall immer eine Tabelle der Datenbank schreibbar geöffnet wird, wird das Problem so wie heute morgen gegen 2:00 bei jedem Stromausfall so wie bei jedem harten Reboot über das WI auftreten.
    Einzige Abhilfe wäre eine UPS, die den Server noch sicher runter fahren kann.
    Ich kann aber nicht sagen, ob das in dem RZ möglich ist. Wenn wir uns dort ein Rack mieten, dann geht's natürlich ;-)

    Vielleicht sollten wir auch das standardmässige ReiserFS in ein ext3 umwandeln, da wir die Reiser Features eh nicht benötigen...
     
  25. André

    André Foren-Capo Administrator

    Beiträge:
    43.800
    Likes:
    2.730
    Das Problem das ich sehe ist das ngz derzeit kein Notstromaggregat hat. Klar wenn der Strom weg ist, ist das Forum down.

    Normal kommt das ja nicht so häufig vor das in Deutzschland der Strom ausfällt, aber jetzt gleich 2 mal in einer Wche das gibt mir dann doch zu denken, wenn die Community fast mehr offline als online ist.

    Es gibt 2 Möglichkleiten:

    a. Wir bleiben bei ngz, haben nen günstigen Server und wissen das sie schon am bauen sind. Aber denke mal bis das 1 Megawatt Aggregat steht haben wir März.

    b. Wir suchen uns nen anderen Hoster, mit Notstromaggregat und sind bei Stromausfällen in Zukunft trotzdem online.

    Habe gestern mal durch diverse Serverforen geschaut und überall wurde da Hetzner sehr hervorgehoben. Sie sollen sehr gute Server haben und einen absolut Spitze Support.

    Hetzner Online AG: Root Server

    Der DS 5000 würde mir hier ganz gut gefallen! :fress:

    4 facher Ramspeicher von unserem jetzigen Server und ein doppelt so schneller Prozessor, 1 Terrabyte Traffic (auch für zukünftige Projekte mehr als genug)

    Das einzigste was wir natürlich nicht bräuchten wären 600 GB Festplatte! :suspekt:

    Und die 59 Euro im Monat würden sich ja auch noch irgendwie finanzieren lassen. MIt der Werbung nehmen wir ca. 20 -30 Euro im Monat ein, dann wäre es nicht mehr soviel was noch draufgelegt werden müsste.
     
  26. Ilai

    Ilai Well-Known Member

    Beiträge:
    1.362
    Likes:
    1
    Naja, der Notstrom über eine UPS hinaus bringt nur dann etwas, wenn das gesamte Routing per Notstrom versorgt wird - bis zu mir sind das immerhin 11 HOPs.

    Und ich bin absolut gegen noch mehr Werbung - mich nervt schon das, was schon da ist viel zu sehr.
     
  27. André

    André Foren-Capo Administrator

    Beiträge:
    43.800
    Likes:
    2.730
    11 HOP´s?
    Hab gar nichts von mehr Werbung gesagt? Hab ich auch nicht unbedingt vor! :huhu:
     
  28. Ilai

    Ilai Well-Known Member

    Beiträge:
    1.362
    Likes:
    1
    Wenn auch nur einem davon der Saft fehlt, geht sowieso nichts.
    Bei einem großflächigen Stromausfall nicht sehr unwahrscheinlich.


    tatsächlich... aber da kannste mal sehen, wie allergisch ich auf das Mistzeug reagiere ;-)
     
  29. André

    André Foren-Capo Administrator

    Beiträge:
    43.800
    Likes:
    2.730
    Ähm was genau ist denn so ein HOP bzw wozu ist er gut?

    Naja aber sagen wior mal mit Aggregat wären doch z.b.gestern die Server bei ngz gar nicht erst down gegangen oder? :gruebel:
     
  30. Ilai

    Ilai Well-Known Member

    Beiträge:
    1.362
    Likes:
    1
    Ein HOP ist ein Routing Point - und die Router müssen eine in sich geschlossene, ununterbrochene Kette vom Rechner des Users zum Server bilden.

    Zwar ist das Routing i.A. dynamisch, aber bei einem großflächigen Stromausfall ist es trotzdem fraglich, ob das ausreicht. Die Konzeption des "no single point of failure" ist zwar schön und gut, aber klappt nur mit Punkten, nicht mit Arealen.

    Der Server selber wäre zwar nicht runter gefahren worden, aber er wäre ebenfalls nicht erreichbar gewesen. Das Traceroute klemmte gestern schon viel früher, bis in's NGZ RZ kam man schon gar nicht mehr.

    Daher hätte ein sauberes Runterfahren über eine kleine UPS in dem Fall wesentlich mehr Sinn gemacht.
     
  31. André

    André Foren-Capo Administrator

    Beiträge:
    43.800
    Likes:
    2.730
    Und was ist UPs? Können wir das selbst einrichten oder müsste das vom Hosterübernommen werden?

    Zum aktuellen Server, stellenweise braucht derheute bei mir extrem lange bis die Seite lädt, meinst Du das hängt mit der Tatsache zusammen das der Server noch nicht rchtig konfiguriert bzw optimiert ist oder meinst Du das liegt tatsächlich an dem Betrieb der hier die letzten Tage herrscht?

    Was sagste denn zum Hetzner Angebot? :gruebel: