Tag Archives: Maintenance

Partially restricted operation / most services available

As a result of a chain of technical failures of old equipment already scheduled for replacement, there are currently certain limitations in the services provided to members of the CAcert community. We regret this terribly.

  • bugs.cacert.org ?Bug management: normal operation
  • community.cacert.org ?Service hub: normal operation
  • irc.cacert.org ?IRC: normal operation
  • secure.cacert.org ?reduced service
  • selfservice.cacert.org ?password reset: normal operation
  • webmail.cacert.org ?webmail: normal operation
  • wiki.cacert.org ?wiki/help centre: normal operation
  • www.cacert.org ?main page: reduced service

Mid september, we discovered that a partition contained a corrupt file system. A
subsequent hardware test showed that one of the hard drives was reporting hardware errors. In order to be able to continue using the system, we have moved this partition to a second drive.

Since the end of september the system no longer responds. We suspect that other partitions are defective. Neither web access nor SSH access work, so the only way to find the error can only be analysed in more detail by a visit to our data centre.
In order to still be able to offer as many services as possible to the CAcert community until the repair, we redirected the connections for www.cacert.org and secure.cacert.org in the incoming firewall to the second system. As a result of ongoing hardware renewal, however, this fall-back level is not quite complete: There is no working signer and no up-to-date copy of the CAcert database attached to this system.

That is, why the main page can be used as a start for informing our users about the blog for now, while certificate issuing and WoT access has to be postponed until our technical volunteers have made the several-hour trip to the data centre for troubleshooting. As they are doing this in their spare time and at their own expense, we are very grateful to these volunteers that they will probably be able to do this in mid-October.

If you would like to know what you can do yourself to ensure that such interruptions occur less frequently and are resolved more quickly, read this!

DEUTSCH: Infolge einer kaskadierten technischen Störung sind zur Zeit leider nicht alle Dienstleistungen übers Netz abrufbar. Alle Fernwartschritte haben unsere technischen Freiwilligen bereits unternommen. Bis zu einen Vororteinsatz im Rechenzentrum im Ausland voraussichtlich Mitte Oktober ist der Zugriff auf den Signer und die Datenbank nicht möglich. Wir bedauern dies sehr. Was Sie tun können, um solche Ausfallzeiten künftig zu verringern, lesen Sie hier!

FRANÇAIS: Suite à une panne technique en cascade, tous les services ne sont malheureusement pas accessibles en ligne pour le moment. Toutes les démarches de télémaintenance ont déjà été effectuées par nos volontaires techniques. L’accès au Signer et à la base de données est impossible jusqu’à une intervention sur place dans le centre de calcul à l’étranger, probablement mi-octobre. Nous le regrettons vivement. Vous pouvez lire ici ce que vous pouvez faire pour réduire ces temps d’arrêt à l’avenir!

PORTUGUÊS: Devido a uma falha técnica em cascata, infelizmente nem todos os serviços estão disponíveis pela rede no momento. Todas as medidas de manutenção remota já foram tomadas por nossos voluntários técnicos. O acesso ao signatário e ao banco de dados não será possível até uma visita no local ao centro de dados no exterior, provavelmente em meados de outubro. Lamentamos muito o ocorrido. Leia aqui o que você pode fazer para reduzir esses períodos de inatividade no futuro!

ESPAÑOL: Debido a un fallo técnico en cascada, lamentablemente no todos los servicios están disponibles actualmente a través de la red. Nuestros voluntarios técnicos ya han tomado todas las medidas de mantenimiento a distancia. El acceso al firmante y a la base de datos no será posible hasta una visita in situ al centro de datos en el extranjero, probablemente a mediados de octubre. Lo lamentamos mucho. Lea aquí lo que puede hacer para reducir estos tiempos de inactividad en el futuro.

Work on new signer in full swing

We recently reported here about a signer malfunction in our data centre in the Netherlands. Usually, our systems are redundant for such cases. This spring, the second disk was removed for repair due to an other malfunction that could not be resolved remotely. A small team of our volunteer engineers is working flat out to rebuild the server locally in Germany.

Then it can be brought to the data centre on the following Friday. If everything goes according to plan by Wednesday, the server in the Netherlands can go online on Friday.

CAcert is run exclusively by volunteers in their spare time. If you would like to help out in one way or another, we recommend subscribing to the relevant mailing lists to get in touch with the current topics and the active players.

Arbeit an neuem Signer läuft auf Hochtouren

Wir haben vor kurzem hier über eine Störung des Signers in unserem Datenzentrum in den Niederlanden berichtet. Üblicherweise sind für solche Fälle unsere Systeme redundant ausgerichtet. In diesem Frühjahr wurde die zweite Platte wegen einer anderen Störung, die sich nur per Fernwartung lösen konnte zur Reparatur entfernt.

Ein kleines Team unserer freiwilligen Ingenieure arbeitet mit Hochdruck daran, den Server lokal in Deutschland nachzubauen. Daraufhin kann er am darauffolgenden Freitag ins Rechenzentrum gebracht werden. Sollte alles bis Mittwoch nach Plan laufen, kann der Server in den Niederlanden am Freitag ins Netz gehen.

CAcert wird ausschliesslich von Freiwilligen in Ihrer Freizeit betrieben. Wenn Sie auf die eine oder andere Art mithelfen möchten, empfehlen wir, die entsprechenden Mailinglisten zu abonnieren, um so mit den aktuellen Themenkreisen und den aktiven Akteuren in Kontakt zu kommen.

Planned maintenance works in Ede

English | Français | Deutsch

An on-site intervention in our datacentre will take place not later than Friday, June 18. The purpose of this intervention is to correct a defect on one of our network equipment, which lowers the redundancy of our infrastructure.

At the same time, it should allow us to diagnose and hopefully resolve without delay a transmission problem between our signing server and the rest of the infrastructure. By June 18, our members will no longer be able to renew their certificates, nor will they be able to make public the revocation of their certificates if necessary.

As always, keep in mind that CAcert is a community of volunteers. Thank you to everyone who helps us! We encourage anyone who would like to do so, or who has done so in the past and not received a response, to offer (or re-offer) their services by contacting our committee members: secretary (at-sign) cacert.org


Travaux planifiés à Ede.
Une intervention sur site dans notre datacenter aura lieu le plustard le vendredi 18 juin. Elle a pour but de corriger un défaut sur un de nos équipements réseau, qui abaisse la redondance de notre infrastructure. Simultanément, elle devrait permettre de diagnostiquer et nous l’espérons résoudre sans délai, un problème de transmission entre notre signer et le reste de l’infrastructure. D’ici le 18 juin, nos membres ne seront plus capables de renouveler leurs certificats, ni de rendre publique la révocation de leurs certificats si nécessaire.

Comme toujours, gardons à l’esprit que CAcert est une communauté de bénévoles. Merci à tout ceux qui nous apportent leur aide ! Nous encourageons tous ceux qui voudraient le faire, ou qui l’ont fait par le passé et n’ont pas reçu de réponse, à proposer (ou reproposer) leurs services en contactant les membres de notre comité: secretary Arobase cacert.org

Dringende Unterhaltsarbeiten
Ein Vor-Ort-Einsatz in unserem Rechenzentrum findet spätestens am Freitag, 18. Juni, statt. Der Zweck dieses Eingriffs ist die Behebung eines Defekts an einem unserer Netzwerkgeräte, der die Redundanz unserer Infrastruktur herabsetzt. Gleichzeitig sollte es uns ermöglichen, ein Übertragungsproblem zwischen unserer Signer und dem Rest der Infrastruktur zu diagnostizieren und hoffentlich ohne Verzögerung zu beheben. Bis voraussichtlich am 18. Juni können unsere Mitglieder ihre Zertifikate nicht mehr erneuern und ggf. die Sperrung ihrer Zertifikate öffentlich machen.

Wie immer sollten wir uns vor Augen halten, dass CAcert eine Gemeinschaft von Freiwilligen ist. Vielen Dank an alle, die uns helfen! Wir ermutigen alle, die dies gerne tun möchten oder dies in der Vergangenheit getan haben und keine Antwort erhalten haben, ihre Dienste anzubieten (oder erneut anzubieten), indem sie sich an unsere Vorstandsmitglieder wenden: secretary Affenschwanz cacert.org

Maintenance / Changes infrastructure

[Update: finished.] I will begin with the work now 2012-04-01 00:00 UTC. Infrastructure e.g. email, wiki, blog, lists will be unavailable during the time. The CAcert website along with all critical systems are not “infrastructure” and will not be affected.

I am planning to work on infrastructure again this weekend (2012-03-31) and downtimes may occur. Our host is low on disk space so I need to do some restructuring. A larger downtime may be involved.

Currently, each virtual host has its own logical volume (LVM). They will be consolidated into one. During the move and resizing I think I will not get around shutting down all infrastructure services.

I will send out a notice before I begin the work.
Sorry for any inconvenience.

—-

I am currently continuing the work until 2012-03-26 07:00 UTC. The following services may be effected (the other services have been migrated already):

  • email
  • lists
  • emailout
  • board
  • translingo

I am working on infrastructure systems. During the next 6 hours the following services may be down as they are moved to another server:

* bugs
* irc
* webmail
* wiki
* email
* cats
* lists
* issue
* emailout

The following services have been shut down:

* dupes
* forum
* logging
* paypal
* test2