| [ERREUR 404] TOUTES NOS EXCUSES ! | |
|
|
Auteur | Message |
---|
Tckt Administrateur
Nombre de messages : 9476 Age : 37 Localisation : Lille Date d'inscription : 02/05/2005
| Sujet: [ERREUR 404] TOUTES NOS EXCUSES ! Jeu 15 Nov - 9:07 | |
| Depuis hier soir vous avez sûrement remarqué que la bannière du forum et le site www.soad-fr.com ne s'affichait plus ! Ce problème est indépendant de notre volonté et nous avons fait le nécessaire auprès de notre hébergeur pour règler le problème au plus vite... En attendant, le forum est toujours accessible et opérationnel pour les news etc ! | |
|
| |
Ignace Choking Chick
Nombre de messages : 386 Age : 36 Localisation : Suisse Date d'inscription : 21/03/2006
| Sujet: Re: [ERREUR 404] TOUTES NOS EXCUSES ! Jeu 15 Nov - 9:41 | |
| depuis hier matin déjà...! J'espère pour vous que ca se réglera rapidement...! | |
|
| |
Tckt Administrateur
Nombre de messages : 9476 Age : 37 Localisation : Lille Date d'inscription : 02/05/2005
| Sujet: Re: [ERREUR 404] TOUTES NOS EXCUSES ! Jeu 15 Nov - 10:22 | |
| Notre Hebergeur OVH.com agit sur les comptes 90 Plan (auquel nous avons souscrit). 95% des sites sont de retours.... Forcément, on est dans les 5%... Et ça a pas l'air joli joli... - Citation :
- La remise en place de vos sites est terminé à 94%. Il nous
reste quelques centaines de sites, suivant les lettres, qui attendent son tour. Parfois nous avons un blocage sur la remise en place d'un site et ceci bloque toute la lettre. Nous sommes en train de reverifier tous les processes de remise en place de vos sites.
En tout, sur 90plan nous avons 16 serveurs de stockage. L'un de ce serveurs de stockage a été touché. Oui il s'agit d'un netapp avec 28 disques où nous avons une tolérance de panne de 2 disques (le serveur fonctionne même s'il a perdu 2 disques et ceci grâce au raid). Dans notre cas, après le reboot du serveur, 3 disques se sont déclarés en panne et le raid a été rendu inopérationel.
Sur ce serveur sont hébergés, nos clients historiques de 90plan à savoir les plus anciens sites de 90plan. En tout environ 10000 sites. Sur ces 10000 sites, nous avons un backup de la semaine sur 1500 sites environ puis des backups de plus en plus anciens jusqu'au mois d'avril où nous avons l'ensemble de 10000 sites.
Le site que nous avons remise en place est la version la plus récente.
Bien sûr nous allons faire un geste commercial.
Il s'agit de la panne la plus grave vécue chez Ovh depuis le démarrage de l'entreprise il y a 8ans. La panne redouté, qui est un cauchemar à prévoir et qu'on espère que jamais ça n'arrivera. Mais ça arrive et c'est là qu'on se doit de montrer ce qu'on a prévu et finalement voir à quel point nous avons été réalistes ou pessimistes lorsque nous avons créé les offres. Jusqu'au maintenant jamais un serveur de stockage n'a rendu l'âme et encore moins un serveur spécialisé dans le stockage. Mais ce sont les choses que nous avons prévu et c'est pourquoi nous avons les backups (on sort les backups quand c'est la cata, et ça ne sert que dans ce cas là) faits à de différents dates. Le vrai problème, en dehors des dates de backup, est le temps de remise en place des sites. Clairement les procédures actuelles même si testées plusieurs fois et prévues, ne donnent pas de satisfaction à la problématique de l'hébergement mutualisé.
Depuis 6-12 mois, nous remettons en cause le stockage actuel et nous travaillons sur les nouvelles solutions de stockage. Notamment pour franchir la barre de plusieurs To de stockage par site. La technologie est déjà en place pour les backups de serveurs dédiés (un système de stockage de plus de 50To). Puis ça viendra pour RPS et enfin le mutu 2008.
Ces technologies sont en train d'être finalisées et déjà en fonctionnement. Quelques principes: - raid-1 sur plusieurs disques (par exemple 8 disques ce qui permet d'avoir le débit de lecture 8 fois supérieure au débit d'écriture) avec une sécurité importante des données (chaque disque a 8 copies). et donc ne plus utiliser de raid-X (logiques), juste raid-1 simple et efficace - le système de snapshot de l'ensemble des sites lié au système de backup externalisé. Sur le nouveau système de stockage, la photo (le snap) de tous les sites est faite à minuit puis nous lançons une copie en stream (bit par bit et non fichiers par fichier) d'un datacentre à l'autre. La remise en place à partir d'un backup est nettement plus rapide. - une structure distribuée. au lieu d'utiliser 1 serveurs de fichier avec plein de disques nous passons sur une structure de plusieurs serveurs de fichiers avec plein de disques chaque. Les raid-1 sont fait entre les disques de différents serveurs et donc si une baie ou une salle d'hébergement tombe, tout continue à fonctionner sur les installations qui sont toujours en place. - la taille de stockage ne sera plus un problème du tout. On parlera en To à partir de mois de janvier. Normalement ça devait rester confidentiel jusqu'au mois de janvier. La panne nous oblige d'être transparent jusqu'au bout.
Cet incident arrive au moment de changement technologiques. On aurait aimé passer ce cap sans des telles histoires et une dégradation de service pour nos clients. Mais ces histoires nous permettront aussi de tirer les bonnes conclusions et avoir une solution de stockage qui répond à des vrais besoins actuels et pour quelques années.
Nous allons faire un update de task dés que tout est remise en place.
Si vous avez des questions et pour aller plus vite, envoyez nous un email directement sur oles@ovh.net, lau@ovh.net, tony@ovh.net qui gèrent directement l'incident. | |
|
| |
Keazou Psycho
Nombre de messages : 310 Age : 35 Localisation : Saint Gratien (95) Date d'inscription : 16/04/2006
| Sujet: Re: [ERREUR 404] TOUTES NOS EXCUSES ! Jeu 15 Nov - 12:04 | |
| En tout cas le site revient petit à petit | |
|
| |
Tckt Administrateur
Nombre de messages : 9476 Age : 37 Localisation : Lille Date d'inscription : 02/05/2005
| Sujet: Re: [ERREUR 404] TOUTES NOS EXCUSES ! Jeu 15 Nov - 12:08 | |
| Revenu, mais toutes les news depuis avril sont effacées... Les boules.
Je fais une restauration du site en attendant... Pour les news, je sais pas ! | |
|
| |
Invité Invité
| Sujet: Re: [ERREUR 404] TOUTES NOS EXCUSES ! Jeu 15 Nov - 12:22 | |
| Ah sorry Ticket je n'avais pas vu le topic ... Erf ça revient en tous cas, patience ^^ |
|
| |
SpiderS_ DDEVIL
Nombre de messages : 517 Age : 33 Localisation : Reims, 51 Date d'inscription : 21/04/2007
| Sujet: Re: [ERREUR 404] TOUTES NOS EXCUSES ! Jeu 15 Nov - 19:18 | |
| - Ticket a écrit:
- Revenu, mais toutes les news depuis avril sont effacées...
Les boules.
Je fais une restauration du site en attendant... Pour les news, je sais pas ! Demande réparation $$$ | |
|
| |
Parencouille Radio/Video
Nombre de messages : 4804 Age : 37 Localisation : 77 seine et marne ! Date d'inscription : 16/05/2005
| Sujet: Re: [ERREUR 404] TOUTES NOS EXCUSES ! Jeu 15 Nov - 19:34 | |
| - SpiderS_ a écrit:
- Ticket a écrit:
- Revenu, mais toutes les news depuis avril sont effacées...
Les boules.
Je fais une restauration du site en attendant... Pour les news, je sais pas ! Demande réparation $$$ - Citation :
- Bien sûr nous allons faire un geste commercial.
Mais je pense que ça ira pas bien loin business is business | |
|
| |
Péo Le Modo d'Amérique
Nombre de messages : 2056 Age : 31 Localisation : Québec Date d'inscription : 19/08/2007
| Sujet: Re: [ERREUR 404] TOUTES NOS EXCUSES ! Jeu 15 Nov - 21:51 | |
| Moi l'image en haut du forum viens de revenir! | |
|
| |
Tckt Administrateur
Nombre de messages : 9476 Age : 37 Localisation : Lille Date d'inscription : 02/05/2005
| Sujet: Re: [ERREUR 404] TOUTES NOS EXCUSES ! Jeu 15 Nov - 21:54 | |
| | |
|
| |
Tckt Administrateur
Nombre de messages : 9476 Age : 37 Localisation : Lille Date d'inscription : 02/05/2005
| Sujet: Re: [ERREUR 404] TOUTES NOS EXCUSES ! Ven 16 Nov - 11:22 | |
| Ovh Semble sérieux et j'apprécie leur transparence, plus d'infos sur le geste commercial en fin de page ! - Citation :
- Bonjour,
Les opérations ont pris fin. Tous les sites sont à nouveau en place et fonctionnent. Nous ne relevons plus des erreurs 404 sur aucun site de 90plan dû à l'incident (il reste encore 11 sites dans l'état 404 mais ce sont les cas particuliers). Nous sommes en train de vérifier TOUS les sites 90plan pour retrouver éventuellement des sites en 404, mais on pense que le chiffre sera proche de 0.
Il est temps d'en tirer des conclusions.
Le principal problème est que nous avons mis un temps fou pour remettre le backup de vos sites en place. La panne pour certains sites a été de 2-3 heures (dans la nuit de l'incident) jusqu'à il y a moins d'1h soit environ 36h. C'est beaucoup trop lent et donc la remise en place des données à partir de backup n'est pas du tout adaptée à nos besoins. Mais comme c'est la première fois en 8 ans que nous avons dû chercher les backups pour remettre une partie des installations en place, la question reste ouverte: comment réduire le temps de la panne lorsqu'il y a une destruction des données ? C'est évidement mieux d'avoir un système qui ne tombe pas en panne dans sa globalité (il faut savoir que c'est déjà le cas, sauf cet incident, car on change environ 4 disques par semaine sur nos systèmes de stockage en mutualisé, c'est un fonctionnement habituel), mais malgré tout la destruction peut arriver. Cette problématique de la remise en place de backup d'avoir une bonne réponse avec les technologies que nous sommes en train de mettre au point. A cause de l'incident, nous vous devons de la transparence et vous rassurer sur nos travaux en cours et voici ce qu'on devait vous dire/annoncer dans un mois: depuis 6-12 mois, nous travaillons avec Sun et son système d'exploitation Solaris/OpenSolaris pour mettre au point de structures de stockage de plusieurs centaines de To sur un filesystem de Sun ZFS. Il s'agit des baies complètes de disques qui fonctionnent ensemble et à haute vitesse en RAID-1 (plusieurs copies de disques en parallèle). Ces technologies fonctionnent déjà en backup de l'hébergement dédié avec 50To de données distribués sur plusieurs dizaines de serveurs. Nous avons encore besoins d'un peu de temps pour débugger quelques fonctionnalités de Solaris et Opensolaris avec d'autres technologies mais surtout améliorer les performances du code lors des basculements fail-over (le code source de Solaris est disponible, ça aide). Ceci nous permettra proposer RPS 2008 puis adapter encore ces technologies à l'hébergement mutualisé (on veut par exemple éviter d'utiliser NFS mais d'avoir un accès simultanée sur les données à partir de plusieurs serveurs ... oui c'est possible, on y travaille) En conclusion sur ce point: nous pensons disposer d'une excellente technologie de backup qui, en cas d'une destruction de données, permet remettre le backup en place en minimum de temps.
Le problème de backup qui sont plus ou moins anciens rejoint le premier point dans la mesure où le backup n'est jamais à jour. En améliorant la vitesse de backup (création d'une image de vos sites et la remise en place de l'image de vos sites) nous allons réduire les préjudices sans jamais atteindre la perfection. En effet, entre les clients qui nous disent "oui le site marche mais je l'ai mis à jour Lundi et le backup est de Lundi soir" et les clients qui nous disent "oui le site marche mais il date de mois de septembre ou le mois d'avril", la problématique reste la même (dans l'absolue), même si c'est mieux d'avoir le backup de Lundi que de mois d'avril. On peut aussi dire que dans l'absolue le backup (peu importe lequel) a été remis en place et le site fonctionne donc tout va bien. A ce niveau là, la solution n'est pas évidente à trouver puisque tout dépend du type de site, des technos qu'il utilise (le sql n'a pas été touché par la panne et donc si vous avez un site full dynamique il remarche sans problème) mais aussi du prix de backup et son rafraîchissement. Même si nous cherchons la perfection et un idéal, il faut garder à l'esprit un compromis entre le prix de l'hébergement par mois (moins de 4euro HT/mois pour 90plan) et les services de cet hébergement. Ce compromis n'est jamais simple à trouver: certains clients préfèrent beaucoup d'espace, mais lent avec de sécurité, d'autres préfèrent peu d'espace mais ultra rapide, avec une sécurité optimales mais sans plus ou d'autres la sécurité très très importante sans la recherche de performance. Nous allons mettre plus en avant les caractérises qui vous intéressent et donner le choix. En effet, proposer une seule offre généraliste pour répondre à autant des besoins n'est pas réaliste. Par contre l'un de paramètre n'entre pas dans le compris: la sécurité de vos données. Le client qui est prêt à perdre les données n'existe pas. Soyez rassuré: on le savait déjà.
Cette panne nous a permit de voir que la meilleure manière de faire les backups des installations n'est pas d'utiliser toujours le même serveur de backup mais de faire tourner les serveurs de backup. Ainsi, même si le serveur de backup est mort (comme c'était le cas la semaine passée), il faut disposer des autres backups et donc utiliser les serveurs de backup à tour de rôle.
Le geste commercial. Nous proposons à nos clients le geste commercial sur 2 niveaux: 1.) pour le temps de la remise en route du site, le temps que nous avons mis à remettre vos données sur nos serveurs de fichier 2.) le rafraîchissement du backup que nous avons mis en place sur vos site
Pour le 1.), nous appliquons le SLA, à savoir nous avons droit à une panne de 43minutes par mois (99.9% de disponibilité). Au delà, vous avez droit à des jours gratuits allant jusqu'au mois gratuit. C'est le contrat. On l'applique. Par contre, nous allons faire simple: si vous avez subit plus que 43 minutes de panne, vous avez droit directement au mois gratuit.
Pour le 2.), le contrat ne dit rien à ce sujet. Au contraire il dit que le client doit maintenir le backup de son site. Par contre, il nous est impossible de faire comme si de rien n'était sur ce point là. Après des discutions en interne, nous avons estimé que 3 mois gratuits était la proposition la moins pire.
Sous 2 jours, nous allons vous proposer un PDF à telecharger et il suffira mettre votre nom de domaines pour faire jouer le point 1.) et 2.) puis nous l'envoyer. Les montants ne sont pas forcement importants mais sont proportionnels à ce que nous vous facturons. Dans l'absolue, il faut oublier ces montants et nous envoyer ce PDF. Car pour nous c'est une manière de dire que nous reconnaissons le problème et que, vous, vous avez des droits. Ni l'un ni l'autre n'est pas discutable. Et c'est le but de ce geste commercial.
Encore une fois nous sommes désolés pour cette contre performance. Soyez rassuré: nous allons bosser dur pour enlever cette tache ... et dans peu de temps, nous allons revenir vers vous avec le mutu 2008 opérationnel (au lieu d'un long email).
Amicalement Octave | |
|
| |
Jo' Maître Capello Déchu
Nombre de messages : 6949 Age : 36 Localisation : Lille Date d'inscription : 16/05/2005
| Sujet: Re: [ERREUR 404] TOUTES NOS EXCUSES ! Ven 16 Nov - 11:57 | |
| En effet, ils sont bien réglos ! Voire carrement sympa "bon pour ça on va pas chipoter on vous met le mois gratuit", en gros ^^
Beau geste commercial ! | |
|
| |
Contenu sponsorisé
| Sujet: Re: [ERREUR 404] TOUTES NOS EXCUSES ! | |
| |
|
| |
| [ERREUR 404] TOUTES NOS EXCUSES ! | |
|