this post was submitted on 27 Apr 2025
38 points (97.5% liked)

Support

202 readers
24 users here now

Retrouvez-nous sur : https://matrix.to/#/#jlai.lu:matrix.org

Une question technique concernant lemmy ? Un problème de compréhension du fonctionnement ?

C'est l'endroit pour vous !

Nos tutos :

founded 2 years ago
MODERATORS
 

Bonjour à tous,

suite à des problèmes d'instabilité, venant d'une utilisation à 100% du disque et à un alerting qui ne fonctionnait malheureusement plus, j'ai été obligé de mettre l'instance offline pour une durée d'environ 48h de manière soudaine et impromptue.

L'instance fonctionne dorénavant avec un stockage d'images sur s3, un service tiers géré par Wasabi, au lieu d'un stockage sur le serveur lui même.

Après une phase de vérification que tout re-fonctionne, je procéderais dans la foulée à la MAJ de l'instance vers la dernière version d'ici quelques heures.

--

Pour le post mortem à destination de ceux que ça intéresse :

Lemmy stocke par défaut les miniatures et images fédérées via toutes les instances en local.

À la création de l'instance, la place donnée par les créateurs de lemmy nécessaire au bon fonctionnement d'une instance était aux alentours de 40gb.

À partir de cette information, j'ai dimensionné l'instance avec ce qu'on peut considérer être un petit disque, mais en RAID pour pouvoir être plus rapide, d'une taille d'environ 500gb, donnant tout de même une marge de x10 par rapport aux specs demandées.

Il s'avère qu'avec l'essor de lemmy et sa popularité, le stockage d'image prend maintenant aux alentours des 350gb, pour environ 3 500 000 objets, saturant ainsi l'espace disque et rendant l'instance instable.

Ceci arrivant bien évidemment la veille de mes vacances loin de chez moi, j'ai tenté de faire un peu de place avant de partir, mais cela n'a pas été suffisant.

Afin de pouvoir avoir un peu de marge de manœuvre à mon retour, j'ai dû faire encore une fois le ménage et tout couper pour garder de l'espace pour pouvoir tout simplement faire quoi que ce soit sur l'instance.

L'opération principale étant la migration de toutes ces images gérées par le service pict-rs de lemmy du disque vers un service cloud, qui a été très laborieux, la version de pict-rs utilisée étant complètement cassée au niveau de la migration.

J'ai donc dû mettre à jour la version de pict-rs et la migration s'est ensuite, a priori, passée sans plus de problème.

Maintenant que l'opération pompier est terminée, je vais profiter des différents ponts pour mettre en place des alertes qui fonctionnent mieux, et tenter de fiabiliser un peu plus l'instance.

-- MAJ du 27/04 à 16h33

La migration vers la version 0.19.11 est maintenant faite, n'hésitez pas à remonter tout problème.

you are viewing a single comment's thread
view the rest of the comments
[–] [email protected] 4 points 2 days ago (3 children)

Merci pour le travail et les infos !

Question : Y a-t-il un endroit où on peut savoir ce qu'il se passe quand l'instance est down ? Parce qu'en l'absence d'info je suis allé sur Reddit, j'ai posté sur r/askfrance pour juste demander si quelqu'un savait quelque chose, et un modérateur m'a ~~aimablement~~ répondu qu'il n'était pas là pour faire votre maintenance et a supprimé mon post 😮‍💨

[–] [email protected] 2 points 2 days ago* (last edited 2 days ago) (2 children)

un modérateur m'a ~~aimablement~~ répondu qu'il n'était pas là pour faire votre maintenance et a supprimé mon post 😮‍💨

C’est pas bien mais ça m’a fait rire 😅

Outre le [email protected] il y a Matrix, @[email protected] est en train de faire un truc qui rassemble les instances lemmy/piefed francophones, il communiquera quand ce sera prêt. Mais c’est probablement le meilleur endroit pour avoir une info en "temps réel"

[–] [email protected] 2 points 2 days ago

C'est prêt. Il ne manque plus grand chose. J'ai fais une réorganisation de l'espace matrix :)

[–] [email protected] 1 points 2 days ago

Merci pour les infos ! 😄

[–] [email protected] 1 points 2 days ago* (last edited 2 days ago)

Mince...désolé pour la mésaventure...c'est pour cela qu'on recommande d'avoir un alt pour suivre la commu de secour sur sh.itjust.works

Nous avons aussi un espace matrix pour discuter :)

https://matrix.to/#/#forumversefr:matrix.org

[–] [email protected] 0 points 2 days ago (1 children)
[–] [email protected] 0 points 2 days ago* (last edited 2 days ago) (1 children)

Ça pourrait peut-être être ajouté sur la page d'accueil quand l'instance est indisponible.

[–] [email protected] 2 points 2 days ago

Ouaip ça a été discuté, avoir les liens qui vont bien sur la page d’erreur ou de maintenance.

Ceci dit ça ne fonctionne que si on va directement sur le site jlai.lu, avec une application lemmy tierce il n’y aura pas l’information.