Anonim

זה התחיל בערב שבת כשאשתי שאלה מדוע ה- DVR שלנו פתאום הפסיק לשחק מופע שהיא צופה בו. אמרתי לה שזו כנראה רק תקלה, אבל הייתי מסתכל. אני נכנס לחדר המשפחה להסתכל, והשגיאה בעצם הצהירה שהדיסק הבסיסי כבר לא היה זמין. לא טוב! זו הייתה ההתחלה של סיפור האימה שלי לשלושה ימים …

מעט רקע

ה- DVR שלי הוא למעשה רק תוכנה מיוחדת (SageTV למי שסקרן) הפועלת במחשב. התוכנה מאוד גמישה ומאפשרת לך להפריד בין כל ההיבטים השונים בה. יש לי מכונה נפרדת לבקרה ריכוזית, תזמון והקלטה, מכונות נפרדות להפעלה, וכוכב הסיפור הזה, מכונה נפרדת לאחסון. לצורך אחסון אני משתמש בשרת קבצים של לינוקס, ומשתמש ב- LVM (מנהל אמצעי אחסון לוגיים) לצורך צבירת כוננים נפרדים רבים שאינם זהים לכונן אחד לוגי גדול (~ 6TB נכון לעכשיו) שמערכת ההפעלה רואה. מכיוון שגיבוי ריבוי של TB של נתונים אינו מעשי, ומכיוון שהנתונים האמורים הם "רק" תכניות טלוויזיה, פילוסופיית הגיבוי שלי לכך תמיד הייתה פשוט לא אכפת לי. עד לאירועים האחרונים, פילוסופיה זו לא נבחנה על ידי אירוע בעולם האמיתי.

ניסיון לשחזר את הנתונים

כשראיתי את השגיאה ב- DVR, אני מייד מתחיל להסתכל על שרת האחסון. מערכת הקבצים איטית להפליא ואיטית להגיב, ולכן אני שואל את LVM לגבי מצב הכוננים הפיזיים העומדים בבסיס הנפח הלוגי שלה. לאחר עיכוב ארוך הוא עולה ואומר כי חסר כונן של 750 GB. או - או! אני מפעיל מחדש את השרת ובאופן מדהים, הכונן חוזר. אני מוציא פקודה pvmove להעברה אוטומטית של כל הנתונים מהכונן הזה, אך זה נכשל בפחות מ -2% השלמה.

מול כונן שאינו משתף פעולה בקשר לקריאת הנתונים שלו, אך לפחות מופיע ב- BIOS, אני פונה לכלי לשחזור הכונן האהוב עלי, Spinrite. למרות ש Spinrite בדרך כלל מגפיים ממדיה נשלפת, לפני שנים הקמתי אתחול הרשת בביתי עבור כלי עזר שונים, כך שלא הייתי צריך לדאוג לעקוב אחר מדיה כלשהי. בדרך כלל אני פשוט מתחבר לרשת שלי, בוחר אתחול מהרשת ויש לי מגוון כלים לרשותי כדי לפתור בעיות רבות. הבעיה היא שהמכונה שגורמת לכל עבודת הקסם הזו היא אותה מכונה שנמצאת כרגע למטה. לא אומר שום דבר גדול, אני פשוט אתחיל מתקליטור ספינריט. פרט לשנתיים הכונן האופטי בשרת הקבצים שלי ויתר על רוח הרפאים. בזמן שקרה החלטתי מכיוון שלעולם לא אשתמש במדיה אופטית במכונה ההיא, לא הייתי צריך להחליף אותה. אל תדאג, אמרתי לעצמי, אני פשוט אוציא את הכונן האופטי מהמחשב הראשי שלי. אני מכבה את המחשב הראשי ומוציא את הכונן האופטי. ואז אני מחפש את תקליטור האתחול של Spinrite. לא מוצאים את זה! עברנו לגור בבית חדש לפני מספר חודשים, אז הכל במעט אי סדר. אני חושב שאני פשוט ישרוף עותק חדש, אבל אני אפילו לא יכול למצוא שום מדיה אופטית ריקה! לתוכנית הבאה, כונן הבזק לאתחל! אחרי כמה דקות בגוגל כדי לרענן את הזיכרון שלי, יש לי כונן הבזק מסוג Spinrite שניתן לאתחל. אני מאתחל את תיבת הלינוקס שלי מזה ומשגר את Spinrite. המחשב קופא ונראה שהוא קורס. מבקש לחסל משתנים, אני מעביר את הכונן הגרוע מחיבור לכרטיס הרחבה של PCI-e לחיבור ישיר ללוח האם. כעת Spinrite משיקה בסדר, אך לוקח גילאים וגילאים למנות את הכוננים המחוברים אליו. אני מנתק באופן שיטתי את כל הכוננים האחרים למעט הכונן, אך הוא אף פעם לא מסיים למנות כוננים, לא משנה כמה זמן אני מחכה. אל התוכנית הבאה! אני מוציא את הכונן מתיבת לינוקס שלי, מחבר אותו למחשב הראשי שלי ומתאגר מכונן הבזק החדש והמבריק של ה- Spinrite. Spinrite משגר ורואה את הכונן מייד, ואני אומר לו להתחיל לשחזר נתונים, מרוצה שאני סוף סוף מתקדם. אני חוזר לבדוק את זה אחרי אולי 10 דקות, ושגיאה על המסך ונראה שהכונן נעלם שוב. מתוסכל, אני מנסה עוד כמה פעמים, ואומר לספינרייט להתחיל בחלקים השונים של הכונן, אבל להשיג את אותה התוצאה בכל פעם. נראה שזה לא יעזור לי אחרי הכל.

בהתקף של תקווה לא הגיונית, החזרתי את הכונן לקופסת לינוקס שלי וכוח אותו. לתדהמתי, הכונן מופיע ו- LVM מביא את כל הפעילים. בהמשך לנסות את מזלי, אני מנפק פקודה נוספת ל- pvmove לנסות להעביר את הנתונים מהכונן שוב. בשלב מוקדם אני רואה הודעות שגיאה על כך שלא יכולתי לקרוא מהכונן, אך באופן מדהים, ה- pvmove ממשיך להתקדם, מתקרב וקרוב יותר ל 100% הושלמו. תערובת של בלבול, הקלה והתרגשות שוטפת אותי. האם אני מתכוון להתרחק מזה ללא פגע? למרבה הצער, הדבר האחרון ש- LVM עושה תחת הכיסויים כדי לסיים בצורה נקייה את ה- pvmove הוא לכתוב יומן מעודכן לכל הכוננים שבשליטתו. זה כמובן נכשל כאשר הוא מנסה לכתוב לכונן הרע, וכך הוא מבטל את כל התהליך. התבוסה חטפה מלסתות הניצחון שוב! אני צולל בחזרה לגוגל ומגלה שאפשר לשלוט בכמה נתונים הפקודה pvmove עוברת במקום להזיז את כל הנתונים בצילום אחד. אני מתנסה בזה והצלחה טובה בהעברת חלק זעיר מהנתונים שלי בכל פעם. אני מקבל תאוות בצע והכונן נעלם כמה פעמים, אבל תמיד חוזר אחרי מחזור כוח של המחשב. בתיאוריה שאולי רק חלקים מסוימים מהכונן גרועים, אני מתחיל לקפוץ במקום לעבוד על תחילת הכונן. לאחר מספר איטרציות של זה, יש לי את כל אלה מלבד 40 ג'יגה-בייט מתוך 750 ג'יגה-בייט מחוץ לכונן. במשך 40 GB הנותרים, הוא לא הצליח לעבור לא משנה מה ניסיתי. עכשיו היה יום ראשון בערב והייתי מותש, אז החלטתי ללכת לישון ולהתמודד עם הבעיה הזו יותר למחרת.

למחרת, אחרי קצת שינה והמחצית הראשונה של היום שלי בעבודה, אני מחליט פשוט לנשוך את הכדור כי לא היה אכפת לי מהארבעים GB של תוכניות הטלוויזיה המוקלטות, ומתכוון להסיר את הכונן מתצורת LVM שלי . עשיתי זאת פעמים רבות בעבר, כך שזה הולך די בצורה חלקה. הבא ברשימת הניקיון הוא תיקון החור באמצע מערכת הקבצים. אני חושב שרק 40 ג'יגה-בייט במקום 750 ג'יגה-בייט חסר זה לא יכול להיות חבל, נכון? לא בסדר! לאחר התיקון היה לי שטח פנוי נוסף של 900 ג'יגה-בייט בהשוואה לפני תחילת הטקס, כך שנעקץ לא מעט. נו טוב, אני אומר לעצמי, זה היה בסך הכל טלוויזיה. ה- DVR שלי סוף סוף מתפקד שוב לאחר הפוגה של שלושה ימים, ואני סוף סוף אוכל להפסיק לחשוב על זה עם כל מחזור מוח רזרבי.

לקחים

אז מה למדתי מכל זה? הייתי צריך לעשות עבודה טובה יותר ממה שחשוב באמת. זה קרה לפני מספר שבועות, ובאותה תקופה אפילו לא התגעגעתי לאף אחד מתכני הטלוויזיה שנעלמו. עם זאת, אני מצטער על כך שמנעתי מעצמי, אך חשוב מכך, את משפחתי, להיות מסוגל להשתמש בטלוויזיה במשך שלושה ימים, ולהכניס את עצמי למצב משבר עם לחץ גבוה במשך שלושת הימים האלה. אם הייתי מוותר על שחזור הנתונים שלי בהתחלה, הפונקציה הייתה משוחזרת תוך כשעה ולא שלושה ימים. אני יודע טוב מדי שרוב הזמן הנתונים שלנו יקרים, אבל במצב זה הם לא היו.

שנית, אם הנתונים שלך באמת יקרים, ו 99% מהזמן שהם באמת, אתה צריך להגן עליהם! גבה את הנתונים שלך, אין תירוצים. לנתונים שלי שאין להם תחליף, כמו אלפי תמונות של בני שיש לי במחשב שלי, אני דואג לגבות אותם בלא פחות משלושה מקומות, אחד מהם הוא ספק גיבוי בענן. באשר לאחסון ה- DVR, אני עדיין לא חושב שזה מעשי לגבות אותו לענן, אבל עם מחיר הכוננים בימינו, אין לי שום תירוץ שלא מוגן על ידי RAID, וזה בדיוק מה שאני הולך לעשות. כאשר הקמתי את אשכול האחסון שלי לראשונה לפני שנים, אני חושב שלקח לי 10 כוננים ומעלה כדי להגיע לבריכה של מספר רב של שחפת. רק בדקתי את המחירים, ותוכלו לרכוש כונן של 3 TB עכשיו, מתחת ל 100 $. פשוט אין לי שום תירוץ להשאיר את הנתונים שלי ללא הגנה, ואם אובדן נתונים כזה קורה לי שוב, זו באמת אשמתי שלי.

סיפור של עצב, תסכול ואובדן נתונים