ניתוח השרדות מתוקן לנטיות (propensity-adjusted survival analysis)
מהו ניתוח השרדות מתוקן לנטיות (propensity-adjusted survival analysis)?
ניתוח השרדות נועד לחקירת הקשר בין משתנה זמן להתרחשות של אירוע. זהו ניתוח אופייני בתחום הרפואה ומשמש לבדיקת הזמן עד לאירועים כמו התפרצות מחלה או מוות. משך הזמן נקרא בדרך-כלל זמן הכשל, או אורך החיים, והאירוע עצמו נקרא כשל. ניתוח השרדות מתוקן לנטיות הוא סוג של ניתוח השרדות הבוחן את היחס בין משתנה זמן להתרחשותו של אירוע תוך התחשבות בנטיות הנבדקים (Propensity).
נעשה שימוש בניתוח זה כשאנו מעוניינים להשוות את הסיכוי להתרחשות של אירוע תוך התחשבות במאפיינים היחודיים של כל אחת מהאוכלוסיות או קבוצות הניסוי, במקרים בהם לא ניתן להניח כי אין הבדלים בתנאי הניסוי – למשל, במחקרים בהם אין חלוקה רנדומלית של נבדקים בין קבוצות.
זו הסיבה שניתוח זה נפוץ בתחום הרפואה, כאשר עשויות להיות סוגיות אתיות או קשיים טכניים בחלוקה רנדומאלית של הנבדקים. למשל, כאשר בוחנים יעילות של טיפול מסוים בדחיית התפרצות מחלה (הכשל) כאשר קבלת הטיפול התבצעה לפי קבוצות של טיפולים ממאפיינים שונים, כמו גיל, מגדר או שלב המחלה.
לדוגמה, במחקר מסוים נבדק הקשר בין זמן תחילת הטיפול במחלה מרגע ההתפרצות הראשונה ועד הופעתה של התפרצות שניה. נרצה לנתח את הקשר בין הזמן שנדרש להתחלת הטיפול (אורך החיים) עד להתפרצות החוזרת (הכשל) תוך התחשבות בגיל המטופלים ובמגדר (נטיות הנבדקים).
כיצד נבצע ניתוח השרדות מתוקן לנטיות?
ניתוח השרדות מתוקן לנטיות מתבצע בשני שלבים.
בשלב הראשון יש לקבוע את ציוני הנטיה (prospenity score). זהו השלב בו נערכת בחירת המשתנים הבלתי-תלויים הרלוונטים לקביעת ציוני הנטיה של הנבדקים.
שלב זה נעשה בעיקר על בסיס שיקולים תיאורטיים ומחקרים קודמים המצביעים על החשיבות של משתנים מסוימים על זמן הכשל.
בדוגמה שלנו, המשתנים הבלתי-תלויים בהם בחרנו הם גיל ומגדר המטופל.
לאחר בחירת המשתנים נבצע רגרסיה לוגיסטית בינארית ונשמור את ציוני ההסתברות עבור כל מקרה.
יש לשים לב שהמשתנה המנובא הוא בינארי (בעל שתי קטגוריות, לרוב 0 או 1). במידה והמשתנה המנובא הוא רציף – נרצה לקדד אותו כבינארי, למשל, התרחש (1) או לא התרחש (0).
בדוגמה הזו נקודד את המשתנה המנבא לפי התפרצות מחלה לאחר 120 ימים. במידה והתפרצה – יקבל ציון 1 ובמידה ולא התפרצה – יקבל ציון 0.
לביצוע רגרסיה לוגיסטית יש לבחור בתפריט ה-SPSS:
Analyze -> Regression -> Binary Logistic
בחלון הבא נכניס את המשתנה התלוי תחת Dependent ואת שני המשתנים הבלתי-תלויים תחת Covariates.
לאחר מכן נלחץ על כפתור Save.
בחלון הבא שיפתח נסמן את התיבה Probabilities ונלחץ על Continue.
בחלון הרגרסיה נלחץ על OK.
נתוני ההטיה נשמרו בצורת משתנה חדש ששמו PRE_1. משתנה זה מייצג את ההסתברות של כל מקרה להכלל בקטגוריה שקיבלה את ערך 1 של המשתנה התלוי – כלומר, את ההסתברות עבור כל מטופל ומטופל להתפרצות מחלה תוך 120 ימים. זהו ציון ההטיה בו אנו מעוניינים.
בשלב השני נבצע את ניתוח ההשרדות.
בכדי לבצע את ניתוח ההשרדות מתוקן להטיות ב-SPSS נבצע ניתוח מסוג Cox Regression.
נבחר:
Analyze -> Survival -> Cox Regression
נכניס את משתנה הזמן לתיבת Time.
את המשתנה התלוי נכניס לתיבת ה-Status, ואת המשתנים הבלתי-תלויים ואת ציוני ההטיה נכניס לתיבת Covariate.
בדוגמה שלנו, משתנה הזמן הוא הזמן שעבר בין הופעת המחלה לתחילת הטיפול. המשתנה התלוי הוא הופעתה של התפרצות שניה תוך 120 ימים, ואילו המשתנים הבלתי-תלויים הם גיל ומגדר המטופל.
נלחץ על Define events.
בחלון זה נגדיר את האופן בו מקודד המשתנה התלוי.
כאשר המשתנה התלוי הוא משתנה בינארי, נבחר באפשרות Single value ונציין את קידוד הכשל.
כאשר המשתנה התלוי הוא טווח קידודים, נבחר ב-Range of values ונציין את טווח הערכים המייצגים את הכשל, מהנמוך לגבוה.
כאשר המשתנה התלוי הוא רשימה של מקרים המתארים כשל, נבחר ב-List of values ונתאר את המקרים השונים.
בדוגמה שלנו המשתנה התלוי, המתאר את הקשר, הוא בינארי, ובו הכשל מתואר ע"י ציון 1.
נבחר ב-Single value ונוסיף את הערך המתאים. לאחר מכן נלחץ על Continue.
להגדרת תנאי הניסוי, הם המשתנים הקטגוריאלים, נלחץ על Categorical.
נעביר את המשתנים הקטגוריאלים לחלון Categorical Covariates. בדוגמה זו המשתנים הם גיל ומגדר המטופל. לאחר מכן נלחץ על Continue.
ניצור גרפים רלוונטיים לניתוח, שיקלו על פירוש הנתונים.
לשם כך, נלחץ על Plots.
בחלון החדש נבחר בשני סוגי גרפים – גרף השרדות באמצעות סימון Survival וגרף סיכון באמצעות סימון Hazard.
ניתן לחלק את התצוגה בגרפים לקטגוריות, כך שיופיעו בקוים נפרדים: לדוגמה, לפי מגדר המטופל. לשם כך נעביר את המשתנה לחלון Separate Lines for.
לאחר מכן נלחץ על Continue.
כדי לקבל את רווח הסמך לסיכון נלחץ על כפתור Options ובחלון שיפתח נסמן את האפשרות CI for exp(B). לאחר מכן נלחץ על Continue.
לאחר שסיימנו להגדיר את כל התנאים לניתוח, נלחץ על OK להרצת הרגרסיה.
קריאת הפלט
הפלט לניתוח Cox Regression מציג נתונים רבים, אך החשובים שבהם נמצאים בארבע טבלאות עיקריות.
הטבלה הראשונה היא טבלת Case Processing Summary:
בטבלה זו מופיע סיכום של כלל המקרים שניתחנו. בשורת Cases available in analysis מתוארים המקרים שנכללו בניתוח. בסה"כ נכללו 67 מקרים, מהם ב-36 מקרים התרחש הכשל כפי שמופיע בשורת Event וב31 מקרים לא התרחש הכשל כפי שמופיע ב-Censored. כזכור, הכשל במקרה שלנו הוא התפרצות שניה של המחלה לאחר 120 ימים – כלומר, המחלה התפרצה שנית ב-36 מהמטופלים, שמהווים 52.2% מהנבדקים בניסוי, כפי שמופיע בטבלה.
שורת Cases dropped מציגה את מספר המקרים שלא נכללו בניתוח מסיבות שונות, כמו נתונים חסרים.
הטבלה השניה היא טבלת Categorical Variable Codings:
טבלה זו מתארת את קידוד המשתנים הבלתי-תלויים הקטגוריאלים ואת התדירויות שלהם. שימו לב, כאן מסומנת אחת הקטגוריות בספרה 1, ואליה יושוו כל הקטגוריות האחרות. בדוגמה שלנו המשתנים הקטגוריאלים כללו מגדר וגיל. מאחר ולקבוצות הגיל קטגוריות רבות, הטבלה גדולה מאוד ונסתפק בהצגה של החלק בטבלה המתאר את הקידוד למגדרים שונים:
בחלק זה ניתן לראות כי המגדר שקודד כ-1 (גבר) מסומן ב-1. קבוצת הנשים תשווה לקבוצת הגברים. כמו כן ניתן לראות כי בניסוי נכללו 32 גברים ו-36 נשים.
הטבלה השלישית היא טבלת Omnibus Tests of Model Coefficients.
כאן נמצא את המידע אודות טיב ההתאמה של המודל הסטטיסטי. כאשר מבצעים ניתוח בכמה שלבים, תופיע השוואת המודל למודלים אחרים. בניתוח שבדוגמה השתמשנו במודל יחיד, ולכן נסתכל בצד הימני של הטבלה.
בחלק הראשון של הטבלה מופיע עמדת -2 Log Likelihood המסמלת את טיב ההתאמה של המודל הסטטיסטי לנתונים. ככל שציון זה נמוך יותר, כן גדל טיב ההתאמה של המודל לנתונים. בנוסף בטבלה זו נמצא את ציון החי-בריבוע של המודל (Chi-square), את מספר דרגות החופש של המודל (df) ואת רמות המובהקות של המודל תחת Sig.
בטבלה הרביעית, טבלת Variables in the Equation, מתוארים מתאמי הרגרסיה של הניתוח. בתוכם נמצא את יחס הסיכונים (Hazard ratio), ציון המייצג את השינוי בסיכויי השרידות של מקרים שונים. כאשר המשתנה הוא קטגוריאלי, מתוך ציון זה נוכל לפרש אם קטגוריות מסוימות מעמידות את המטופל בקבוצת סיכון גבוהה יותר- למשל, מגדר. ציון זה יופי תחת עמודת exp(B).
כך במקרה זה סיכויין של נשים – הן המגדר שמשווה לגברים, כפי שראינו בטבלה השניה – להמנע מהתפרצות שניה משך 120 ימים היא פי 15.798 בהשוואה לנבדקים הגברים. שימו לב, זהו הבדל של יותר מ-1500%!
עמודת Sig מייצגת את המובהקות של יחס הסיכונים, והיא החשובה לנו שכן היא מסמלת אילו מהפרמטרים מועילים לנו במודל. במקרה זה, פרמטר המגדר הוא מובהק (0.02) וכדאי להשתמש בו. לעומתו, פרמטר הגיל אינו מובהק ואינו מוסיף למודל מידע באופן מובהק.
כעת, נביט בגרפים שבפלט.
הגרף הראשון הוא Survival function at mean of covariates. מופיעים בו נתוני כלל הנבדקים במחקר לפי משתנה הזמן (הזמן שעבר מתחילת הטיפול ועד התפצות המחלה). ניתן לראות ירידה הדרגתית בשיעור החולים לפני התפרצות המחלה. ניתן גם להבחין בכך שהטיפול החל עבור רוב החולים בערך לאחר 130 עד 180 ימים.
הגרף הבא, Survival function for patterns, מציג את קווי ההשרדות (ובמקרה שלנו, המטופלים שלא חוו התפרצות לאחר 120 יום) לפי חלוקה לקטגוריות. במקרה שלנו, החלוקה היא לפי מגדר. ניתן להבחין כי באופן כללי, נשים חוו פחות התפרצויות, כפי שניכר מהירידה האיטית יחסית בשיעור הנבדקות שחוו התפרצות. תצוגה זו תואמת ליחס הסיכונים שמצאנו בניתוח.
בגרף השלישי, Hazard Function at mean of covariates, מוצג יחס הסיכויים של כל משתתפי המחקר על פי זמן מתן הטיפול. כלומר, נראה היחס בין הזמן שעובר עד התפרצות שניה של המחלה לזמן שניתן הטיפול לאחר ההתפרצות הראשונה.
ניתן לראות, אם כן, כי הסיכון להתפרצות שניה תוך 120 עולה ככל שמתן הטיפול מתעכב.
בגרף האחרון, Hazard Function for patterns, נמצא יחס הסיכויים של משתתפי המחקר לפי הקטגוריות השונות. ניתן לראות בגרף זה כי בעוד שהסיכון להתפרצות שניה עולה אצל גברים עם הזמן, העליה אצל נשים מתונה יותר ואצל רובן לא חלה כלל התפרצות שניה לאחר 120 ימים.
כיצד נציג את התוצאות בניתוח השרדות מתוקן לנטיות?
בניתוח זה יש להציג את יחס הסיכונים (HR) ואת המובהקות של יחס זה וההצגה תלויה בהשערות המחקר.
בדוגמה זו, נציג את הנתונים באופן הבא ונוסיף את הטבלה המכילה את הערכים הרלוונטים:
מתוך כלל הנבדקים בניסוי, 52.2% חוו התפרצות שניה של המחלה בתוך 120 יום מההתפרצות הראשונה. הסיכוי של נשים לחוות התפרצות שניה בתוך 120 היה גבוה באופן מובהק סטטיסטית מהסיכוי של גברים (p=0.002, HR=15.8). לא נמצאה השפעה של גיל על הסיכוי לחוות התפרצות שניה (p=0.992).
האם הערך היה לכם לעזר?
במידה וכן, לחצו:
במידה והייתם מעוניינים שנשפר את הערך, שתפו אותנו ונעדכן אתכם ברגע שנכניס שינויים.
לידיעתכם, נעשה שימוש בכתובת המייל שלכם אך ורק לשם עדכון בנוגע לערך ותו לא!