تحليل درستنمايي ماكزيمم مدل رگرسيون لجستيك در حالتي كه داده هاي متغيرهاي پيشگو كامل نيستند ولي متغيرهاي كمكي وجود دارند

مجله اپيدميولوژي ايران

دوره 1 - شماره 1

نوع مقاله: ---- Unspecified ----
چكيده:

مقدمه و هدف: داده هاي گمشده در بسياري از مطالعات آماري از جمله مدلهاي رگرسيوني وجود دارند و باعث كاهش دقت برآورد مي شوند. تا كنون روشهاي گوناگوني براي مقابله با مشكل داده هاي گمشده ابداع شده كه عموما بر داده هاي گمشدة متغير پاسخ متمركز بوده است حال آنكه متغيرهاي پيشگو نيز مي توانند دستخوش تغيير و از دست رفتن اطلاعات شوند.
مواد و روشها: در اين تحقيق ضمن بررسِي روش جانهِي داده هاِي گمشده با استفاده از الگوريتم EM و متغير كمكي, نتايج حاصل از اين روش را با روش تحليل مورد كامل در يك مدل رگرسيون لجستيك پيرامون عوامل مؤثر بر انتخاب نوع زايمان مقايسه مي كنيم.
يافته ها: داده هاِي مورد استفاده در اين مقاله از يك مطالعه توصيفِي پيرامون عوامل مرتبط با انتخاب نوع زايمان در زنان مراجعه كننده به مراكز بهداشتِي و درمانِي شهر تهران بدست آمده است. حجم نمونه دراِين تحقِيق385 نفر بوده و از روش نمونه گِيرِي چند مرحله اِي انتخاب شدندو مشخصات فردِي، سوابق ماماِيِي، نوع نگرش و عوامل اجتماعِي نمونه ها از طرِيق پرسشنامه ثبت شدند. براِي مقايسه ميزان كارايِي دو روش، برآورد انحراف معيار پارامترها مورد استناد قرار گرفت.
بحث و نتيجه گيري : نتايج حاصل نشان مي دهد روش تحليل درستنمايي با الگوريتم EM در مقايسه با روش مورد كامل كارايي بهترِي دارد. مشكل داده هاِي گمشده در بسيارِي از مطالعات آمارِي وجود دارد و موجب اريبي و كاهش كارايي مي شوند. در اين بررسِي نشان داده ايم استفاده از الگوريتم EM براِي جانهِي گمشده هادر يك مدل رگرسيون لجستيك با متغيرهاِي توضيحِي گسسته و سپس تحليل مدل، از روش مورد كامل كه مستلزم حذف گمشده ها به همراه قسمتهايي از اطلاعات است كاراتر است. از سوي ديگر اگر متغير توضيحِي ناكامل پيوسته باشد بدست آوردن مدل، روشي متفاوت مي طلبد و يا مي توان با تبديل آن به متغيري گسسته از روش قبل استفاده كرد.

Maximum likelihood analysis in logistic regression with missing covariate data and auxiliary information: Application to factors associated with selection of the delivery method in pregnant women
Article Type: ---- Unspecified ----
Abstract:

Background and Objectives: Missing data exist in many studies, e.g. in regression models, and they decrease the model's efficacy. Many methods have been suggested for handling incomplete data: they have generally focused on missing outcome values. But covariate values can also be missing.
Materials and Methods: In this paper we study the missing imputation by the EM algorithm and auxiliary variable and compare the result with case-complete analysis in a logistic regression model dealing with factors that influence the choice of the delivery method.
Our data came from a cross-sectional study of factors associated with the choice of the delivery method in pregnant women. The sample size in this cross-sectional study was 365 and the data were collected through interviews, using questionnaires covering several demographic variables, delivery history, attitude, and some social factors. We used standard deviations to compare the efficiency of the two methods.
Results: The results show that maximum likelihood analysis by EM algorithm is more effective than case-complete analysis.
The problem of missing data is common in surveys and it causes bias and decreased model efficacy. Here we show that the EM algorithm for imputation in logistic regression with missing values for a discrete covariate is more effective than case-complete analysis.
Conclusion: On the other hand if missing values occur for a continuous covariate then we have to use other methods or change the variable into a discrete one.