دسته : -فناوری اطلاعات
فرمت فایل : word
حجم فایل : 291 KB
تعداد صفحات : 32
بازدیدها : 542
برچسبها : تحقیق داده های گمشده
مبلغ : 10000 تومان
خرید این فایلفهرست مطالب
داده های گمشده
شیوه های متفاوت در برخورد با مشکل داده های گمشده
بی پاسخی و داده های گمشده در آمارگیریهای نمونه ای
اثر بی پاسخی بر درستی برآوردها
آمارگیریهای پستی همراه با مصاحبه با بی پاسخها
مثال تشریحی
تعیین کسر بهینۀ بی پاسخهای آغازین برای زیرنمونه در تلاشهای متمرکز
ساز و کارهایی که مقادیر گمشده از آنها ناشی می شود
گمشده کاملاً تصادفی
گمشده تصادفی
مقادیر گمشده غیرقابل چشم پوشی
انواع روشها برای تحلیل داده ها با وجود مقادیر گمشده
روشهای مربوط به مورد کامل
روشهای مبتنی بر جانهی
روشهای تجدید وزن دهی
انواع روش های جانهی
جانشین کردن میانگین
روش بی درنگ
مثال تشریحی
مدل رگرسیون لوجستیک با وجود مقادیر گمشده تصادفی در متغیر کمکی
زمینه و هدف
مواد و روش کار
منابع و مآخذ
*********************
معمولاً در پیمایش ها مواردی پیش می آید که برخی از پاسخگویان به برخی از سوالات پاسخ ندهند. پس از وارد کردن داده ها به نرم افزارهای آماری موارد بدون پاسخ به صورت خودکار، گمشده تعریف می شوند. مشکل داده های گمشده را می توان به دو حالت کلی تقسیم کرد. حالت اول زمانی است که داده ها به صورتی تصادفی گم شده باشند. مثلاً پاسخگویان برخی سوالات را ندیده باشند و یا پرسشگران یک یا چند سوال را از قلم انداخته باشند. حالت دوم وقتی پیش می آید که پاسخگو با قصد و نیت از پاسخ دادن به سوال یا سوالاتی خودداری ورزیده باشد.
شرایطی که تعمدی در بی پاسخ گذاشتن سوالات وجود داشته باشد، بدترین حالت برای پژوهشگر است. در این حالت هرگونه برخوردی با داده های گمشده نتایج پیمایش را به سمت اریبی می کشاند. ممکن است پژوهشگری در این حالت ترجیح دهد که پرسشنامه هایی را که شامل داده های گمشده باشند به کلی حذف کند. باید بگویم که این بدترین کاری است که یک پژوهشگر می تواند با این مشکل انجام دهد، زیرا با این کار فقط میزان اریبی را افزایش خواهد داد. مثلاً در یک پیمایش ممکن است افراد طبقه بالای جامعه از گفتن میزان درآمدشان خودداری کرده باشند.
...
زمینه و هدف:
رگرسیون لوجستیک مدلی عمومی برای تحلیل داده های پزشکی و اپیدمیولوژیکی می باشد و اخیراً محققین معدودی تحقیقات خود را به تحلیل مدل های رگرسیون لوجستیک با وجود مقادیر گمشده در متغیرهای کمکی معطوف داشته اند.
در بسیاری از پژوهش ها محققین با مجموعه داده هایی مواجه هستند که دارای مقادیر گمشده است. گمشدگی تهدید عمده ای برای درستی نتایج حاصل از مجموعه داده ها محسوب می شوند و اجتناب از آن بسیار مشکل است.
در این بخش
رگرسیون لوجستیک با پاسخ دو حالتی را هنگامی که یکی از متغیرهای کمکی دارای مقادیر گمشده است و سایر متغیرهای کمکی کاملاً مشاهده شده اند را مورد بحث و بررسی قرار می دهیم.
...
خرید و دانلود آنی فایل