مثال۲-۵ (مدلهای انتقالی رگرسیون نیمپارامتری): این مدلها به صورت زیر تعریف میشوند:
به طوریکه:
-
- ، تابع توزیع نامعلوم است.
-
- ، یک تابع صعودی پارامتری است.
-
- و نیز توابع پارامتری هستند.
-
- مستقل از است و با چگالی پارامتری با میانگین صفر و واریانس یک، هم توزیع و مستقل است،.
بهراحتی میتوان دید که در این حالت در (۲-۱۶) توسط چگالی مفصل زیر ساخته می شود:
به طوریکه شامل عناصر فاصلهای است.
فرایند مارکوف ایستا با مفصل گاوسی در مثال قبل و توزیع کناری ناپارامتری را میتوان با جایگذاری در (۲-۱۶) تعیین کرد:
، ، ، چگالی نرمال استاندارد و .
۲-۲- ۶ نتیجه گیری
در این فصل بعضی روشها بر پایه مفصل برای تحلیل رگرسیونی ارائه شد. به ازای هر یک از مدلها، شکل بستهای برای توزیع توأم، بیان شد و با روشهای ماکسیمم درستنمایی استاندارد و بدون استفاده از توزیع ساده معلومی از عوامل مشاهده ناشدنی که همبستگی را استنباط می کنند، برآورد کردیم. روش مفصل، پارامترهای وابستهای را که برآوردهای وابستهسازی بین متغیرهای وابسته را آماده می کنند، را میسازد.
متدلوژی مفصل و مدل تجربی ارائه شده در بخش ۲-۲، کاربردهای تجربی بسیاری دارند.
تحلیل رگرسیون بر پایه مفصل در کنار مراجعه به رگرسیون معمولی مفید است. میبایست مفصل صحیح، یعنی ساختار وابستگی صحیح شناسایی شود اگر مفصل انتخابی صحیح نبود دستورالعمل را آنقدر تکرار میکنیم تا مفصل صحیح پیدا شود.
فصل۳٫ استنباط بیزی مدل رگرسیونی بر پایه مفصل
۳- ۱ مقدمه
اساس تحلیل آماری مدرن، مدلبندی و درک وابستگی بین متغیرهای تصادفی است. مفصلها ابزار انعطافپذیری هستند که با به کارگیری قضیه اسکلار بر پایه مدلبندی جداگانه توزیعهای کناری و ساختار وابسته توأم، استفاده از توزیعهای چندمتغیره را کنار میگذارند. در این بخش حالت دومتغیره بیان می شود.
مدلهای مفصل عمدتاً برای وابستگی بین متغیرهای تصادفی پیوسته به کار میروند، اما مطالعه و کاربرد مدلهای مفصل برای داده های آمیخته (پیوسته و گسسته) در حال افزایش است. ژنه (۲۰۰۷) نشان داد که ، اجرا و تفسیر استنباط آماری برای مدلهای مفصل، وقتی بعضی از حاشیهها گسستهاند به دقت بیشتری نیاز دارد.
درحالیکه غالباً روشهای بسامدگرا در ادبیات مفصل به کار میرود، اخیراً با بهره گرفتن از ابرکامپیوترها و الگوریتمهای استاندارد چند روش بیزی برای برآورد، انتخاب مدل و نیکویی برازش در ادبیات مفصل بیان شده است.
یک تعمیم معمول از مدل مفصل کلاسیک آن است که، پارامتر مفصل با تغییر در مقادیر متغیر کمکی تغییر می کند (لمبرت و واندنهند، ۲۰۰۲). این ایده که با مدل مفصل شرطی (پیتن، ۲۰۰۶) فرمولبندی می شود، مدلسازی مفصل در حالت رگرسیونی است
بهطورکلی، مشخص نیست که چرا پارامتر مفصل بر اساس متغیر کمکی تغییر می کند. بهعلاوه، وقتی نمونههای موجود به طور یکنواخت توزیع نشدهاند (معمولاً در مقدار معینی از متغیر کمکی تکرار وجود ندارد) تجسم الگوهای وابستگی در داده ها ممکن نیست. بنابراین استفاده از روشهای منعطف برای مدلسازی تابع کالبیدنی که ارتباط بین پارامتر مفصل و متغیر کمکی را مشخص کند، لازم است، که این مطلب به طور واضح ما را به استفاده از ابزارهای استنتاجی نیمپارامتری و ناپارامتری در حالت حاشیههای پیوسته سوق میدهد.
در این بخش، استنباط بیزی توأم برای یک مدل مفصل شرطی که در آن غیر از مدلهای کناری، بین متغیرهای وابسته وابستگی وجود دارد، پیشنهاد می شود. و وابستگی بین پارامتر مفصل و متغیر کمکی با بهره گرفتن از اسپلاین مکعبی مدلبندی می شود. استنباط بیزی توأم با بهره گرفتن از نمونه گیری مونت کارلوی زنجیر مارکوفی انجام می شود. این روش را میتوان برای حالت با متغیرهای وابسته پیوسته و آمیخته (دودوئی و پیوسته) به کار برد. روش بیزی به کار رفته در اینجا چند امتیاز دارد. اول اینکه، روشی اصولی برای ایجاد استنباط بر پایه درستنمایی کامل برای حالتی که بعضی حاشیهها در مدلهای مفصل گسستهاند، است. دوم، طبق الگوی بیزی، توزیع پسین نمایش کاملی از عدم حتمیت در داده های کامل و پیشین میدهد. یک امتیاز دیگر این است که، برآورد همزمان پارامترهای توزیعهای کناری و پارامترهای مفصل درک بهتری از وابستگیهای پارامتر را نتیجه میدهد و منجر به عملکرد بهتر معیار انتخاب مدل می شود.
به طور کلی، تعیین شکل تابع کالبیدن برای مدلسازی مشکل است، بنابراین استفاده از مدلهای انعطافپذیر برای به دست آوردن ساختار آن توصیه می شود. در اینجا مدل اسپلاین مکعبی بیزی که در آن انتخاب موقعیت گرهها داده رهنمون است، ارائه می شود. و نمونه گیری از توزیع پسین با بهره گرفتن از الگوریتم مونت کارلوی زنجیر مارکوفی سازوار (هریو و همکاران، ۲۰۰۵) انجام می شود.
۳-۲ مدلسازی
در این بخش مدل مفصل شرطی برای متغیرهای وابسته که با هم وابستگی دارند، شرح داده می شود. فرمولهای مدل به کار برده برای متغیرهای وابسته پیوسته و آمیخته (دودوئی و پیوسته) را جداگانه بررسی میکنیم زیرا دو موقعیت، الگوریتم محاسباتی متفاوتی برای نمونه گیری از توزیع پسین نیاز دارند و برآوردگرهای حاصل کارایی متفاوتی بیان می کنند.
۳-۲-۱ حالت متغیرهای وابسته پیوسته
داده ها شامل متغیر تصادفی پیوسته و متغیر کمکی برای نمونه ای به حجم n است. به طور کناری و به ازای از طریق به هم وابسته میشوند. وابستگی شرطی بین و توسط مدل مفصل شرطی گاوسی با چگالی توأم زیر تعریف می شود:
که در آن، تابع توزیع نرمال استاندارد است و به ازای هر ، داریم:
مهمترین قسمت مدل مشخصه است. در اینجا فرض میکنیم و ، به طوریکه تابع معلومی است که تکیهگاه پارامتر مفصل را روی خط حقیقی مینگارد، و تابع کالبیدن نامعلومی است که برآورد می شود. ما مدل انعطافپذیر اسپلاین مکعبی را به کار میگیریم، پس داریم:
به طوریکه .
واضح است که عملکرد برآوردگرهای بر پایه اسپلاین تحت تأثیر موقعیت گرههای قرار میگیرد. در مدل ما این انتخاب به صورت خودکار و با بهره گرفتن از داده رهنمون صورت میگیرد.
۳-۲-۲ حالت متغیرهای وابسته آمیخته
در حالت متغیرهای وابسته آمیخته پاسخ شامل یک دودوئی و یک متغیر تصادفی پیوسته است که آنها را به ترتیب با و نشان میدهیم. میخواهیم استنباط آماری برای مدلهای لوژستیک کناری و رگرسیون خطی را به وسیله برآورد تابع کالبیدن انجام دهیم.
به ازای متغیرهای وابسته و متغیر کمکی ، فرض میکنیم مدلهای کناری به صورت زیر باشند:
وابستگی بین و با بهره گرفتن از مفصل شرطی پارامتری تعریف می شود.
سهم نمونه -ام با درستنمایی زیر تعیین می شود :
که در آن و بردار شامل همه پارامترهای مدل است.
اثبات:
به ازای داریم:
به همین ترتیب به ازای داریم:
و بنابراین رابطه (۳-۲) اثبات می شود.
تا وقتی استنباط بیزی برای مدل لوژستیک انجام می شود، با بهره گرفتن از فرمول متغیر پنهان زیر میتوان مواجه شدن باچالشهای محاسباتی را کاهش داد:
که در آن ، به طوریکه به ازای هر دارای چگالی است. فرمول بالا را برای مدل مفصل شرطی (۳-۱) بسط میدهیم. مشخصاً، فرض کنید که وابستگی بین متغیر پنهان و به وسیله مفصل شرطی مانند در (۳-۱)، مشخص شود. به شرط مشاهده و ، سهم نمونه -ام مطابق درستنمایی داده های کامل به صورت زیر است: