۹۸
بنابراین حجم نهایی نمونه ۹۸ سال- بانک می باشد.
۳-۹) روش جمع آوری داده ها
با توجه به ماهیت این تحقیق، جهت گردآوری اطلاعات مورد نیاز از روش کتابخانه ای استفاده می شود. در این روش، ابتدا با بهره گرفتن از منابع کتابخانه ای که شامل کتاب، مجلات، پایان نامه ها، مقالات و اینترنت؛ مطالعات مقدماتی و تدوین فصل ادبیات و چارچوب نظری پژوهش انجام می گیرد. در ادامه با بهره گرفتن از بانکهای اطلاعاتی سازمان بورس اوراق بهادار تهران، سایت اینترنتی این سازمان و نرم افزارهای سهام مانند نرم افزار ره آورد نوین، داده های موردنیاز برای آزمون فرضیات گردآوری می شود.
۳-۱۰) بازه زمانی تحقیق
بازه زمانی تحقیق شامل ۹ سال متوالی از سال ۱۳۸۳ تا ۱۳۹۱ می باشد که بررسی فرضیات تحقیق با بهره گرفتن از داده های واقعی این سالها انجام می پذیرد.
۳-۱۱) روش جمع آوری اطلاعات
با توجه به ماهیت این تحقیق، جهت گردآوری اطلاعات مورد نیاز از روش کتابخانهای استفاده شده است. در این روش، ابتدا با بهره گرفتن از منابع کتابخانهای که شامل کتاب، مجلات، پایان نامهها، مقالات و اینترنت؛ مطالعات مقدماتی و تدوین فصل ادبیات و چارچوب نظری پژوهش انجام میگیرد. در ادامه با بهره گرفتن از بانکهای اطلاعاتی سازمان بورس اوراق بهادار تهران، سایت اینترنتی این سازمان و نرم افزارهای سهام مانند نرم افزار ره آورد نوین، داده های مورد نیاز برای آزمون فرضیات گردآوری می شود.
۳-۱۲) دوره زمانی تحقیق
محدوده زمانی تحقیق شامل ۹ سال متوالی از سال ۱۳۸۳ تا ۱۳۹۱ می باشد که بررسی فرضیات تحقیق با بهره گرفتن از داده های واقعی این سالها انجام می پذیرد.
۳-۱۳) روش تجزیه و تحلیل داده ها
پس از جمع آوری داده ها محقق باید آن ها را دسته بندی و تجزیه و تحلیل نماید، آن گاه به آزمون فرضیه هایی بپردازد که تا این مرحله تحقیق او را یاری کرده اند، تا پاسخی برای پرسش های تحقیق بیابد. تجزیه و تحلیل داده ها فرایندی چند مرحله ای است که طی آن داده های گردآوری شده به طرق مختلف خلاصه، دسته بندی و در نهایت پردازش می شوند تا زمینه برقراری انواع تحلیل ها و ارتباط بین داده ها به منظور آزمون فرضیه ها فراهم آید . در این فرایند، داده ها هم از لحاظ مفهومی و هم از جنبه تجربی پالایش می شوند و روش های گوناگون آماری نقش بسزایی در استنتاج ها به عهده دارند.
۳-۱۳-۱)تحلیل توصیفی داده ها
شاخص های مرکزی و پراکندگی برای متغیرهای تحقیق به منظور تحلیل توصیفی متغیرها قبل از آزمون فرضیات تعیین می شوند. میانگین به عنوان مهم ترین شاخص مرکزی به همراه انحراف معیار به عنوان مهم ترین شاخص های پراکندگی محاسبه خواهد شد ، انحراف معیار نیز پراکندگی داده ها را نشان می دهد . این اقدام به منظور ارائه دیدگاهی کلی نسبت به جامعه آماری و شناخت بیشتر آن صورت می گیرد.
۳-۱۳-۲)همبستگی
یک نوع از تجزیه و تحلیل آماری که برای برآورد و پیشبینی، کاربرد گستردهای دارد، تجزیه و تحلیل رگرسیون و همبستگی است که برای تعین میزان رابطه بین متغیرها و تأثیر متغیرهای مستقل بر متغیر وابسته بکار برده میشود.
تحلیل همبستگی ابزاری آماری است که به وسیله آن میتوان درجهای که یک متغیر به متغیر دیگر، از نظر خطی مرتبط است را اندازهگیری کرد. موضع همبستگی با بحث درباره دو معیار ضریب همبستگی ® و ضریب تعین (R2) به صورت زیر دنبال میشود (عادل آذر، ۱۳۸۳، ۱۸۲).
۳-۱۳-۳)ضریب همبستگی
ضریب همبستگی ریشه دوم ضریب تعین است که میتواند مقادیری بین ۱- و ۱+ را به خود گیرد. علامت آن همان علامت شیب خط رگرسیون است یعنی اگر شیب خط رگرسیون مثبت باشد، ضریب همبستگی نیز مثبت، و اگر شیب خط رگرسیون منفی باشد، ضریب همبستگی نیز منفی خواهد بود و اگر شیب خط رگرسیون صفر باشد، ضریب همبستگی نیز صفر است.
۳-۱۳-۴)ضریب تعین (R2)
مهمترین معیاری است که با آن میتوان رابطه بین دو متغیر x و y را توضیح داد و میزان انحراف مشاهدات y را با برآورد خط رگرسیون اندازهگیری میکند. این ضریب بین صفر تا یک در نوسان بوده به طوری که مقدار صفر بیانگر آناست که خط رگرسیون هرگز نتوانسته تغیرات y را به متغیر مستقل x نسبت دهد. مقدار یک نیز بیانگر آن است که خط رگرسیون به طور دقیق توانسته است تغیرات y را به متغیر مستقل x نسبت دهد.
در رگرسیون چندمتغیره در صورتی که نمونه کوچک باشد، ضریب تعین تعدیل شده به جای ضریب تعین استفاده میشود و با بزرگتر شدن حجم نمونه این دو ضریب به همدیگر نزدیک میشوند (مومنی و قیومی، ۱۳۸۶، ۱۲۲).
۳-۱۳-۵) مدلهای رگرسیون
مدلهای رگرسیون انواع مختلفی دارد که متداولترین آنها رگرسیون ساده و مرکب میباشند. رگرسیون ساده شامل ارتباط بین دو متغیر و رگرسیون چندمتغیره، ارتباط یک متغیر را با دو یا چند متغیر بیشتر نشان میدهد. رگرسیون چندمتغیره رابطه بین متغیر وابسته را با یکی از متغیرهای مستقل، در شرایط ثابت بودن دیگر متغیرهای مستقل نشان میدهد.
در رگرسیون ساده (یک متغیر)، معادله معرف خط رگرسیون جامعه میباشد که با برآورد میشود. در رگرسیون خطی چندمتغیره معادله معرف رگرسیون جامعه به شرح زیر میباشد:
که برای برآورد معادله فوق از معادله زیر استفاده میکنیم:
که در آن
Y= متغیر وابسته
x= متغیر مستقل
b= ضریب رگرسیون
r= ضریب همبستگی بین x و y
Sy= انحراف استاندارد متغیر وابسته
Sx= انحراف استاندارد متغیر مستقل
= ضریبهای رگرسیون
= میانگین مشاهدات x و y میباشند.
۳-۱۳-۶)فرضهای اساسی رگرسیون
در صورتی محققی میتواند از رگرسیون استفاده نماید که شرایط زیر محقق شده باشد:
۱- میانگین جمله خطاها مساوی صفر است. : معنی این فرض آن است که عوامل تشکیلدهنده خطاها، اثرات مثبت و منفی خود را طوری بر جای میگذارند که متوسط مقادیر جمله خطاها برابر صفر شود.
۲- متغیر وابسته دارای توزیع نرمال است: فرض بر آن است که توزیع متغیر به نحوی است که پراکندگی آن در مجاورت میانگین حداکثر بوده و هر چه از میانگین دورتر شویم در سمت راست و چپ آن به یک نسبت کاهش مییابد؛ در نتیجه توزیع رنگی شکل است.
۳- جمله خطاها در مشاهدات مختلف ناهمبسته میباشد. : اگر این فرض نقض شود با مسئلهای موسوم به خودهمبستگی مواجه خواهیم بود. بطور کلی هرگاه جمله خطاها از نظم خاصی پیروی کنند فرض ناهمبسته بودن جمله خطاها نقض شده، خودهمبستگی مثبت، منفی یا تلفیقی از خودهمبستگی مثبت و منفی را خواهیم داشت.
۴- واریانس جمله خطاها همگی برابر عدد ثابتی مانند هستند: هرگاه فرض اخیر نقض شود با مسئلهای موسوم به نابرابری واریانسها مواجه خواهیم بود.
۵- جمله خطاها مستقل از متغیر مستقل میباشد: در صورت نقض این فرض، مطالعه دقیق اثرات x بر روی y امکانپذیر نخواهد بود.
فرض دیگر که فقط مختص مدل رگرسیون چندمتغیره است، آن است که باید تعداد مشاهدات بر تعداد پارامترها فزونی داشته باشد و بین متغیرهای مستقل رابطه خطی کامل وجود نداشته باشد. این فرض شرط لازم برای حصول جواب معادلات نرمال و برآورد ضرایب رگرسیون چندمتغیره است.
۳-۱۳-۷)بررسی نرمال یا غیر نرمال بودن داده های تحقیق
جهت بررسی این نکته که آیا متغیرهایی که مورد بررسی و محاسبه قرار می گیرند، از قابلیت اتکاء مناسبی برخوردارند، آزمون نرمال بودن انحرافات صورت می گیرد که با بهره گرفتن از آزمون کلموگروف – اسیمرنوف به بررسی نرمال بودن داده های آزمون پرداخته می شود. با توجه به اینکه در جامعه های با توزیع نرمال، روش های پارامتریک و در جامعه های با توزیع غیر نرمال، روش های ناپارامتریک به کار گرفته می شود، لذا در ابتدا نرمال یا غیر نرمال بودن داده ها مشخص می شود و سپس فرضیه های تحقیق مورد بررسی قرار می گیرند. به منظوربررسی نرمال بودن از آزمون کلموگوروف- اسمیرنوف(KS) استفاده می شود.
آزمون کلموگروف-اسمیرنوف آزمونی برای پیدا کردن نوع توزیع های آزمون است. آماره آزمون فوق از مقایسه قدرمطلق بیشترین تفاوتها بین مقادیر مشاهده شده واقعی از مقادیر مورد انتظار بدست می آید. نیکویی برازش این آزمون نشان می دهد که آیا داده های آزمون از توزیع خاصی (در اینجا توزیع نرمال) پیروی می کنند یا خیر. با توجه به اینکه در جامعه های با توزیع نرمال، روش های پارامتریک و در جامعه های با توزیع غیر نرمال، روش های ناپارامتریک به کار گرفته می شود، لذا در ابتدا نرمال یا غیر نرمال بودن داده ها مشخص می شود و سپس فرضیه های تحقیق مورد بررسی قرار می گیرند.
۳-۱۳-۸) آزمون معنیدار بودن در الگوی رگرسیون
در رگرسیون چندگانه، دو یا چند متغیر مستقل وجود دارد و لازم است که برای مشخص شدن معنادار بودن آنها دو آزمون انجام گیرد. ابتدا آزمون معنیدار بودن معادله رگرسیون و در مرحله بعد آزمون معنادار بودن هر کدام از ضرایب متغیرهای مستقل صورت میگیرد که به اختصار در زیر شرح داده میشود (مومنی، ۱۳۸۶، ۱۲۰).
۳-۱۳-۹)آزمون معنیدار برای معادله رگرسیون
در یک معادله رگرسیون چندگانه، چنانچه هیچگونه رابطهای میان متغیر وابسته و متغیرهای مستقل وجود نداشته باشد، باید تمامی ضرایب متغیرهای مستقل در معادله، مساوی صفر باشند. بدین ترتیب، میتوانیم معنادار بودن معادله رگرسیون را آزمون کنیم. این کار با بهره گرفتن از آماره F صورت میگیرد. چنانچه در سطح اطمینان ۹۵% آماره F محاسبه شده از معادله رگرسیون کوچکتر از مقدار F بدست آمده از جدول باشد در این صورت معادله رگرسیون معنادار خواهد بود.
۳-۱۳-۱۰)آزمون معنیدار بودن ضرایب
هدف از انجام آزمون معنادار بودن رگرسیون آن است که مشخص شود آیا در سطح اطمینان مورد نظر ضرایب محاسبه شده مخالف صفر میباشد یا خیر.
برای آزمون این فرضیهها از آماره t استفاده میشود. اگر در سطح اطمینان ۹۵% آماره بدست آمده از آزمون، کوچکتر از t بدست آمده از جدول با همان درجه آزادی باشد، در این صورت ضرایب مدل رگرسیون مخالف صفر میباشد.
۳-۱۳-۱۱)آزمون خودهمبستگی جملات خطا
همانگونه که در مفروضات رگرسیون گفته شد در مدلهای رگرسیون فرض بر آن است که جملات خطا از دورهای به دورهای مستقل میباشد، اما در بسیاری از کاربردها، جملات خطا در دورههای مختلف همبستهاند. در چنین مواردی جملات خطا، اصطلاحاً دارای خودهمبستگی یا همبستگی متوالی میباشند. برای بررسی آنکه در یک مدل رگرسیون جملات خطا خودهمبسته میباشند یا خیر، آزمونهایی طراحی گردیده است. در این میان آزمونی که بیشتر مورد استفاده قرار میگیرد آزمون دوربین ـ واستون است.
فصل چهارم
برآورد الگو و یافته های تحقیق
۴-۱) مقدمه