روش حداقل مربعات معمولی و حداقل مربعات معمولی

HHI,t: تمرکز حقوق مالکانه برای شرکتiدر سالt؛
Sizei,t :اندازه شرکتiدر سال t؛
LEVi,t :اهرم مالی برای شرکتiدر سال t؛
εi,t: خطای پسماند یا باقی مانده (جزء اخلال) می باشد.
3-11. روش تجزیه و تحلیل داده ها
در این تحقیق برای آزمون فرضیه ها از مدل رگرسیون خطی چند متغیره استفاده شده است. روش آماری مورد استفاده در این تحقیق روش داده های پانل می باشد. در ادامه ابتدا روش داده های پانل و آزمون های مربوط به آن تشریح می گردد. سپس آزمون های مربوط به معنی دار بودن کل مدل و معنی دار بودن متغیرهای مستقل توضیح داده می شود. در آخر نیز پس از تشریح آزمون های مربوط به مفروضات رگرسیون کلاسیک، نحوه تصمیم گیری در مورد عدم پذیرش یا پذیرش گزاره ها یافرضیه های تحقیق بیان می گردد. تحلیل آماری داده ها نیز به کمک نرم افزارهای، Stata نسخه 1/9 و SPSSنسخه 22،انجام می شود.
3-11-1. روش داده های پانل
مدل ها از لحاظ استفاده از اطلاعات آماری به سه گروه تقسیم می شوند. برخی از مدل ها با استفاده از «اطلاعات سری زمانی» یا به عبارتی طی دوره نسبتاً طولانی چند ساله برآورد می شوند. بعضی دیگر از مدل ها بر اساس «داده های مقطعی» برآورد می شوند یعنی متغیرها در یک دوره زمانی معین مثلاً یک هفته، یک ماه یا یک سال در واحدهای مختلف بررسی می شوند. روش سوم برآورد مدل، که در این تحقیق نیز مورد استفاده قرار گرفته است، برآورد بر اساس «داده‏های پانل» است. در این روش یک سری واحدهای مقطعی (مثلاً شرکت ها) در طی چند سال مورد توجه قرار می گیرند. با کمک این روش که در مطالعات سال های اخیر نیز زیاد استفاده شده است تعداد مشاهدات تا حد مطلوب افزایش می یابد. با توجه به این که مشاهده های ادغام شده باعث تغییرپذیری بالاتر، هم خطی چندگانه کمتر میان متغیرهای توضیحی، درجه آزادی بیشتر و کارآیی بالاتر تخمین کننده ها می شود، مطالعات پانل نسبت به مطالعات مقطعی و سری زمانی دارای مزیت است (بالتاجی، 1995). در حالت کلی مدل زیر نشان دهنده یک مدل با داده های پانل می باشد:
که در آن نشانگر واحدهای مقطعی (مثلا شرکت ها) و نشانگر زمان است. متغیر وابسته را برایامین واحد مقطعی در سال نشان می دهد و نیز امین متغیر مستقل غیرتصادفی برای برایامین واحد مقطعی در سالام است. جمله اخلال بوده و که فرض می شود دارای میانگین صفر () و واریانس ثابت () است.
پارامترهای مدل می باشد که واکنش متغیر مستقل نسبت به تغییراتامین متغیر مستقل درامین مقطع وامین زمان را اندازه گیری می کند. برای برآورد مدل بر اساس داده های پانل روش های مختلفی همچون روش اثرات ثابت و روش اثرات تصادفی وجود دارد که بر حسب مورد، کاربرد خواهند داشت.
3-11-1-1. روش اثراث ثابت
در روش اثرات ثابت فرض بر این است که ضرایب مربوط به متغیرها (شیب ها) ثابت هستند و اختلافات بین واحدها را می توان به صورت تفاوت عرض از مبداء نشان داد. برای برآورد روش اثرات ثابت از مدل حداقل مربعات متغیر مجازی استفاده می شود. مدل اخیر یک مدل رگرسیونی کلاسیک بوده و هیچ شرط جدیدی برای تجزیه و تحلیل آن لازم نیست و از طریق روش حداقل مربعات معمولی قابل برآورد می باشد.
3-11-1-2. روش اثرات تصادفی
مدل های اثرات ثابت تنها درصورتی منطقی خواهد بود که ما اطمینان داشته باشیم که اختلاف بین مقاطع را می توان به صورت انتقال تابع رگرسیون نشان داد، در حالی که همیشه نمی توان از وجود این موضوع مطمئن بود. برای رفع این مشکل مدل اجزاء خطا یا اثرات تصادفی پیشنهادشدهاست. این روش فرض می کند که جزء ثابت مشخص کننده مقاطع مختلف به صورت تصادفی بین واحدها و مقاطع توزیع شده است.
3-11-1-3. آزمون چاو
در بررسی داده های مقطعی و سری های زمانی، اگر ضرایب اثرات مقطعی و اثرات زمانی معنادار نشود، می توان داده ها را با یکدیگر ترکیب کرده و به وسیله یک رگرسیون حداقل مربعات معمولی تخمین بزنیم. از آنجایی که در اکثر داده های ترکیبی اغلب ضرایب مقاطع یا سری های زمانی معنادار هستند این مدل که به مدل رگرسیون ترکیب شده معروف است کمتر مورد استفاده قرار می گیرد (یافی، 2003). لذا برای اینکه بتوان مشخص نمود که آیا داده های پانل جهت برآورد تابع مورد نظر کارآمدتر خواهد بود یا نه، فرضیه ای را آزمون می کنیم که در آن کلیه عبارات ثابت برآورد با یکدیگر برابر هستند. در این آزمون فرضیه یعنی یکسان بودن عرض از مبداء ها در مقابل فرضیه یعنی ناهمسانی عرض از مبداءها قرار می گیرد. در صورتی که فرضیه پذیرفته شود به معنی یکسان بودن شیب ها برای مقاطع مختلف بوده و قابلیت ترکیب شدن داده ها و استفاده از مدل رگرسیون ترکیب شده مورد تایید آماری قرار می گیرد. اما در صورت رد فرضیه روش داده های پانل پذیرفته می شود و می توان از روش داده های پانل استفاده کرد.
3-11-1-4. آزمون هاسمن
به منظور اینکه مشخص گردد کدام روش (اثرات ثابت و یا اثرات تصادفی) جهت برآورد مناسب تر است (تشخیص ثابت یا تصادفی بودن تفاوت های واحدهای مقطعی) از آزمون هاسمن استفاده می شود. در روش اثرات تصادفی بار متغیرهای حذف شده روی جمله اخلال قرار می گیرند، اما این مشروط بر آن است که بین متغیرهای مستقل و مؤلفه خطای مقطعی همبستگی وجود نداشته باشد. آزمون هاسمن وجود این همبستگی را بررسی می کند. این آزمون مبتنی بر این فرض اولیه است که در صورت وجود همبستگی، روش اثرات ثابت سازگار و روش اثرات تصادفی ناسازگار است.
فرضیه صفر در آزمون هاسمن به صورت زیر خواهد بود:
فرضیه صفر به این معنی است که ارتباطی بین جزء اخلال مربوط به عرض از مبدأ و متغیرهای توضیحی وجود ندارد و آن ها از یکدیگر مستقل هستند. در حالی که فرضیه مقابل به این معنی است که بین جزء اخلال مورد نظر و متغیرهای توضیحی همبستگی وجود دارد. از آنجایی که به هنگام وجود همبستگی بین اجزاء اخلال و متغیر توضیحی با مشکل اریبی و ناسازگاری مواجه می شویم، بنابراین بهتر است در صورت پذیرفته شدن (رد) از روش اثرات ثابت استفاده کنیم. هنگامی که بین اجزاء اخلال و متغیر توضیحی همبستگی وجود نداشته باشد ( قبول)، هر دو روش اثرات ثابت و اثرات تصادفی سازگار هستند ولی روش اثرات ثابت ناکارآ بوده و بایستی از روش اثرات تصادفی استفاده شود (بالتاجی، 1995).
3-11-2. آزمون معنادار بودن مدل
برای بررسی معنادار بودن مدل رگرسیون از آماره Fاستفاده شده است. فرضیه صفر در آزمون Fبه صورت زیر خواهد بود:
که بوسیله آماره زیر صحت آن مورد بررسی قرار می گیرد: