اعتبار کمتری دارند. با این حال محققان کیفی این اندازهی کمتر – معتبر را ترجیح میدهند، زیرا این اندازهها آنچه را اندازه گیری میکنند که آنها میخواهند اندازه گرفته شود. یعنی روایی بیشتری دارند. بین این دو ویژگی روانسنجی آزمون، امکان تنش وجود دارد. اعتبار بالاتر میتواند با استانداردسازی کردن فرایند سنجش به دست بیاید که آن هم بالقوه گستره سازه اندازهگیری شده را کاهش میدهد و در نتیجه، روایی کاهش مییابد. برای مثال همسانی درونی بالاتر بوسیله افزایش همگنی سوالات به دست میآید. با این حال آن سازه تاحدی به ناهمگنی سوالات نیاز دارد و این میان اعتبار و روایی تنش ایجاد میکند. در نظریه کلاسیک آزمون فرض بر این است که نمره آزمون آزمودنی ترکیبی از نمره واقعی و خطای تصادفی است. روایی روی تعریف (یعنی کاربرد و تفسیر) نمره واقعی تمرکز میکند، لذا هر خطای منظم یا سوگیری قسمتی از نمره واقعی است در حالیکه در تحلیل اعتبار تنها به خطاهای تصادفی پرداخته میشود (میلر، ۲۰۱۰). اعتبار و روایی مفاهیم مرتبط هستند. در CTT بیشینه مقدار نظری روایی هر آزمون نمیتواند بیشتر از ریشه دوم اعتبار (شاخص اعتبار) آن باشد. زیرا به طور نظری یک آزمون به اندازهای که با خودش همبستگی دارد با هر متغیر دیگری همبسته نخواهد بود. می توان اعتبار بدون روایی را تصور کرد اما عکس آن صحیح نیست.
رین اسکاف (۲۰۰۱) بیان می دارد که دو آزمون را در نظر بگیرید که در واقع نمره واقعی یکسانی را اندازهگیری نمی کنند، چون آنها صفتهای مختلفی را اندازهگیری میکنند. در این صورت یک آزمون با اعتبار کمتر میتواند روایی بالاتری داشته باشد، اگر صفتی که آن را اندازهگیری میکند ارتباط نزدیکتری با پیامد پیشبینی شده آزمون داشته باشد. برای مثال، یک آزمون کتبی مهارت صخره نوردی ممکن است نسبت به یک آزمون عملکردی صعود از دیوار در یک سالن ورزشی اعتبار بیشتری داشته باشد، اما دومی ممکن است روایی بیشتری به عنوان یک پیشبینی کننده از عملکرد در یک موقعیت صخره نوردی واقعی داشته باشد.
محتوا
برنامهریزان درسی و آموزشی، ابتدا نیازها را شناسایی کرده و برای مرتفع ساختن آنها، هدفهای
آموزشی را تعیین میکنند. سپس به تهیه و تنظیم محتوا بر اساس هدفهای آموزشی تعیین شده میپردازند. در ارتباط محتوا با هدف ها قابل ذکر است که می توان از طریق محتوا نیز هدف های آموزشی را لحاظ کرد. محتوا به مجموعه ای از اصول، مفاهیم و اطلاعات مرتبط به یک درس اشاره دارد که به دانشآموزان ارائه و آموزش داده میشود. محتوا را میتوان به منزلهی پلی برای رسیدن به هدفهای آموزشی تلقی کرد.
تحلیل محتوا
تحلیل محتوا روش مطالعه و تجزیه و تحلیل ارتباط ها به شیوه نظامدار، عینی و کمی برای اندازهگیری متغیرهاست. در گذشته برای اندازهگیری متغیرها با این روش، از تحلیل محتوا کمتر استفاده شده است. اما کاربرد جدید و فزاینده آن در پژوهشهای رفتاری به اندازهگیری متغیرهایی معطوف است که بدون این روش، اندازهگیری آن ها امکانپذیر نبوده است. البته این گفته بدان معنی نیست که کاربرد این روش برای تعیین تأکید نسبی یا فراوانی پدیدههایی ارتباطی مانند تبلیغات، روند ها، سبک ها، تغییر در محتوا و خوانا بودن بیاهمیت تلقی شود. تحلیل محتوا در درجهی نخست به عنوان روشی برای مشاهده و اندازهگیری مورد توجه است. به جای مشاهده مستقیم رفتار افراد، یا درخواست از آنها برای پاسخ دادن به مقیاسها، یا مصاحبه با آنها پژوهشگر ارتباطهایی که افراد ایجاد کردهاند انتخاب و سوالاتش را در آن ها جستجو میکند. این دیدگاه از تحلیل محتوا منطقی و اقتصادی است. در عمل، آن را از طبقه تحلیلی محض جدا کرده و در همان طبقه مصاحبهها، مقیاسها و دیگر روشهای مشاهده قرار میدهند. بدینترتیب آگاهانه کاری انجام میگیرد که با فعالیتهای مشاهدهای قبلی تفاوت اساسی ندارد؛ در واقع متغیرها مشاهده و اندازهگیری میشوند( کرلینجر، ۱۹۸۶، ترجمه ی شریفی، ۱۳۸۸، ص ۲۲۳).
تحقیقات انجام شده در داخل و خارج از ایران
حسنی، سامری، عباس زاده و موسوی (۱۳۹۲) در مطالعهای به بررسی نابرابری در آموزش و
پرورش دانشآموزان دختر و پسر مقطع متوسطهی استان آذربایجان غربی پرداختند. این پژوهش از نوع اسنادی و پیمایش بوده که با نمونهگیری طبقهای تصادفی نمونهای به حجم ۸۱۵ (۴۱۹ پسر – ۳۹۶ دختر) انتخاب شد. یکی از سوالات این مطالعه بررسی تفاوت بین پسران ودختران از لحاظ شاخصهای برونداد شناختی (دانشی) بود که برای پاسخگویی به این سوال، از معدل کتبی دانشآموزان سال اول، دوم و سوم متوسطه نظری و دورهی پیش دانشگاهی و درصد قبولی در کنکور استفاده شد. میانگین نمرات برای دختران (۷۵/۱۴) و پسران (۱۴) و همچنین درصد قبولی کنکور برای دختران (۲/۵۰) و پسران (۳۶/۴۶) بود که بیانگر عملکرد بهتر دختران نسبت به پسران است.
آتشک (۱۳۹۰) در یک ارزشیابی و با روش تحقیق تحلیل ثانویه داده های سرشماری سال ۹۰، به
مطالعهی عدالت جنسیتی در نظام آموزشی ایران پرداخت. از نتایج به دست آمده این بود که علیرغم دسترسی کمتر دختران به آموزش در تمامی مقاطع تحصیلی، آنها عملکرد تحصیلی بهتر و ماندگاری بیشتری نسبت به پسران در نظام آموزشی داشته اند.
بوالحسنی (۱۳۹۰) اعتبار بخشی آزمون کنکور کارشناسی ارشد رشته ی معماری را با استفاده از
مؤلفههای واریانس (نظریه تعمیمپذیری) بررسی کرد. جامعهی آماری این مطالعه، کلیهی داوطلبان شرکت کننده در کنکور سراسری ارشد سال ۱۳۸۹ مجموعه ی معماری میباشد. با نمونهگیری تصادفی ساده، ۲۰۱ نفر انتخاب شد. این آزمون، دارای یک پروژه عملی به نام اسکیس است که از داوطلبان خواسته میشود با در نظر گرفتن ملاکهای از پیش تعیین شده توسط متخصصین، طرحی را در محدودهی زمانی مشخص و با رعایت قوانین لازم، ترسیم کنند. این پروژه عملی توسط تعدادی مصحح متفاوت و مستقل از هم، بر اساس ملاکهای مشخص نمرهگذاری می شود. در این مطالعه، برای هر داوطلب ۳ نمره که توسط ۳ ارزیاب داده شده است، به عنوان دادههای تحقیق مورد تحلیل قرار گرفت. جهت تحلیل داده ها، از نرم افزارEDUG6.0 استفاده شده است. وضعیت رویههای این مطالعه به این قرار است: رویهی افراد با ۱۹۶سطح (۹۸ دختر و ۹۸ پسر) در داخل رویهی جنسیت آشیان کرده است. رویه افراد و ارزیابان و همچنین، رویه ارزیابان و جنسیت، نسبت به هم متقاطع محسوب میشوند. در مجموع، تقریباً ۲۸ واحد از واریانس نمرات، واریانس خطای نسبی است که ۹۰ درصد آن مربوط به منبع واریانس(RP:G) میباشد. همچنین، ۷۳/۳۶ واحد از واریانس نمرات، واریانس مطلق است که ۷۰ درصد آن مربوط به منبع واریانس (RP:G) می باشد. ضرایب تعمیم پذیری به دست آمده در دو وضعیت مطلق و نسبی بالاتر از ۸/۰ میباشد که بیانگر مطلوب بودن دقت اندازههاست. ضریب تعمیمپذیری نسبی در حالتی که ۶،۵،۴،۳،۲،۱و۷ ارزیاب وجود داشته باشد به ترتیب برابر ۷۱/۰، ۸۳/۰، ۸۸/۰، ۹۱/۰، ۹۲/۰ و ۹۳/۰ است. اگر ضرایب بالاتر از ۸/۰ مطلوب در نظر گرفته شوند، با دو ارزیاب نیز ضریب مورد نظر به دست میآید.
رحیمی (۱۳۸۷) به ارزیابی و تحلیل سطوح حیطه شناختی و شاخصهای روانسنجی سوالات
امتحاناتنهایی پرداخت. جامعه آماری در این مطالعه، کلیه اوراق امتحانی تصحیح شده دروس ریاضی، زبان انگلیسی، تاریخ، جغرافیا و آمادگی دفاعی دانشآموزان پایه سوم راهنمایی استان خوزستان در خرداد ماه ۱۳۸۶ میباشد که از این میان با نمونهگیری خوشه ای، ۱۰ منطقه آموزشی انتخاب و با نمونهگیری طبقهای از میان مناطق منتخب، ۱% ورقه های امتحانی معادل ۹۵۵ ورقه (در مجموع ۴۲۹۷ ورقه امتحانی) از هر درس(به غیر از درس آمادگی دفاعی) به تفکیک جنسیت به عنوان نمونه آماری تعیین گردید. از نتایج به دست آمده در این مطالعه میتوان به موارد زیر اشاره کرد:
طراحان در همه درسها بجز درس ریاضی، به اهداف در سطوح پایین حیطه شناختی توجه داشتهاند. با در نظر گرفتن تمامی شاخصهای مورد نظر، آزمون ریاضی بیشترین و آزمون آمادگی دفاعی کمترین تطابق را با اصول سنجش و روانسنجی داشتهاند. همچنین، دروس مذکور بیشترین و کمترین ضریب اعتبار ( همسانی درونی) را به میزان (۹۱/۰–۶۱/۰) به خود اختصاص دادهاند.
به طور کلی میتوان گفت؛ در همه ی دروس، اکثر سوالات در حد مطلوب و متوسط طرح شدهاند. ضریب تمیز سوالات مطلوب بوده، به گونهای که آزمون قادر به تفکیک دانشآموزان قوی و ضعیف بوده است. همچنین سوالات همسانی درونی خوبی داشتهاند به طوریکه نمیتوان پیشنهاد حذف هیچ سئوالی را داد.
جزایری در سال (۱۳۸۴) به بررسی اعتبار نمرهگذاری معلمان در امتحانات تشریحی هماهنگ و
نهایی دوره آموزشی عمومی سال سوم دبیرستان در رشتههای علوم انسانی، ریاضی فیزیک و علوم تجربی و همچنین سال سوم راهنمایی در استان لرستان پرداخته است. در این تحقیق با استفاده از روش نمونهگیری تصادفی خوشهای، از میان اوراق امتحانات تشریحی هماهنگ و نهایی سال سوم راهنمایی و سال سوم مقطع متوسطه ۱۰ منطقه آموزشی، ۷۶۷ ورقه امتحانی مورد مطالعه قرار گرفت که از روش تحلیلی جهت نمرهگذای این اوراق استفاده شده است. روش تحقیق به کار گرفته شده، همبستگی بوده و به منظور جمع آوری اطلاعات، با استفاده از جدول آرایش رتبهبندی نمرات و مشاهده اوراق امتحانی، اطلاعات لازم گردآوری و جهت بررسی میزان اعتبار نمرهگذاری مصححان، روش گیلفورد به کار گرفته شده است. نتایج به دست آمده از این تحقیق عبارتند از :
ضریب اعتبار برای دروس مورد مطالعه در رشتههای علوم انسانی و علوم تجربی ۹۹/۰ و دامنه
ضریب اعتبار برای دروس مورد مطالعه در رشته ریاضی فیزیک و سال سوم راهنمایی (۹۹/۰ – ۹۵/۰) به دست آمده است.
۲/۹۷ درصد از تغییرات نمرات اوراق امتحانی در مراحل اول و دوم تصحیح در دامنه کمتر از ۲۵/۰
است که این بیانگر اشتراک نظر و توافق بسیار بالای مصححان اول و دوم این اوراق میباشد. به عبارتی دیگر، اگر مصحح دوم حذف شود در واقع هیچ اتفاقی نخواهد افتاد.
اختلاف نمره مصححان با جنسیت آنها رابطه ندارد و عوامل سوگیری در تصحیح اوراق، ناشی از
تفاوتهای فردی مصححان نبوده، بلکه بیشتر مربوط به ساختار اجرایی و فرایند تصحیح اوراق امتحانی بوده است. از جمله اینکه این اوراق بدون فاصله زمانی توسط مصححان اول و دوم نمرهگذاری شده و همواره این روند از نظر مکانی و زمانی ثابت بوده است.
واحدی و فزون مهر (۱۳۸۴)، میزان انطباق سوالات امتحانات نهایی و داخلی سال سوم راهنمایی
را با شاخصهای روانسنجی در دروس ریاضی، جغرافیا، علوم تجربی و دینی مورد

مطلب مشابه :  منابع پایان نامه دربارهاستاندارد، تعمیم پذیری، ادبیات فارسی، اندازه گیری
دسته بندی : No category

دیدگاهتان را بنویسید