سربرگ را به ترتیب شماره مسلسل رمز به صورت ۵۰ تایی از هم تفکیک میکنند و هر ۵۰ نسخه اوراق امتحانی را همراه با سوال و راهنمای تصحیح در پاکت گذاشته و تحویل مصححان میدهند. پس از تصحیح، عین اوراق را در همان پاکت از مصححان دریافت و سپس اوراق تصحیح شده توسط مصحح اول را به ترتیب انجام شده در اختیار مصحح دوم قرار میدهند. خلاصه اینکه هر ورقه امتحانی دو مرتبه و توسط دو مصحح بطور جداگانه تصحیح میشود و مصحح دوم میبایست ورقه امتحانی را بدون در نظر گرفتن تصحیح اول، به معنای واقعی همانند مصحح اول ، تصحیح و اقدام به نمرهگذاری نماید. مصححان موظفند مطابق با بارم و ریز بارم هر سوال عمل کرده و همچنین موظفند که ریز بارم هر سوال را روی نوشتهها، شکلها، فرمولها و قسمتهای مختلف که بر اساس راهنمای تصحیح به آنها نمره تعلق میگیرد به طور جداگانه و جزء به جزء مشخص و ثبت نمایند و جمع نمرهی متعلق به پاسخ هر سوال را در سمت چپ ورقهی امتحانی به طور خوانا بنویسند. سپس جمع نمرات داده شده را در محل مربوط با عدد وحروف ثبت کرده و با درج نام و نامخانوادگی، زیر آن را امضا نمایند. برای تمایز میان کار دو مصحح، مصحح اول از خودکار قرمز و مصحح دوم از خودکار سبز استفاده میکند.
در صورت اختلاف نمره بین دو مصحح و توافق آنها با هم، مصححان نمره توافق شده را تأیید و امضاء مینمایند بدون اینکه در نمرهی قبلی داده شده خدشهای وارد شود. در صورت مغایرت نمره و عدم توافق مصحح اول و دوم، ورقه امتحانی مجدداً توسط مصحح سوم (غیر از مصحح اول و دوم) تصحیح میشود. پس از اینکه نمرات داده شده توسط مصححان به طور کامل کنترل و بررسی شد، سربرگ اوراق با توجه به شماره رمز آن به تهبرگ همان ورقه دوخت میشود. پس از اعلام نمرات، اوراق امتحانی (بدون سربرگ) دانشآموزان معترض به مصححی غیر از مصحح اول، دوم و سوم (در صورت عدم توافق مصحح اول و دوم) جهت تصحیح داده میشود.
مبانی نظری
هر رشتهی علمی با یک سری نظریهها مواجه است که زیربنا و بنیاد آن رشته را تشکیل میدهد و شالودهی دستاوردها و یافتههای علمی آن شاخه از علوم محسوب میشود. از زمان پیدایش علم روان سنجی تغییرات بنیادی زیادی در نظریه های آن صورت گرفته است و این سیر تحولی به گونه مستمر ادامه داشته است.این نظریهها دارای انواع و مدلهایی هستند و هر کدام معطوف به بعد خاصی از اندازهگیری میباشند. یک نظریه یا مدل اندازهگیری خوب در یک آزمون سنجش توانایی با مشخص کردن رابطه ی بین سوالات آزمون و سطح توانایی، چارچوب مرجعی جهت طراحی آزمون مناسب و حل مشکلات عملی مربوط به آن فراهم میسازد. بدیهی است که از یک نظریه و مدل مناسب، انتظار میرود که بتواند دقت قابلقبولی در اندازهگیری پدیده مورد نظر داشته باشد.
نظریههای آماری نمرات اندازهگیری به تدریج در طول صد سال اخیر توسعه یافتهاند. در سال ۱۹۰۴، چارلز اسپیرمن۲۳ مبنای نظری اساسی برای الگوی نمره واقعی ارائه داد. در چند دهه پس از آن، تحولات بسیاری شکل گرفت. گالیکسن۲۴(۱۹۵۰)، تمام این تحولات را در یک سیستم واحد منسجم خلاصه کرد. این سیستم متشکل از قضایا و معادلات آماری به عنوان نظریه کلاسیک اندازهگیری شناخته شده است. فردریک لرد۲۵(۱۹۵۲) و جرج راش۲۶(۱۹۶۰)آنچه را که در حال حاضر به عنوان نظریه پرسش – پاسخ شناخته میشود را به طور مستقل گسترش دادند. در سال ۱۹۶۳، لی کرونباخ۲۷ (کرونباخ، راجاراتنام۲۸ و گلیسر۲۹، ۱۹۶۳) نظریه تعمیمپذیری را تثبیت کرد (سوئن و لی،۲۰۰۷ ). برنان۳۰ (b2010) متذکر میشود که تفاوتهای میان مدلها بنیادی و مهم هستند، اما هریک از این مدلها قابل دفاع و سودمند هستند، و هیچیک از آنها جایگزینی برای دیگری نیست. همچنین از اینکه بیشتر تحقیقات فعلی در اندازهگیری آموزشی به تفاوتهای میان این مدلها، مخصوصاً تفاوت های میان مفروضاتشان توجهی نمیکنند، اظهار تأسف میکند. بنا به مطالب ذکر شده و در راستای موضوع پژوهش، در این بخش تلاش میشود که به معرفی سه نظریه مذکور و شرح مفاهیم، مفروضات، محدودیتها و تقابلهای آنها پرداخته شود.
نظریه کلاسیک آزمون (CTT)
نظریه کلاسیک آزمون، الگوی ساده و کاملاً مفیدی است که میتواند نحوهی تأثیر خطاهای اندازهگیری را بر نمرات مشاهده شده توصیف کند (آلن و ین، ۱۹۷۹، ترجمه دلاور، ۱۳۸۷، ص۸۶). این نظریه برای کمیسازی خطاهای اندازهگیری بوجود آمده است و به ما میگوید که تا چه حد میتوان به نمرات به دست آمده از آزمون اعتماد کرد. این نظریه اساساً در ارتباط با اعتبار آزمون است و معادله اساسی آن چنین است:
x = T + E
بر طبق این تعریف، هر نمره مشاهده شدهی۳۱ آزمون (x) از مجموع دو مؤلفهی مستقل و جمعپذیر، نمره واقعی۳۲ (T) و خطای تصادفی۳۳(E) تشکیل شده است. نمره مشاهده شده نمرهای است که فرد در هر آزمون به دست میآورد. توضیح مفهوم (T) نیاز به کمی تصور و تحمل ایهام دارد: شخصی را تصور کنید که به کرات مورد آزمون قرار میگیرد، سریهای متفاوتی از سوالات استفاده میشوند که از مجموعهی همه سوالات طراحی شده جهت اندازهگیری سازه زیربنایی انتخاب شدهاند. میانگین همهی این نمرهها (ارزش مورد انتظار۳۴) نمرهی واقعی (T) شخص است. نمرهی خطا نیز اختلاف دو نمرهی مشاهده شده و واقعی است. اساساً باید به خاطر داشت که نمرات واقعی و خطا، ساخت نظری و غیر قابل مشاهده شدهای دارند.
مفروضات نظریه کلاسیک آزمون
در این الگو فرض بر این است که برخی از شرایط درست است، در صورتی که این مفروضات مستدل باشند، نتایجی هم که از الگو حاصل میشود مستدل خواهد بود. در غیر این صورت استفاده از این الگو به نتیجهگیریهای غلط میانجامد. در این قسمت مفروضههای نظریه کلاسیک آزمون مطرح میشوند که از کتاب مقدمهای بر نظریه های اندازه گیری(همان منبع، ص ۸۷ )گرفته شده است.
نمرهی مشاهده شده از مجموع دو مؤلفه تشکیل شده است: نمره واقعی(T) و نمرهی خطا (E).
x = T + E
ارزش مورد انتظار برای نمرات مشاهده شده (x) برابر با نمره واقعی (T) است.
ε(x)=T
برای جامعه اصلی همبستگی نمرات خطا و نمرات واقعی به دست آمده از یک آزمون برابر صفر
است. به این معنی که مقدار خطا مستقل از نمرهی واقعی است. این فرض بیان می دارد که آزمونهایی که نمره واقعی بالایی دارند، خطای اندازهگیری مثبت یا منفی بیشتر از آزمودنیهایی که نمره واقعی آنها پایین است، ندارند.
ρ_ET=0
همبستگی نمرات خطای دو آزمون، برابر صفر است. به عبارتی دیگر نمرات خطای دو آزمون
مستقل از هم و ناهمبسته هستند. به این معنی که چنانچه نمره خطای فردی در آزمون اول مثبت باشد نمیتوان پیشبینی کرد که نمره خطای او در آزمون دوم مثبت خواهد شد یا منفی.
ρ_E1E2=0
همبستگی نمرات خطا در یک آزمون (E1) با نمرات واقعی آزمون دیگر (T2) صفر میباشد.
ρ_E1T2=0
دو آزمون موازی۳۵ هستند اگر نمره واقعی و واریانس خطاهای آن دو، برابر باشد. همچنین
همبستگی هر یک از آنها با آزمونهای دیگر یکسان باشد.
تفاوت بین نمرات واقعی آزمونهایی که اساساً تائو معادل۳۶ هستند، در یک مقدار ثابت اضافی
است. برعکس آزمونهای موازی، این آزمونها میتوانند واریانسهای خطای نامساوی داشته باشند.
محدودیتهای نظریه کلاسیک آزمون
در حالی که نظریه کلاسیک آزمون چارچوبی آماده دارد که در برخی شرایط مفید نشان داده شده است، روانسنجان درست همان موقعی که در حال گسترش نظریه بودند، بسیاری از محدودیتهای آن را تشخیص دادند. در این قسمت با استفاده از کتاب مبانی نظریه پرسش – پاسخ (همبلتون۳۷ و همکاران،۱۹۹۱، ترجمه فلسفی نژاد، ۱۳۸۹)، جزوه کلاسی فلسفینژاد (۱۳۹۱)، کتاب روانسنجی پیشرفته کاربردی (ستاری، ۱۳۸۲) و دایرۃ المعارف بینالمللی علوم اجتماعی و رفتاری (۲۰۰۱) به برخی محدودیتهای اساسی این نظریه اشاره میشود.
برآورد پارامترهای سوالات آزمون از جمله درجه دشواری۳۸ و قدرت تشخیص سوال۳۹، به
ویژگیها و سطح توانایی آزمودنیها بستگی دارد، لذا با تغییر وضعیت آزمودنیها و انتخاب نمونهی دیگر از جامعه آزمودنیها، پارامترهای سوالات نیز تغییر میکند. این که سوال سخت است یا ساده، به توانایی آزمودنیهایی که مورد اندازهگیری قرار گرفتهاند بستگی دارد. دو گروه یکی با سطح توانایی بالا و دیگری با سطح توانایی پایین را در نظر بگیرید. به هر دو گروه سوال یکسانی داده میشود. مقدار ضریب دشواری متفاوتی برای هر دو گروه به دست خواهد آمد. برای گروهی با سطح توانایی بالا، سوال ساده و برای گروه با سطح توانایی پایین، سوال سخت خواهد بود. این بار دو گروه از آزمودنیها را که از نظر سطوح توانایی، اولی ناهمگن۴۰ و دومی همگن۴۱ است را در نظر بگیرید. اگر سوال یکسانی به دو گروه داده شود، ضریب تشخیص بالاتری در گروه اول نسبت به گروه دوم به دست میآید و به تبع آن ضریب اعتبار آزمون نیز در گروهی که دامنه گستردهای از مهارت یا تواناییها را دارد نسبت به گروهی که دارای دامنه محدودی از مهارت یا توانایی است، بالاتر است. به بیان گویاتر، مفهوم اعتبار ویژگی خود آزمون نیست بلکه بستگی به گروهی از آزمودنیها دارد که برای پرورش آزمون مورد استفاده قرار گرفتهاند.
برآورد توانایی آزمودنیها به سوالات آزمون وابسته است. به این معنی که نمونههای متفاوت
سوال به برآوردهای متفاوتی از توانایی افراد مورد سنجش منجر میشود. در چارچوب نظریه کلاسیک آزمون، مفهوم توانایی بوسیله نمره واقعی بیان میشود. هم نمره مشاهده شده و هم نمره واقعی هر دو وابسته به آزمون مورد استفاده هستند. وقتی که آزمون دشوار است، به نظر میرسد که آزمودنی توانایی پایینی دارد و وقتی که آزمون آسان است به نظر می رسد که آزمودنی دارای توانایی بالایی باشد. بنابراین نمیتوان یک مقدار توانایی ثابتی را در روی پیوستار صفت مکنون برای آزمودنی به دست آورد. در نتیجه مقایسه آزمودنیهایی که در آزمونهای مختلف شرکت کردهاند، خیلی دشوار است.
مفاهیم و تعاریف نظریه CTT غیر قابل آزمایش هستند. در واقع راهی وجود ندارد تا معین شود
چه اندازه مفروضههای نظریه کلاسیک آزمون با واقعیات در ارتباط است.
یکی از نتایج نظری مدل کلاسیک آزمون، ساخت فرمهای موازی آزمون است. این امر از
لحاظ نظری قابل دفاع است لیکن در عمل، ساخت آزمونهای موازی واقعی غیرممکن است. زیرا نمرات
واقعی و خطا، ساخت نظری غیر قابل مشاهده دارند و موازی بودن فرمها قابل تبیین و توجیه نیست.
نظریه کلاسیک آزمون، آزمون مدار۴۲ است. در قالب این نظریه، نمره کل را برای تفسیر در نظر
میگیرند. نمره کلها میتوانند با هم مشابه باشند در حالیکه توانایی و مهارتهای افراد با هم متفاوت باشد. این نظریه توجهی به اینکه یک آزمودنی چطور به سوال پاسخ میدهد ندارد. به عبارت دقیقتر،

مطلب مشابه :  منابع پایان نامه دربارهادبیات فارسی، زیست شناسی، اندازه گیری، دانشجویان
دسته بندی : No category

دیدگاهتان را بنویسید