جامعه در یک سوال در جهان برحسب مدل خطی زیر بیان میشود:
x_pi= μ اصلی میانگین
〖+ μ〗_p- μ فرد اثر
〖 + μ〗_i- μ سوال اثر
μ_i+ μ باقیمانده اثر – μ_p – 〖+ x〗_pi
طبق گفتهی برنان (۲۰۰۳)، همهی اثرات (به غیر از μ) اثرات تصادفی نامیده میشوند زیرا آنها مرتبط با روش نمونهگیری تصادفی از جامعه و جهان هستند. همچنین، فرض میشود که همهی اثرات در مدل ناهمبسته هستند. همانطور که وب و شیولسون (۲۰۰۵) بیان کرده اند؛ توزیع هر مؤلفه یا اثر به غیر از میانگین اصلی۷۷ ، یک میانگین صفر و واریانس σ^۲ ( بنام مؤلفه واریانس) دارد. مؤلفه واریانس برای اثر فرد، واریانس نمره جهان۷۸ نامیده می شود و مؤلفههای واریانس برای دیگر اثرات، واریانس خطا در نظر گرفته می شود. واریانس نمره مشاهده شده از ترکیب مؤلفههای واریانس به دست می آید و به صورت زیر نشان داده می شود:
σ_(〖(x〗_pi))^2 = σ_p^2+σ_i^2+σ_(pi,e)^2
این طرح ۴ مؤلفه واریانس را برآورد میکند که دو مؤلفهی اثر تعاملی و منبع خطا، تحت یک مؤلفه
واریانس(σ_(pi,e)^2) نشان داده میشود. نمودار این طرح به صورت زیر است :
نمودار۲-۱: طرح ۱
طرح ۲ : هر فرد آزمودنی(p) به سوالات مختلف (i) پاسخ میدهد.
جدول ۲-۲: مشخصات طرح ۲
نام طرح
طرح یک رویه ای آشیانه ای
علامت طرح
i : p
تعداد مؤلفههای واریانس برآورد شده
۲
مدل مناسب برای دادهها
ANOVA دو راهه
نمره مشاهده شده برای شخص در جامعه در یک سوال در جهان به صورت زیر تجزیه میشود:
x_pi= μ اصلی میانگین
〖+ μ〗_p- μ فرد اثر
باقیمانده اثر μ_p – 〖+ x〗_pi
در این طرح سوال مربوط به تغییرپذیری سوالات آزمون بدون پاسخ میماند و واریانس نمره مشاهده شده به دو مؤلفه واریانس به صورت زیر تجزیه میشود:
σ_(〖(x〗_pi))^2 = σ_p^2+σ_(i:pi,e)^2
لازم به ذکر است که در این طرح، اثر مستقیم مؤلفه واریانس مربوط به رویهی آشیانهای (i) را جدا از مؤلفه واریانس اثر متقابل (pi) نمیتوان بررسی کرد. به بیانی دیگر، در طرح آشیانهای اثر مستقیم (i) همراه با اثر متقابل (pi) و سایر خطاهای تصادفی برآورد میشود. نمودار این طرح به صورت زیر میباشد:
نمودار۲-۲: طرح ۲
طرح ۳: هر فرد آزمودنی (p) به تمام سوالات آزمون (i) پاسخ میدهد و هر ارزیاب (r) به هر سوال هر فرد نمره میدهد.
جدول ۲-۳: مشخصات طرح ۳
نام طرح
دو رویه ای متقاطع
علامت طرح
p×i×r
تعداد مؤلفه های واریانس برآورد شده
۷
مدل مناسب برای داده ها
ANOVA سه راهه
در این طرح، جامعه و جهان مشاهدات قابل قبول (که شامل دو رویه متقاطع است) متقاطعاند. نمره مشاهده شده هر فرد در یک سوال که توسط یک ارزیاب داده شده است به عوامل زیر تجزیه میشود: یک اثر برای میانگین اصلی؛ سه اثر برای فرد، سوال و ارزیاب؛ سه اثر تعاملی دو طرفه (pr، pi، ri) و اثر باقی مانده (تعامل سه طرفه pir باضافه ی خطای تصادفی). واریانس نمره مشاهده شده، در سراسر جامعهی افراد و سطوح در جهان مشاهدات قابل قبول به هفت مؤلفه واریانس مستقل مطابق زیر تجزیه میشود:
σ_(〖(x〗_pir))^2 = σ_p^2+σ_i^2+σ_r^2+σ_pi^2+σ_pr^2+σ_ir^2+σ_(pir,e)^2
نمودار این طرح به صورت زیر نمایش داده میشود:
نمودار ۲-۳: طرح ۳
برآورد مؤلفههای واریانس
همانطور که فن و سان (۲۰۱۳) بیان کردهاند؛ در هر مطالعه تعداد متفاوتی از مؤلفههای واریانس به کار گرفته میشود که بستگی به طرح مطالعه و نوع تفسیر اندازهها دارد. از مؤلفههای واریانس برآورد شده در مطالعه G میتوان جهت برآورد واریانس نمره جهان، واریانس های خطا و ضرایب اعتبار مانند برای جهان تعمیم و طرحهای مطالعه D استفاده کرد. مؤلفههای واریانس را می توان با استفاده از ترکیب نظری میانگین مجذورات که میانگین مجذورات مورد انتظار۷۹ (EMS) نامیده می شود برآورد کرد. یعنی با استفاده از روش تحلیل واریانس، میانگین مجذورات MS بهدست آمده برای هر مؤلفه، در معادلات EMS مربوط به آن مؤلفه قرار داده می شود و بدین ترتیب مؤلفههای واریانس به دست می آیند. البته با روشهای دیگری همچون بیشینه درستنمایی نیز برآورد مؤلفههای واریانس امکانپذیر است. برای طرح ۱ که پیش از این توصیف شد- طرحی که در آن نمونهای از n_p فرد بهn_i سوال پاسخ میدهد- در قالب جدول زیر فرمولهای مربوط به برآورد هر مؤلفه واریانس (ECV) ارائه میشود.
جدول ۲-۴: طرح یک رویه ای i P× مطالعهG – اثرات تصادفی
منبع واریانس
MS
EMS
ECV
فرد (P)
〖MS〗_P
σ_(pi,e)^2+ n_i σ_p^2
σ ̂_p^2= (〖MS〗_P-〖MS〗_(pi,e))/n_i
سوال (i)
〖MS〗_i
σ_(pi,e)^2+ n_p σ_i^2
σ ̂_i^2= (〖MS〗_i-〖MS〗_(pi,e))/n_p
pi,e
〖MS〗_(pi,e)
σ_(pi,e)^2
σ ̂_(pi,e)^2=〖MS〗_(pi,e)
انواع تصمیم و واریانسهای خطا
در یک وضعیت اندازهگیری، نوع تفسیر نمره (هنجار در مقابل ملاکمرجع) تعیین می کند که کدام تصمیم (نسبی یا مطلق) مناسب است و واریانس خطا به طور متفاوتی برای هر نوع از تصمیم تعریف می شود. یک تصمیم مطلق۸۰ است اگر تصمیم درباره افراد مبنی بر نمراتشان در ارتباط با یک ملاک باشد. به بیانی دیگر، تصمیم مطلق بر روی سطح عملکرد افراد بدون توجه به رتبهی آنها متمرکز است و در ارتباط با ثبات جایگاه نسبی افراد و هم ثبات نمرات واقعی است. واریانس خطا برای تصمیم مطلق را با علامت σ_((∆))^۲ نشان میدهند و آنرا واریانس خطای مطلق۸۱ می نامند که شامل همه مؤلفههای واریانس مدل به جز هدف اندازهگیری است. این نوع واریانس بیانگر تفاوت میان نمره مشاهده شده و نمره جهان فرد است. یک تصمیم نسبی۸۲ است اگر تصمیم درباره افراد مبتنی بر جایگاهشان در ارتباط با دیگران باشد. این نوع تصمیم بر روی تفسیر نمره هنجارمرجع متمرکز است. یعنی نمرات اندازهگیری برای متمایز کردن آزمودنیها به کار میروند. اعتبار اندازهگیری در این حالت مربوط به ثبات جایگاه نسبی افراد است نه در مورد ثبات نمرات واقعی. واریانس خطا برای تصمیم نسبی را با علامتσ_((δ))^۲ نشان می دهند و آن را واریانس خطای نسبی۸۳ مینامند. این نوع واریانس شامل همه ی مؤلفههای واریانس تعاملی است که هدف اندازهگیری را در بر میگیرد. واریانس خطای نسبی به صورت تفاوت میان نمره انحرافی مشاهده شده شخص۸۴ و نمره انحرافی جهان۸۵ او تعریف میشود. این نوع واریانس مشابه واریانس خطا در CTT است. ریشه دوم واریانسهای خطا (نسبی و مطلق)، برآوردی از خطای استاندارد اندازهگیری (نسبی و مطلق) است که میتوان از آن در جهت ساخت فواصل اطمینان حول نمره جهان فرد استفاده کرد.
در کل واریانس خطای نسبی کمتر از واریانس خطای مطلق است زیرا شامل مؤلفههای واریانس کمتری است. این نشان میدهد که تفسیرهای نسبی در مورد نمرات افراد نسبت به تفسیرهای مطلق کمتر مستعد خطا هستند. در شکل زیر، تفاوت میان خطای مطلق و خطای نسبی طرح P×I نشان داده شده است. قسمتهای هاشور خورده، سهم واریانس خطا تحت سطوح مختلف است.
خطای مطلق خطای نسبی
نمودار ۲-۴: سهم واریانس خطای نسبی و مطلق در طرح یک رویهای متقاطع
واریانس خطا برای این طرح در صورتی که تصمیم نسبی باشد :
σ_((δ))^۲= (σ_(pi,e)^2)/(n_i ) ́
همچنین، واریانس خطا برای تصمیمهای مطلق به صورت زیر تعریف میشود:
σ_((∆))^۲= (σ_i^2)/(n_i ) ́ + (σ_(pi,e)^2)/(n_i ) ́
اگر رویه موجود در طرح، رویه سوال باشد؛ (n_i ) ́ تعداد سوالات تعریف شده در مطالعه D است (برنان، a 2010؛ وب و شیولسون، ۲۰۰۵؛ فن و سان، ۲۰۱۳).
انواع ضرایب
هنگامی که در مورد مفهومسازی خطا (نسبی در مقابل مطلق) تصمیم گرفته شد، سطوح اندازهگیری مختلفی در سنجش اعتبار به کار میرود. ضریب اعتبار و محاسبه آن بستگی به مفهومسازی خطای از پیش تعیین شده به عنوان مطلق یا نسبی دارد. به بیان دیگر، GT میان دو نوع ضریب اعتبار تمایز میگذارد:
اولین، ضریب تعمیمپذیری (ضریب G) است و زمانی به کار میرود که تصمیمها نسبی هستند. این ضریب، همه منابع خطایی که جایگاه نسبی افراد را تحت تأثیر قرار میدهد (تعاملات هر رویه با هدف اندازهگیری) را در بر میگیرد. ضریب G را با علائم〖Eρ〗^۲ یا ρ^۲ نمایش میدهند و فرمول آن به صورت زیر میباشد:
〖Eρ〗^۲= (σ_P^2)/(σ_P^2+σ_((δ))^۲ )
دومین، شاخص اتکاپذیری (φ) است و برای تصمیمهای مطلق به کار میرود. این شاخص، همهی مؤلفههای واریانس به غیر از هدف اندازهگیری را در بر میگیرد و به صورت زیر فرمولبندی میشود:
φ= (σ_P^2)/(σ_P^2+σ_((∆))^۲ )
تفاوت ضریب تعمیم پذیری و شاخص اتکاپذیری در این است که اولی شامل واریانس خطای نسبی و دومی شامل واریانس خطای مطلق است. بنابراین شاخص اتکاپذیری عموماً کمتر از ضریب تعمیمپذیری است(همان منبع).
در قسمت زیر، به نظریه پرسش – پاسخ(IRT)، به همراه مفروضات، مفاهیم اساسی و مدلهای آن اشاره میشود. مطالب آن از منابع جزوه کلاسی فلسفی نژاد (۱۳۹۱)؛ همبلتون و همکاران (ترجمهی فلسفینژاد، ۱۳۸۹)؛ امبرتسون و رایس (ترجمهی شریفی و همکاران، ۱۳۸۸)؛ ستاری (۱۳۸۲) و بیکر (ترجمهی هومن و عسگری، ۱۳۸۱) گرفته شده است.
نظریه پرسش – پاسخ(IRT)
نارساییهای نظریه کلاسیک موجب شد از سال ۱۹۸۰ به بعد به طور چشمگیری از نظریه پرسش – پاسخ (IRT) استفاده شود. بهطوریکه این نظریه به سرعت به صورت خطوط فکری پایههای نظری اندازهگیری درآمده است. نظریه پرسش – پاسخ چارچوب مفیدی را برای حل مسائل متنوع و گسترده اندازهگیری فراهم میآورد. نظریه پرسش – پاسخ که به عنوان نظریه صفت مکنون نیز معروف است، اندازهگیری مبتنی بر مدل است که بر اساس آن سطح توانایی آزمودنی از روی پاسخهای او به سوالات آزمون برآورد میشود. این نظریه مجموعهای از مدلهای ریاضی و آماری است که برای تبیین رابطه تابعی میان صفت زیربنایی مورد سنجش که غالباً توانایی۸۶ است و احتمال پاسخ صحیح به سوال به کار می رود. این نظریه توانسته است برای طراحی و تحلیل آزمونهای

مطلب مشابه :  منابع پایان نامه دربارهزیست شناسی، توزیع فراوانی، استاندارد، روانسنجی
دسته بندی : No category

دیدگاهتان را بنویسید