این نظریه ما را به پیشبینی نحوه عملکرد یک فرد یا یک گروه از آزمودنیها در مواجه با یک سوال خاص قادر نمیسازد.
نظریه کلاسیک آزمون به اندازه کافی برای توزیعهای نمره مشاهده شده آزمون که اثرات پایه
و سقف دارند دلیل موجهی نمیآورد، جایی که نسبت بزرگی از نمره آزمودنیها در هر دو انتهای پایین و بالای دامنهی نمره آزمون قرار دارند.
مجموعهی متنوع و گستردهای از عوامل میتواند نمرات مشاهده شده را تحتتأثیر قرار دهد،
از جمله چگونگی ساخت سؤالات، اجرای آزمونها، نمره گذاری سوالات. در CTT همه این عوامل فقط در اصطلاح خطای تصادفی در مدل آماری گنجانیده شده است.
اعتبار در نظریه کلاسیک اندازهگیری به عنوان ” همبستگی میان فرمهای موازی یک آزمون”
تعریف میشود. در عمل مرتفع کردن شرایط تعریف آزمونهای موازی اگر غیرممکن نباشد، دشوار است. ضرایب اعتبار موجود، برآورد حد پایین اعتبار را به دست میدهند یا برآوردی از اعتبار با سوگیری نامعلوم را فراهم میسازند.
خطای استاندارد اندازهگیری۴۳ که تابعی از واریانس و ضریب اعتبار آزمون میباشد، فرض
میشود که برای همه آزمودنیها در همه سطوح توانایی یکسان است. در حالیکه، برحسب سطوح مختلف نمرات حقیقی و موقعیت آزمودنیها بر روی پیوستار صفت مکنون، خطای اندازهگیری متفاوت است و معمولاً آزمودنیهای با توانایی کمتر دارای خطاهای استاندارد اندازهگیری بیشتری هستند تا آزمودنیهای قویتر و با نمرات حقیقی بالاتر. علاوه بر آن، خطای معیار اندازهگیری به گروه نمونه وابسته است زیرا نمیتوان آن را جدا از اعتبار آزمون تعیین کرد.
نظریه تعمیم پذیری(GT)
عوامل مختلفی، نمرات مشاهده شده آزمون را تحت تأثیر قرار میدهد. در نظریه کلاسیک آزمون، همه
این عوامل تحت یک عبارت خطای تصادفی نامتمایز در مدل آماری گنجانیده میشود. روانسنجان برای لحاظ کردن این عوامل و تفکیک آنها در مدلهای آماریشان، نظریه تعمیمپذیری را گسترش دادند. بنا به گفتهی برنان (a2010)، نظریه تعمیمپذیری چارچوب مفهومی گسترده و مجموعه محکمی از روشهای آماری را برای پرداختن به مسائل اندازه گیری متعدد فراهم کرده است تا حدی که، این نظریه را میتوان به دلیل به کار بستن روشهای تحلیل واریانس۴۴(ANOVA) به عنوان بسطی از نظریه کلاسیک آزمون تلقی کرد. نظریه کلاسیک آزمون و ANOVA را میتوان به عنوان والدین نظریه تعمیمپذیری پنداشت، اما این کودک هم بیشتر و هم کمتر از پیوند سادهی والدینش است. اگر چه نظریه تعمیمپذیری، نظریه کلاسیک آزمون را گسترش داده است، اما همه ابعاد نظریه کلاسیک آزمون در نظریه تعمیمپذیری وارد نشده است. علاوه بر این، مسائل ANOVA که در نظریه تعمیمپذیری بر آن تأکید میشود متفاوت از مسائلی است که در بسیاری از طرحهای آزمایشی و متون ANOVA غالب است. نظریه تعمیمپذیری به طور خاص بر روی مؤلفههای واریانس۴۵ و برآوردشان تمرکز میکند.
در این نظریه با تجزیه واریانس نمره کل به رویه های۴۶ چندگانه، امکان برآورد درصد واریانس ناشی از هر رویه بوجود میآید و از این طریق میتوان رویهای (منبع خطا) که مقدار مؤلفه واریانس آن و یا مقدار مؤلفههای واریانس اثرهای متقابل آن زیاد است را شناسایی کرد و در ادامه با اقدامات مؤثر مقدار واریانس خطا را کاهش داد و فرایند اندازهگیری را بهبود بخشید. فرض کنید در بررسی که انجام دادهاید، رویه ارزیاب مؤلفه واریانس بزرگتری دارد. در اینجا میتوان با افزایش سطوح این رویه (افزایش تعداد ارزیابان) و یا آموزش بهتر برای ارزیابان، به ثبات بهتری در بین ارزیابان رسید. همانطور که فن و سان۴۷ (۲۰۱۳) بیان نموده اند؛ این نظریه با مطالعات D برای طرحهای اندازهگیری مختلف، به محققین این امکان را میدهد که تأثیر سطوح اندازهگیری۴۸ را بر روی اندازه اعتبار بسنجند و اندازه اعتبار را در مطالعه واقعیشان پیشبینی کنند. در این راستا محققین میتوانند با استفاده از قابلیت انعطاف پذیری و پیشبینی این نظریه و با در نظر گرفتن ملاحظات عملی، پروتکل اندازه گیری بهینهای را طراحی کنند.
در GT، اعتبار مسئلهای است از نظر درجهای که میتوان از یک مشاهده به جهانی از مشاهدات تعمیم
داد (کرونباخ، گلیسر، ناندا و راجاراتنام، ۱۹۷۲، به نقل از براون۴۹، ۲۰۰۵). از آنجا که یک اندازه خاص ممکن است به جهانهای بسیار متفاوتی تعمیم داده شود، بنابراین با ضرایب اعتبار مختلفی همراه خواهد بود. ضریب تعمیمپذیری (اعتبار) یک آزمون، ویژگی تغییرناپذیر آن نیست بلکه تحت تأثیر شرایط اجرای آزمون قرار دارد. بر اساس این نظریه، یک آزمون میتواند برای برخی مقاصد معتبر باشد ولی برای مقاصد دیگر کاملاً نامعتبر باشد. GT قابلیت کاربرد گستردهای دارد و در زمینههای متعددی به کار گرفته شده است.
مفاهیم و اصطلاحات در GT
بنا به گفتهی برنان (a2010) مهمترین وجه و ویژگی منحصر به فرد GT چارچوب مفهومی آن است.
لذا برای ارتباط برقرار کردن با این نظریه و درک چارچوب مفهومی آن، مفاهیم و اصطلاحات رایج در این نظریه جداگانه و با استفاده از مثال زیر شرح داده میشود.
مثال : از دانشآموزانی که در المپیاد زیستشناسی شرکت کرده بودند، خواسته شد به چند سوال تشریحی پاسخ دهند. هر یک از سوالات توسط دو ارزیاب، نمره گذاری میشود.
هدف اندازهگیری
هدف اندازهگیری عاملی است که عمدتاً روی آن متمرکز شده و میتواند هر چیزی باشد که مورد توجه اندازهگیری در یک وضعیت خاص قرار میگیرد. در بسیاری از وضعیتهای اندازهگیری، افراد هدف اندازهگیری هستند. هدف اندازهگیری در مثال ذکر شده، دانشآموزان هستند.
جامعه۵۰
جامعه به اهداف اندازهگیری اختصاص دارد.
رویهها
مجموعهای از سطوح اندازهگیری که قصد آن است عملکرد آزمودنیها در این سطوح مورد سنجش قرار گیرد؛ ابعاد روش اندازهگیری؛ منابع بالقوهای از خطا در تعمیم.
مثال ذکر شده، دارای دو رویه است. رویهی سوال و رویه ارزیاب. هر یک از سوالات یک سطح اندازهگیری قابل قبول برای رویه سوال را میسازد. بدین ترتیب نمرهی مشاهده شدهی سوالات آزمون فرد، یک نمونه تصادفی از تمام سوالات ممکن یا جهان سوالات قابل قبول فرض میشود. همچنین هر فرد ارزیاب یک سطح اندازهگیری قابل قبول برای رویه ارزیاب است. نمرهی داده شده توسط این ارزیابان، یک نمونه تصادفی از تمام نمراتی است که توسط جهان ارزیابان قابل قبول به دست میآید.
جهان۵۱
جهان نوعاً برحسب مجموعهای از سطوح اندازهگیری تعریف میشود که نسبت به سطوحی که از طریق اندازهگیریهای نمونه به دست میآید وسیعتر است.
جهان مشاهدات قابل قبول۵۲
جهان مشاهدات قابل قبول بوسیله همه ترکیبات ممکن از سطوح رویه ها تعریف میشود. یک اندازه رفتاری (مثل نمره آزمون) به عنوان نمونهای از یک جهان مشاهدات قابل قبول تصور میشود که این جهان، شامل همه مشاهدات ممکن است که تصمیمگیرندگان جایگزینهای قابل قبولی از آن برای مشاهده موجود (تحت مطالعه) در نظر میگیرند (وب و شیولسون، ۲۰۰۵). جهان مشاهدات قابل قبول در مثال مذکور، شامل دو رویه سوال و ارزیاب است.
جهان تعمیم۵۳
برنان (۲۰۰۱) بیان میکند جهان تعمیم، جهانی است که محقق قصد دارد نتایج یک روش اندازهگیری خاص را به آن تعمیم دهد. مجموعه کاملی از مشاهدات ممکن که قصد آن است به آن تعمیم داده شود. جهان تعمیم ممکن است شامل تعدادی یا همهی رویهها و سطوح شان در جهان مشاهدات قابل قبول باشد.
نمره جهان۵۴
نمره جهان، میانگین اندازهگیریها در جهانی که به آن تعمیم داده میشود. طبق بیان برنان (a2010)، در اصل برای هر فرد، برای هر تکرار از روش اندازهگیری در جهان تعمیم میتوان نمرهی میانگینی تصور کرد. برای چنین فردی، ارزش مورد انتظار از این نمرات میانگین به عنوان نمره جهان فرد تعریف میشود و واریانس نمرات جهان همه افراد در جامعه، واریانس نمره جهان نامیده میشود. این شباهت مفهومی با واریانس نمره واقعی در نظریه کلاسیک آزمون دارد. در هر اندازهگیری سعی می شود شرایطی مهیا شود که واریانس نمره جهان زیاد و میزان سایر مؤلفههای واریانس (واریانسهای خطا) کم باشد.
رویه تصادفی۵۵
نظریه تعمیمپذیری اساساً نظریهی اثرات تصادفی است. یک رویه تصادفی از طریق نمونهگیری سطوح یک رویه به طور تصادفی ایجاد میشود. حتی اگر سطوح یک رویه به طور تصادفی نمونهگیری نشده باشند، رویه ممکن است تصادفی در نظر گرفته شود اگر سطوح مشاهده نشده در مطالعه G قابل جابهجایی با سطوح مشاهده شده باشد (وب۵۶، شیولسون۵۷ و هرتل۵۸، ۲۰۰۷). در مثال مذکور اگر رویه ارزیاب، تصادفی در نظر گرفته شود در این صورت، ارزیابانی که به کار گرفته میشوند، یک نمونه تصادفی از تمام ارزیابان مشابه ممکن محسوب میشوند.
رویه ثابت۵۹
رویههای ثابت تنها شامل سطوحی هستند که محقق به استفاده از آن ها تمایل دارد. وب و همکاران (۲۰۰۷) بیان میکنند که رویه ثابت زمانی رخ میدهد که ؛
تصمیم گیرنده با قصد قبلی سطوح خاصی را انتخاب کند و تمایل به تعمیمدهی فراتر از آنها نداشته باشد.
تعمیم دادن به ورای سطوح مشاهده شده غیرمنطقی باشد.
هنگامی که کل جهان سطوح، کوچک باشد و طرح اندازهگیری همه سطوح را در برگیرد.
در مثال مذکور اگر رویه ارزیاب ثابت باشد در این صورت ارزیابان فعلی که به کار رفته اند همه ارزیابان ممکن برای سنجش هستند و نمونه ای از جهان بزرگتر ارزیابان نیستند.
طرحهای متقاطع۶۰
طرحهای متقاطع، طرحهایی هستند که هر سطح از هر رویه برای هر سطح از رویههای دیگر تکرار میشود. در مثال مذکور، اگر هر ارزیاب (r)، هر سوال (i) را نمره گذاری کند در این صورت، ارتباط بین r و i متقاطع بوده و به صورت i × r نشان داده می شود. علامت ×” متقاطع با” خوانده میشود.
طرحهای آشیانهای۶۱
زمانی یک رویه را درون رویه دوم آشیانهای میگویند؛ اگر مجموعههای متفاوتی از سطوح اندازهگیری
اولین رویه، در ترکیب با همه سطوح اندازهگیری دومین رویه رخ دهد. در مثال بیان شده، اگر هر سوال (i) توسط گروه متفاوتی از ارزیابان (r) نمره گذاری شود، در این حالت گفته میشود؛ ارزیابان در درون سوالات آشیانه کردهاند و به صورت i : r نمایش داده میشود. علامت : ” آشیانه کرده درون ” خوانده میشود.
انواع مطالعات
مطالعهی تعمیمپذیری۶۲ (مطالعه G)
پژوهشگری که به مطالعه G میپردازد عمدتاً علاقهمند است بداند تا چه اندازه نمونهای از اندازهگیریها به جهان اندازهگیریها قابل تعمیم است. هدف این مطالعه این است که کمک کند تا مطالعهای طرح شود که تعمیمپذیری مناسب داشته باشد (کروکر و آلجینا،۲۰۰۸ ، ترجمه ی فرزاد و زارع، ۱۳۸۸، ص۱۲). یک مطالعه G جهت برآورد و تفسیر مؤلفههای

مطلب مشابه :  منابع و ماخذ مقالهقرآن کریم، گفتمان قرآنی، صراط مستقیم، طلاق
دسته بندی : No category

دیدگاهتان را بنویسید