نرمال(۳) است میتوان گفت که توزیع دارای کشیدگی منفی است.
در آزمون زیست شناسی نیز با تقسیم آمارهی کجی و کشیدگی بر خطای استاندارد، به ترتیب مقادیر(۷/۱) و (۲۱/۶-) بدست آمد. با توجه به اینکه مقدار کجی در بازه (۲ ،۲-) قرار دارد، میتوان گفت که توزیع نمرات آزمودنیها در این آزمون، از لحاظ کجی نرمال بوده و توزیع آن متقارن است اما مقدار کشیدگی بدست آمده، نشان میدهد که توزیع دارای کشیدگی منفی است.
در دو آزمون مذکور، با توجه به سطح معناداری بدست آمده (۰۱/۰ p) در آزمون کولموگروف – اسمیرنوف، فرض نرمال بودن توزیع نمرات رد میشود که این نتیجه، تأیید کنندهی نتایج بدست آمده از شاخصهای کجی و کشیدگی است. در قسمت زیر، منحنی توزیع نمرات هر کدام از دروس نشان داده شده است.
منحنی توزیع نمرات آزمودنی ها در درس ادبیات فارسی منحنی توزیع نمرات آزمودنی ها در درس زیست شناسی
نمودار۴-۱۵ : منحنی توزیع نمرات آزمودنی ها
سوال: آیا تفاوتی در عملکرد آزمودنیهای دختر و پسر در امتحاناتنهایی وجود دارد؟
جدول۴-۴۲ : شاخص های توصیفی توزیع نمرات آزمودنیها به تفکیک جنسیت
شاخص آماری
آزمون
گروه
تعداد
کمینه نمره
بیشینه نمره
میانگین
انحراف استاندارد
ادبیات فارسی
پسر
۳۰۰
۷۵/۰
۲۰
۵۰/۱۱
۰۶/۵
دختر
۳۰۰
۳
۲۰
۸۷/۱۴
۸۶/۳
زیست شناسی
پسر
۳۰۰
۰
۵/۱۹
۴۶/۸
۹۲/۴
دختر
۳۰۰
۵/۱
۲۰
۴۹/۱۱
۸۸/۴
جدول۴-۴۳ : شاخص های توصیفی شکل توزیع نمرات آزمودنیها به تفکیک جنسیت
آزمون
گروه
کجی
کشیدگی
کولموگروف – اسمیرنوف
آماره
خطای استاندارد
آماره
خطای استاندارد
آماره z
sig
ادبیات فارسی
پسر
۱۱/۰-
۱۴/۰
۸۱/۰-
۲۸/۰
۲۴/۱
۰۹/۰
دختر
۶۱/۰-
۱۴/۰
۳۴/۰-
۲۸/۰
۹۰/۱
۰۰۱/۰
زیست شناسی
پسر
۴۹/۰
۱۴/۰
۸۱/۰-
۲۸/۰
۷۸/۱
۰۰۴/۰
دختر
۰۹/۰-
۱۴/۰
۲۶/۱-
۲۸/۰
۷۳/۱
۰۰۵/۰
همانطور که در جدول (۴-۴۲) آمده است، میانگین پسران و دختران به ترتیب در دو آزمون ادبیاتفارسی (۵/۱۱ و ۸۷/۱۴) و زیستشناسی (۴۶/۸ و ۴۹/۱۱) است که دانشآموزان دختر در هر دو آزمون، میانگین بیشتر را به خود اختصاص داده اند.
مقادیر بدست آمدهی کجی(۷۸/۰-) و کشیدگی(۸۹/۲-) برای توزیع نمرات پسران در آزمون ادبیاتفارسی نشان میدهد که توزیع متقارن و دارای کشیدگی منفی است و توزیع نمرات دختران دارای کجی (۳۶/۴-) و کشیدگی (۲۱/۱-) منفی است. در آزمون زیستشناسی، توزیع نمرات پسران دارای کجی مثبت (۵/۳) و کشیدگی منفی (۸۹/۲-) میباشد و توزیع نمرات دختران، متقارن (۶۴/۰-) بوده و از کشیدگی منفی (۵/۴-) برخوردار است.
در بکارگیری روش آماری، ابتدا با استفاده از آزمون آماری کولموگروف – اسمیرنوف، نرمال بودن داده ها مورد آزمون قرار میگیرد تا نوع روش آماری (پارامتری، غیرپارامتری) که باید استفاده شود، مشخص گردد. با توجه به جدول (۴-۴۳)؛ در آزمون ادبیات فارسی، توزیع نمرات آزمودنیهای پسر نرمال (p 0/01) و توزیع نمرات آزمودنیهای دختر غیر نرمال (p ۰/۰۱) است. همچنین، توزیع نمرات هر دو گروه در آزمون زیستشناسی غیر نرمال میباشد.
جدول ۴-۴۴ : نتایج آزمون t مستقل بین دو گروه آزمودنی های پسر و دختر
آزمون لوین (برابری واریانس ها)
آزمون T (برابری میانگین ها)
F
معنی داری
T
درجه آزادی
معنی داری (دو دامنه)
ادبیات فارسی
۵۶/۲۱
۰۰۰/۰
۱۸/۹-
۵۹۸
۰۰۰/۰
زیست شناسی
۴۶/۰
۵/۰
۵۶/۷-
۵۹۸
۰۰۰/۰
یکی از مفروضههای آزمون t مستقل، همگن بودن واریانسها در گروههای مورد مطالعه است. بدین منظور برای هر دو آزمون در سطح ۰۱/۰، مفروضه همگنی واریانس‌ها از طریق آزمون لوین مورد بررسی قرار گرفت. در آزمون ادبیات فارسی با توجه به اینکه F مشاهده شده (۵۶/۲۱) از F بحرانی (۳۹/۱) بزرگتر است، نتیجه گرفته میشود که این مفروضه برقرار نیست. همچنین، در آزمون زیستشناسی F مشاهده شده (۴۶/۰) در سطح ۰۱/۰ از F بحرانی (۳۹/۱) کوچکتر است، نتیجه گرفته میشود که واریانسها همگناند و مفروضه برقرار است.
از آنجا که آزمونهای پارامتری، نسبتاً ” خدشه ناپذیر” هستند، حتی در شرایطی که مفروضههای مربوط به استفاده از این آزمونها رعایت نمیشود، نیز میتوان از آنها استفاده کرد؛ مگر آنکه توزیع کلی نمرهها تفاوت چشمگیری با یک توزیع طبیعی داشته باشد. همچنین در صورتی که تعداد آزمودنیهای هر موقعیت مساوی باشد، دیگر همگنی تغییرپذیری نمرات در موقعیتهای مختلف اهمیت چندانی ندارد (گرین و دی- الیویرا، ترجمهی دلاور و پژهان، ۱۳۹۲). با توجه به مطلب بالا، از آزمون t مستقل برای پاسخگویی به سوال مطرح شده استفاده شده است.
از آنجا که قدرمطلق مقدار t مشاهده شده در دو آزمون ادبیاتفارسی (۵۹۸ df= ،۱۸/۹- t= ) و زیستشناسی (۵۹۸ df=، ۵۶/۷- t=) بزرگتر از مقدار t بحرانی (۶۱/۲) برای سطح معناداری (۰۱/۰) می باشد، بنابراین با ۹۹ درصد اطمینان میتوان گفت که آزمودنیهای دختر و پسر در دو آزمون، عملکرد متفاوتی داشتهاند.
فصل پنجم
بحث و نتیجهگیری
مقدمه
امتحاناتنهایی نقش مهمی در ارزشیابی آموختههای دانشآموزان، چگونگی کیفیت تدریس، فرآیند آموزش و ارتقاء سطح تحصیلی دارند، همچنین از نتایج این امتحانات برای گزینش کارجویان نیز استفاده میشود. علاوه بر این، طرح جدید سنجش و پذیرش دانشجو در کشورمان که افزایش تاثیر سوابق تحصیلی در پذیرش دانشجویان را به دنبال دارد، بیش از پیش بر حساسیت و اهمیت امتحانات نهایی افزوده است.
علیرغم کاربرد گستردهی این امتحانات و تصمیمات سرنوشتسازی که بر اساس این امتحانات گرفته میشود، تحقیقات نظاممندی که بر روی کیفیت آنها بر اساس روشهای جدید اندازهگیری صورت گرفته باشد وجود نداشته و یا خیلی اندک است. همچنین کیفیت نمرهگذاری و تصحیح این امتحانات در هالهای از ابهام قرار دارد. لذا در این تحقیق، مسائل زیر به همراه روشهای تحلیل آنها به شرح زیر مورد مطالعه قرار گرفته است؛
بررسی روایی امتحاناتنهایی شامل بررسی ساختاری، محتوایی، توزیع طبقهبندی سوالات و میزان
پوشش محتوای کتاب با استفاده از نظرات متخصصان موضوعی که با اصول اندازهگیری آشنایی داشتند.
بررسی اعتبار امتحاناتنهایی، با استفاده از طرحهای اندازهگیری در نظریه تعمیمپذیری و با بکارگیری نرم افزار ۵.۰ EDUG.
ویژگیهای روانسنجی سوالات براساس CTT؛ در پاسخ به این سوال بعد از محاسبه اعتبار آزمون، آن را با استفاده از روش لوپ مورد بررسی قرار داده و سپس، شاخصهای آماری سوالات (درجه دشواری و ضریب تمیز سوال) براساس دادههای خام و کدگذاری شده محاسبه شد.
ویژگیهای روان سنجی سوالات بر اساس IRT؛ بعد از اینکه نتایج نشان از برقراری مفروضات
اساسی این نظریه (تک بعدی بودن و استقلال موضعی) داشت، با استفاده از نرمافزار بایلوگ پارامترهای سوال و توانایی آزمودنیها برآورد و برازش تک تک سوالات با مدل بررسی گردید. همچنین، منحنی ویژگی سوالات به تفکیک مدلها و منحنی ویژگی و تابع آگاهی یک سوال نمونه، مقادیر بیشینه آگاهی سوالات و تتای ماکسیمم، تابع آگاهی آزمون و خطای استاندارد اندازهگیری، هیستوگرام توزیع توانایی آزمودنیها طبق مدل دو پارامتری که بهترین برازش را با دادهها داشت (با بکارگیری آزمون خی دو)، ترسیم گردید.
بررسی وضعیت قبولی آزمودنی ها و مقایسه عملکرد آن ها بر اساس جنسیت که از شاخصهای
توصیفی و آزمون tمستقل برای پاسخگویی به آن استفاده شد.
بحث و نتیجهگیری
بررسی روایی امتحانات نهایی دروس ادبیاتفارسی و زیستشناسی
در درس ادبیات فارسی، ارزیابی ساختاری سوالات نشان داد تقریباً ۹۵ درصد سوالات بدون اشکال
ساختاری هستند که بیانگر وضعیت بسیار مطلوبی است. ۵ درصد سوالات یک هدف آموزشی یا یک موضوع مهم را اندازه نگرفتهاند و این، تنها اشکال ساختاری در درس مذکور میباشد. در درس زیستشناسی، بیشترین اشکال ساختاری سوالات، در عدم تناسب بارم با میزان دشواری سوالات مشاهده شد. عدم تناسب بارم با میزان اهمیت سوال (۷۵/۱۸% سوالات) و نامناسب بودن نوع سوال برای اندازهگیری هدف مورد نظر (۵/۱۲% سوالات) از دیگر اشکالات ساختاری مهم در درس زیستشناسی میباشد. همچنین، (۹۴/۱۰% سوالات) یک موضوع مهم یا یک هدف آموزشی را اندازه نگرفته و در همین درصد از سوالات، بارم به طور منطقی به هر بخش از پاسخ اختصاص داده نشده است. سراسری و با اهمیت بودن امتحاناتنهایی، ضرورت برگزاری کارگاههای آموزشی برای طراحان سوال را موجب میشود تا اشکالات ساختاری این امتحانات، به حداقل رسیده و ارتقاء کیفی آن ها را به دنبال داشته باشد.
ارزیابی محتوایی سوالات بر اساس ارزش های بحرانی CVR، در درس ادبیات فارسی نشان داد
که هیچ سوالی از طرف متخصصان موضوعی ضروری تشخیص داده نشده است و براساس ملاک سهلگیرانه (۶/۰)، تنها ۳۱/۲۶ درصد سوالات ضروری و دیگر سوالات مفید یا غیرضروری شناسایی شدهاند. همچنین، در درس زیست شناسی بر اساس ارزش بحرانی CVR، ۲۵ درصد سوالات و بر اساس ملاک سهلگیرانه، ۱۹/۶۷ درصد سوالات ضروری تشخیص داده شدهاند.
زمانی که با یک آزمون پایانی و از طریق نمونهای از سوالات، قصد آن است که کل محتوای کتاب و توانایی واقعی آزمودنیها سنجیده شود، بهتر است سوالات به مباحث ضروری اختصاص یابد. اگر بر اساس ملاک سهلگیرانه قضاوت شود، درس زیست شناسی وضعیت مناسبی دارد، اما تقریباً دانش موجود در سه چهارم سوالات ادبیاتفارسی، ضروری نبوده و آگاهی یا عدم آگاهی از آنها در اندازهگیری توانایی واقعی آزمودنیها تأثیر چندانی ندارد. لازم به ذکر است که با توجه به ماهیت درس ادبیاتفارسی، ذوق و سلیقهی متخصصان موضوعی را نیز، نمیتوان نادیده گرفت. با این وجود، در طراحی سوالات دروس مورد مطالعه بهویژه درس ادبیاتفارسی، به جدول دو بعدی هدف – محتوا توجه لازم صورت نگرفته است.
بررسی توزیع سوالات بر اساس سطوح یادگیری، در درس ادبیاتفارسی نشان داد که تمام سوالات
متعلق به سطوح پایین شناختی است. به طوریکه، ۱۶/۶۳ درصد سوالات متعلق به سطح دانش میباشد. در درس زیستشناسی نیز، تقریباً ۹۴ درصد سوالات سطوح پایین شناختی را سنجیدهاند که از این میان، حدوداً ۶۰ درصد سوالات متعلق به سطح دانش میباشد و تنها ۶ درصد سوالات به سطح تحلیل اختصاص یافته است. در مطالعات رحیمی(۱۳۸۷)، واحدی و فزونمهر(۱۳۸۴)، شاطریان محمدی(۱۳۸۴)، سلیمانی(۱۳۸۴) و سادئی(۱۳۷۶) نیز بیشتر سوالات در سطوح پایین شناختی طرح شده بودند. در مطالعهی الزیبی(۲۰۱۴) در خصوص امتحانات دیپلم دبیرستان، ۶/۶۹ درصد از کل سوالات بر سطوح پایین شناختی متمرکز

مطلب مشابه :  منابع و ماخذ مقالهزاویه دید، بعد شناختی، زبان قرآن، قرآن کریم
دسته بندی : No category

دیدگاهتان را بنویسید