بررسی قرار دادند. جامعه آماری این تحقیق، اوراق امتحانی کلیه دانشآموزان شرکت کننده در امتحانات نهایی و داخلی سال تحصیلی ۸۳ – ۸۲ استان آذربایجان غربی است که تعداد آن ها به ۵۱۵۶۱ میرسد که از این تعداد با استفاده از روش نمونهگیری تصادفی خوشهای، ۶۰۰ ورقه (۱۵۰ ورقه از هر درس نامبرده) انتخاب گردید. برای ارزشیابی این اوراق از لحاظ میزان رعایت اصول آزمونسازی،۱۲ داور بعد از گذراندن یک دوره آموزشی به منظور رسیدن به توافق نسبی در معیارهای نمرهگذاری، از ” چک لیست ارزشیابی آزمونهای معلم ساخته ” استفاده کردند. نتایج به دست آمده از این تحقیق به صورت زیر میباشد:
به غیر از سوالات ریاضی، اعتبار سوالات امتحانی سه ماده درسی بسیار پایین میباشد. برای
محاسبه اعتبار از ضریب آلفای کرونباخ استفاده گردیده است.
روایی محتوایی سوالات امتحان نهایی و داخلی ریاضیات، علوم تجربی و جغرافیا در سطح بالا و
سوالات دینی در سطح متوسط بوده است.
سطح دشواری سوالات دروس علوم تجربی و ریاضی نسبتاً مناسب بوده، اما در دروس جغرافیا و
دینی به لحاظ دشواری، آزمون متمایل به ساده بودن میباشد.
سوالات امتحان نهایی دروس مذکور از ضریب تمیز مناسب و قابل قبولی برخوردار است. ضریب
تمیز این سوالات با استفاده از ضریب دو رشته ای نقطهای محاسبه شده است.
در طراحی سوالات امتحانات نهایی و داخلی دروس دینی، علوم و جغرافیا تنها به سطوح دانش،
فهمیدن و کاربرد حیطه شناختی توجه شده است اما در بررسی سوالات درس ریاضی، سطح ترکیب نیز در نظر گرفته شده است.
به غیر از امتحان نهایی علوم تجربی، در طراحی سوالات دیگر امتحانات نهایی و داخلی، ملاکهای
فنی و ظاهری رعایت شده است.
شاطریان محمدی (۱۳۸۴) به منظور تعیین میزان مهارت دبیران شهرستان قم در طراحی سوالات
امتحانی، به بررسی میزان روایی، اعتبار و شاخصهای دشواری و تمیز سوالات آزمونهای معلم ساخته پرداخته است. کلیه اوراق امتحانی ترم اول و دوم دروس ریاضی، فیزیک، شیمی، عربی و زبان سال اول دوره متوسطه شهرستان قم در سال تحصیلی ۸۴ – ۱۳۸۳ و همچنین کلیه اوراق امتحانی ترم دوم سال تحصیلی ۸۳ – ۸۲ جامعه آماری این تحقیق را تشکیل میدهند. از این میان، ۹۶ ورقه سوال امتحان و تعداد ۱۷۱۲ ورقه پاسخنامه با روش نمونهگیری خوشهای چند مرحلهای مورد تحلیل قرار گرفت. نتایج این پژوهش نشان داد که:
دروس مورد بررسی از روایی محتوایی و صوری خوبی برخوردارند که درس ریاضی بالاترین
میزان روایی را به خود اختصاص داده است. برای تعیین روایی محتوایی و صوری، دو متخصص در هر درس به ارزیابی سوالات پرداختند. همچنین، اکثریت سوالات دروس مورد بررسی در سطح دانش و ادراک می باشد و از سطوح تحلیل، ترکیب و ارزشیابی سوالی نیامده است.
تمامی دروس مورد بررسی از اعتبار مصححان بسیار بالایی برخوردار است. به منظور محاسبه این
نوع اعتبار، دو دبیر در هر درس، ۲۰۰ ورقه پاسخنامه را مجدداً تصحیح و جداگانه نمرهگذاری نمودند. در نهایت، از ضریب توافق کندال برای بررسی میزان توافق دبیران مصحح استفاده شد.
سوالات دروس مورد بررسی از ضریب دشواری متوسطی برخوردار هستند که بیشترین و کمترین
ضریب متعلق به دروس ریاضی و زبان (۶۰/۰ ، ۵۱/۰) می باشد. همچنین به غیر از سوالات درس ریاضی که از ضریب تمیز بسیار خوبی (۵۱/۰) برخوردار است بقیه دروس از ضریب تمیز نسبتاً خوبی (۳۵/۰ تا ۳۹/۰) برخوردارند. از آنجا که بیشتر سوالات طراحی شده از نوع تشریحی بوده برای محاسبه این نوع ضرایب، از فرمولهای ضرایب تمیز و دشواری مخصوص سوالات تشریحی استفاده شده است.
سلیمانی (۱۳۸۴) به بررسی روایی محتوایی، شاخصهای سوالات و رعایت اصول علمی طراحی
سوالات امتحانی دروس ریاضی پرداخت. اولین گروه ازجامعه آماری این تحقیق، سوالات امتحانی دروس ریاضی مقطع متوسطه نظری مراکز آموزشی استان کرمانشاه در امتحانات پایانی خرداد ماه ۸۳ بود که با روش نمونهگیری تصادفی، از میان آن ها ۲۴۰ نمونه سوال طراحی شده به تناسب جمعیت دانشآموزی مناطق و نواحی استان در پایههای اول و دوم انتخاب و در پایه سوم به دلیل هماهنگ بودن سوالات در سطح استانی، تک نمونهای از سوالات طراحی شده از هر درس انتخاب گردید. دومین گروه جامعه آماری عبارت بود از؛ اوراق امتحانی دروس ریاضی فیزیک و علوم تجربی که در حوزههای تصحیح امتحانات نهایی، تصحیح و ارزشیابی شده بودند که از میان آن ها، تعداد ۲۸۰ ورقه تصحیح شده از هر یک از دروس مورد مطالعه (جمعاً ۱۱۲۰ ورقه) انتخاب گردید. به منظور بررسی روایی محتوایی، از یک پرسشنامه ۱۰۰ امتیازی که در مقیاس ۵ درجهای تنظیم و توسط حداقل ۳ ارزیاب امتیازدهی شده بود، استفاده گردید. از نتایج به دست آمده از این تحقیق میتوان به موارد زیر اشاره کرد؛
در مجموع سوالات از روایی محتوایی نسبتاً قابل قبولی برخوردارند.
در همهی دروس، بیشتر سوالات طراحی شده، متعلق به سطوح پایین حیطه شناختی است و اصل
ترتیب سوالات از ساده به مشکل رعایت نشده است. همچنین طراحان سوال توجه کمتری به رعایت زمان تخصیص داده شده متناسب با سطح دشواری سوالات داشته اند.
هر چند سوالات، ضریب دشواری متوسطی دارند ولی از ضریب تشخیص پایینی برخوردار
میباشند.
میانگین نمره در دروس امتحاناتنهایی پایین بوده است.
حشمتی، رافع و جمشیدی نژاد (۱۳۸۳) با هدف تعیین میزان اعتبار آزمونها، ضریب تشخیص و
سطح دشواری سوالات به تجزیه و تحلیل نتایج امتحاناتنهایی سال سوم متوسطه خرداد ۸۱ پرداختند. اوراق امتحانی کلیه دانش آموزان روزانه سال سوم متوسطه نظری تمام استان ها که در امتحانات نهایی ۸۱ شرکت کرده بودند جامعه آماری این مطالعه را تشکیل میدهد که با روش نمونهگیری تصادفی طبقهای، ۷۵۰۰۰ ورقه امتحانی دانشآموزان انتخاب شد و سوالات آن مورد بررسی قرار گرفت. در هر استان ۵ منطقه (۱منطقه برخوردار، ۲منطقه غیر برخوردار و ۲ منطقه نیمه برخوردار) و سپس در هر رشته به تفکیک جنسیت، ۱۸۰ورقه امتحانی از منطقه برخوردار و ۳۲۰ ورقه از مناطق غیر برخوردار و نیمه برخوردار به تصادف انتخاب گردید. دروس مورد مطالعه عبارت بودند از؛ شیمی، حسابان، جبر و احتمال، ریاضی۳، فیزیک۳ تجربی و ریاضی، دینی و زیست شناسی. از نتایج این تحقیق:
در مجموع اعتبار (با استفاده از آلفای کرونباخ) آزمونهای مورد مطالعه قابل توجه بوده است.
کمترین و بیشترین میزان اعتبار به ترتیب مربوط به آزمونهای فیزیک گروه تجربی(۲۹/۰) و زیستشناسی (۹۴/۰) در استان تهران میباشد. میانگین اعتبار زیستشناسی در سراسر کشور برابر ۹۰/۰ به دست آمده است.
افزایش عملکرد مناطق برخوردار نسبت به نیمه برخوردار و غیر برخوردار کمی بیش از متوسط
(با میانگین ۶۹ درصد) است که برای درس زیست شناسی به ۶۰% می رسد. گفتنی است تقسیم بندی مناطق بر اساس ملاکهای غیر آموزشی بوده است.
منحنی خصیصه سوال در اغلب استانها و دروس مختلف در حد قابل قبولی نیست. به طور
متوسط، ۴۹% امتحاناتی که در سطح استانها برگزار شده است، توانایی تفکیک دانشآموزان قوی و ضعیف را از هم دارند. به بیانی دیگر، امتحانات خرداد ۸۱ در تفکیک دانشآموزان از توانایی قابل توجهی برخوردار نیستند.
به غیر از تعداد اندکی از سوالات، ضریب دشواری سایر سوالات در دامنه بهینه قرار دارد و اکثریت
سوالات همبستگی مناسبی با نمره کل آزمون دارند که نشان دهندهی همسانی مناسب سوالات آزمون است.
تجزیه و تحلیل آزمون زیستشناسی در استان لرستان به شرح زیر است؛
اعتبار این آزمون ۸۶/۰ به دست آمده است. همچنین، میانگین آزمون زیست شناسی۱۳/۱۲ و دامنه نمره (۲۵/۱۹- ۲۵/۰) است. میانگین ضریب دشواری آزمون زیست شناسی ۶۱/۰ است و دشواری ۲۳ سوال از ۳۰ سوال آن در دامنه بهینه قرار دارد. نتایج ضریب همبستگی نشان میدهد که سوالات از ضریب تشخیص مناسبی برخوردارند. منحنی خصیصه سوال درس زیست شناسی در استان لرستان نشان میدهد که ۹ سوال از کیفیت مطلوبی برخوردار نیستند. استان لرستان در گروه استانهایی قرار میگیرد که عملکرد منحنی خصیصه سوال در آزمون زیستشناسی تا حدی قابل قبول است.
رستگاری مقدم (۱۳۷۸) در مطالعه ای به بررسی میزان اتکاپذیری و تعمیم پذیری نتایج امتحان
کنکور کارشناسی ارشد رشتههای معارف اسلامی، فلسفه و نمایشنامهنویسی با استفاده از نظریه تعمیمپذیری پرداخت. داوطلبان آزمون سراسری وروری کارشناسی ارشد سال ۱۳۷۷ که امتحان آنها به صورت تشریحی برگزار شده بود، جامعه ی آماری این مطالعه را تشکیل دادند و جامعه مرجع مشاهدات قابل قبول، شامل دو رویهی سوالات و درجه بندیکنندگان بود که فرض شد این دو، نامحدود هستند. نتایج این مطالعه که با استفاده از نرم افزار spss و بخشی به صورت دستی به دست آمد (به دلیل در دسترس نبودن نرم افزار تخصصی)، به شرح زیر میباشد:
تعداد درجهبندی کنندگان مورد استفاده توسط سازمان سنجش کافی ولی تعداد سوالات مورد استفاده کم میباشد و برای به دست آوردن نتایج مطلوب و مورد اعتماد، افزایش تعداد سوالات بسیار ضروری میباشد. تقریباً برای تمام دروس، به دست آوردن نتایج دقیق و قابل اتکا مستلزم استفاده از حداقل دو درجهبندی کننده و ۱۰ سوال از این نوع سوالات میباشد.
سادئی (۱۳۷۶) به مقایسهی تحلیلی امتحانات هماهنگ و داخلی دورهی متوسطه و انطباق آن با
ملاکهای علمی طراحی سوال و آزمونسازی پرداخت. سوالات امتحانات داخلی و هماهنگ دروس ریاضی۱و۲، فیزیک ۱و۲، شیمی۱و۲ ، زبان خارجی۱ و دانش اجتماعی که در سال تحصیلی ۱۳۷۶-۱۳۷۵ در شهر مشهد به اجرا درآمده بود، جامعه آماری این تحقیق را تشکیل میدادند. از میان آنها با روش نمونهگیری خوشهای تصادفی، ۱۰ آزمون داخلی با ۱۳۲ سوال، ۲۳ آزمون هماهنگ کشوری- استانی- ناحیه ای با ۴۱۶ سوال انتخاب و نیز نمرات (نمره سوال و نمره کل آزمون) ۲۰۰۹ دانشآموز در ۶۴ کلاس درس متعلق به نواحی ۳ و ۵ جمعآوری گردید. به منظور مقایسه ی محتوای آزمونهای داخلی و هماهنگ از نظر رعایت ملاکهای علمی آزمون سازی، هر یک از امتحانات اجرا شده در سه نسخه تکثیر و توسط ۳ دبیر متخصص بر اساس ۱۴ ملاک علمی ارزشیابی شد. نتایج مرتبط با این تحقیق عبارتند از:
هر قدر طراحی سوالات با اهداف آموزشی و درسی و ملاکهای علمی آزمونسازی انطباق بیشتری
داشته باشد، دانشآموزان نیز موفقیت بیشتری کسب می کنند و بالعکس.
هر چند عملکرد دانشآموزان از مواد درسی مورد بررسی، خیلی مطلوب نیست اما آزمونهای
داخلی و هماهنگ معمولاً با ملاک های علمی طراحی سوال و آزمون سازی انطباق دارد.
الزیبی۱۴۹ (۲۰۱۴) به تحلیل سوالات زبان انگلیسی برگرفته از امتحانات دیپلم دبیرستان از طریق سطوح
شناختی بلوم پرداخت. سوالات انگلیسی

مطلب مشابه :  منابع پایان نامه دربارهانحراف معیار، استاندارد، استاندارد سازی، ملاحظات اقتصادی
دسته بندی : No category

دیدگاهتان را بنویسید