التقييم

تعريف التقييم

التقييم

تستخدم مصطلحات مثل القياس والتقييم والاختبار أحيانًا كمرادفات لمصطلح التقييم.
على الرغم من أن هذه المصطلحات مرتبطة بـ التقييم، إلا أن معانيها وغرضها مختلفان تمامًا.
يمكن اعتبار القياس على أنه تحديد كمية للأداء أو خاصية مثل الدرجة في الاختبار أو الطول أو الوزن؛ يدل التقييم على الأحكام المتعلقة بجودة أو قيمة شيء ما؛ و الاختبار يعني عادةً أداة محددة (اختبار ورقي وقلم رصاص) أو مجموعة من الإجراءات لقياس المعرفة أو القدرات أو الخصائص الأخرى.
التقييم هو مصطلح عام يستخدم ليشمل كل ما يفعله المعلم للتأكد من المستوى الذي أتقن فيه الطلاب الموضوع، ويمكنهم أداء مهام معينة، أو إظهار سلوكيات معينة.
يتضمن التقييم جمع وتحليل وتفسير أنواع مختلفة من المعلومات المفيدة للقرارات التعليمية.
اقترح ليونارد كارمايكل و بيت كالدويل أن التقييم يمكن أن ينتج فوائد مباشرة للطلاب، حيث يستخدم المعلمون كل من التقييمات الرسمية وغير الرسمية لتشخيص نقاط القوة والضعف لدى الطلاب.
يمكن أن يوفر التقييم معلومات تساعد المعلمين على تحديد الطلاب الذين يحتاجون إلى تعليمات إضافية أو خدمات خاصة أو عمل أكثر تقدمًا.
يمكن أن يكون التقييم أيضًا بمثابة أساس لتأملات المعلم حول فعالية تعليمهم.
بناءً على البيانات التي تم جمعها من خلال أنواع مختلفة من التقييمات، يمكن للمعلمين اتخاذ قرارات تعليمية بشأن إعادة تدريس درس أو وحدة أو المضي قدمًا في دروس أكثر صعوبة.
يمكن أن توفر نتائج التقييمات ملاحظات للطلاب للإشارة إلى المجالات التي يحتاج فيها الأداء إلى تحسين والمجالات التي يكون فيها الأداء مرضيًا.

تطور التقييم التعليمي: من النظام الفردي إلى الاختبارات المعيارية والتقييم على المستوى الوطني

يمكن إرجاع الجذور المبكرة لـ التقييم التعليمي إلى المدرسة المكونة من غرفة واحدة حيث انتقل الطلاب إلى المستوى التالي عندما قرر المعلم أنهم قد أتقنوا المعرفة والمهارات اللازمة.
تم إجراء الاختبارات للتأكد من التقدم، دون الإبلاغ عن درجات الحروف (A، B، C، إلخ).
أبلغ المعلمون عن تقدم الطلاب شفهيًا أو من خلال ملاحظاتهم المكتوبة.
استلزم نمو المدارس تقسيم الطلاب إلى مستويات مختلفة، وتم استخدام النسب المئوية للإبلاغ عن تقدم الطلاب ولتحديد أولئك الذين تم إعدادهم للكلية.
تم إجراء مقارنات بين الطلاب، وتم منح أولئك الذين حصلوا على أعلى وأدنى الدرجات درجات A و F، على التوالي.
سقطت معظم درجات الطلاب في النطاق المتوسط وبالتالي تم منحهم درجة C للمتوسط.
تم منح الطلاب درجات قريبة من القمة، ولكن ليس أعلى الدرجات، درجة B، وتم منح أولئك الذين سقطوا تحت المستوى المتوسط درجة D.
ومع ذلك، في عام 1912، أثار بحث أجراه د.
ستارش و إي سي إليوت تساؤلات حول استخدام النسب المئوية كأساس لتعيين درجات الحروف وفحص القبول في الكلية.
أظهر بحثهم تباينات كبيرة في الدرجات التي يمنحها المعلمون.
دفع هذا النقص الواضح في الاتساق بين المعلمين في التقدير المعلمين إلى استخدام مقاييس التقدير مثل ممتاز أو متوسط أو ضعيف.
في أوائل القرن العشرين، بدأ استخدام الاختبارات المعيارية في المدارس كنتيجة لاستخدامها لفحص الرجال للخدمة العسكرية.
استندت الاختبارات المعيارية إلى المعايير الوطنية.
أدى التشريع الفيدرالي – وأبرزها القانون العام (PL) 94-142، الذي ينص على توفير تعليم عام مجاني ومناسب للأفراد الذين تتراوح أعمارهم بين 3 و 21 عامًا؛ قانون تعليم الأفراد ذوي الإعاقة (IDEA)، الذي عدل PL 94-142؛ وقانون عدم ترك أي طفل (NCLB) – إلى زيادة الاهتمام بـ التقييم على المستويات المحلية وحكومات الولايات والمستوى الوطني.

الأهداف السلوكية

اعتقد بنجامين بلوم، أستاذ التربية في جامعة شيكاغو، بالعمل مع معلمه، رالف تايلر، أن الأهمية في التعليم هي ما إذا كان الطلاب قد حققوا ما كانوا يدرسون أم لا، وليس كيف تمت مقارنتهم بالآخرين.
اعتقد بلوم أن البيئة مؤثرة في نجاح الطفل في المدرسة.
كان يعتقد أن مسؤولية المربي هي خلق بيئة تخدم الطلاب على مستويات قدرة مختلفة.
اقترح بلوم أن التعلم البشري يمكن تصنيفه إلى ثلاثة مجالات رئيسية: المعرفي والعاطفي والحركي النفسي.
بدأ بلوم ومجموعة من زملائه في تطوير نظام لوصف السلوكيات في المجال المعرفي في عام 1948 وتطوير نظام تصنيف للمجال العاطفي في عام 1956.
يتكون كل مجال من مستويات تتراوح من أدنى مستوى من التعلم إلى أعلى مستوى.
يعرف هذا التصنيف للتعلم عمومًا باسم “تصنيف بلوم للتعلم” أو ببساطة، “تصنيف بلوم“.
يخدم تصنيف مجالات التعلم عدة أغراض.
إنها تساعد في ضمان أن يعرف المعلمون أهداف الدرس والتركيز على النتائج المرجوة، وتوجيه الطلاب إلى أهداف الدرس، وأن تكون بمثابة أساس لتحديد أنواع المعرفة والمهارات والمواقف التي ستكون تقييم.
عادةً ما يتم ذكر المعرفة والمهارات والمواقف في شكل أهداف تعليمية (سلوكية أو أداء) للتواصل بوضوح الأداء المطلوب من الطالب، والظروف أو الظروف التي سيحدث فيها الأداء، والمعيار أو المعيار الذي سيستخدم لتقييم ما إذا كان الطالب قد حقق الهدف بشكل مرض أم لا.

أنواع التقييم

يمكن تقييم تحصيل الطلاب من خلال الاختبارات المعيارية أو الاختبارات التي يصنعها المعلم.
يغطي الاختبار المعياري قاعدة معرفية واسعة بدلاً من المعرفة المرتبطة بدروس مختارة أو وحدة تعليمية محددة.
إجراءات الإدارة الموحدة مطلوبة حيث تكون التعليمات موحدة، ويحصل جميع الطلاب على نفس الاختبار أو ما يعادله في ظل نفس الظروف لنفس القدر من الوقت.
يعتمد تفسير نتائج طالب معين على أداء ذلك الطالب مقارنة بأداء الطلاب الآخرين في نفس مستوى الصف.
يعرف هذا باسم الاختبار المرجعي للمعيار.
عادةً ما يتم توفير الجداول المعيارية التي تظهر الأداء النسبي للطالب مقارنةً بأداء الطلاب الآخرين في المجموعة المعيارية من قبل مطوري الاختبار للاختبارات الموحدة.
نظرًا لأنه تتم مقارنة طالب واحد بالطلاب الآخرين في المجموعة المعيارية على قاعدة معرفية واسعة، فليس من الممارسات التعليمية السليمة أن يستخدم المعلمون درجات الاختبار المعياري كأساس لتعيين درجات الفصل.
تستخدم الاختبارات المعيارية بشكل أفضل لإظهار أولياء الأمور أو موظفي المدرسة كيف يقارن طالب واحد بطلاب آخرين متشابهين.
لإجراء مقارنات دقيقة وذات مغزى، من المهم أن تكون المجموعة المعيارية ممثلة للطالب الذي تتم مقارنته به.
تستخدم الاختبارات التي يصنعها المعلم لتقييم تحصيل الطلاب على مجموعة محددة من المعرفة يتم تدريسها في الفصل الدراسي.
تعرف الاختبارات التي يصنعها المعلم باسم الاختبارات المرجعية للمعيار.
لا تتم مقارنة أداء طالب واحد بأداء المجموعة؛ بدلاً من ذلك، يتم قياس استجابة كل طالب لسؤال معين مقابل معيار محدد مسبقًا.
توفر الأهداف التعليمية المحددة بوضوح الأساس لـ التقييم الصفي المرجعي للمعيار.
في المقابل، تستخدم التقييمات الصفية المرجعية للمعيار لغرض تحديد مدى تحقيق الطلاب للأهداف.

تقييم الأداء والاستجابة: استخدام الاختبارات الموضوعية والطرق البديلة في تقييم التحصيل الطلابي

يتم تقييم تحصيل الطلاب من خلال مجموعة متنوعة من الاختبارات وتنسيقات عناصر الاختبار.
تستخدم عناصر الاختبار الموضوعية بشكل شائع لتقييم الأداء لأنه يمكن كتابتها لاختبار مستويات أعلى وكذلك مستويات أقل من التعلم ولاختبار مجموعة واسعة من الموضوعات.
الاختبارات الموضوعية سهلة الإدارة والتسجيل.
التسجيل أكثر موضوعية من معظم أنواع عناصر الاختبار الأخرى؛ وبالتالي، يتم ارتكاب عدد أقل من أخطاء التسجيل.
تتطلب عناصر الاختبار الموضوعية أن يكتب الطلاب إجابة أو يختاروها.
قد تكون الإجابات المكتوبة إجابات قصيرة أو إكمال.
تتضمن عناصر الاستجابة المحددة شائعة الاستخدام الاختيار من متعدد، أو صحيح / خطأ أو استجابة بديلة، والمطابقة.
على الرغم من أن الاختبارات الموضوعية لا تزال مفضلة بين المعلمين، إلا أن طرق التقييم البديلة تكتسب شعبية.
تعد تصنيفات الأداء والمقالات والمنتجات والمحافظ والتعلم الخدمي أشكالًا شائعة لـ التقييمات البديلة.
تتطلب بعض الأهداف التعليمية أن ينخرط الطلاب في نشاط لإظهار مستوى مهاراتهم.
على سبيل المثال، لا يمكن تقييم المهارات الرياضية أو الموسيقية بشكل مناسب من خلال اختبار ورقي وقلم رصاص.
سيرغب المعلم في تقييم سرعة الطلاب وتوقيتهم ودقتهم أثناء إظهارهم للسلوكيات المعرفية والنفسية الحركية والعاطفية.
يعد تسلسل الأحداث من الاعتبارات المهمة عند تقييم قدرة الفرد على تشغيل مركبة آلية، وتعد جودة العرض التقديمي مهمة عند تقييم الفعالية الإجمالية لتقديم تقرير شفهي للفرد.
تستغرق التقييمات القائمة على الأداء وقتًا طويلاً لإدارتها لأنه لا يمكن تقييم سوى طالب واحد في كل مرة.
أيضًا، يجب أن يكون المعلم منتبهًا بشدة للأداء حتى لا يفوتك خطوات مهمة ولكنها تؤدي بسرعة.
تستخدم rubrics مثل قوائم التحقق ومقاييس التقييم للتأكد من فعالية الأداء.

تقييم الأداء الفردي والبديل: استخدام المقالات والمنتجات والمحافظ في تقييم التحصيل الطلابي

تتطلب بعض الأهداف التعليمية من الطلاب إنشاء استجابات فردية وفريدة لإثبات كفاءتهم.
قد تكون الردود في شكل مقال مكتوب أو منتج.
عادةً ما تتضمن المقالات والمنتجات مهارات تفكير عالية المستوى في التحليل والتوليف والتقييم.
قد يتطلب مقال مكتوب، على سبيل المثال، أن ينتقد الطلاب إجراء أو حدث أو عمل أدبي أو وجهة نظر سياسية أو فلسفية.
يتطلب إنشاء منتج التخطيط والتنظيم وإنتاج نتيجة ملموسة فعليًا مثل قصيدة أو مسرحية أو مخطط أو برنامج كمبيوتر أو بيت طيور.
تستغرق المقالات والمنتجات وقتًا طويلاً للمعلمين للتخطيط والتسجيل بسبب الطبيعة الفردية للمنتجات.
يجب أن يتم تسجيل الردود من قبل معلم خبير يمكنه التأكد مما إذا كانت الردود دقيقة ومقبولة أم لا.
تعد المحافظ طريقة ممتازة لتوثيق تقدم الطلاب والتواصل بشأنه بمرور الوقت.
عادةً ما يتم تضمين عينات أو معروضات من العمل الأولي للطالب في المحفظة، وتتم إضافة معروضات أخرى طوال فترة التقدير أو الدورة التدريبية.
قد تتضمن المعروضات الإنجازات وأوجه القصور التي لا تتعلق مباشرة بالأهداف التعليمية.
على سبيل المثال، قد تتضمن المعروضات درجات اختبار مختارة وملاحظات تتعلق بالمواقف
والسلوكيات التي لا تظهر في بطاقات التقارير والإنجازات الاجتماعية والمشاريع الخاصة واستبيانات الاهتمامات والمقابلات.
غالبًا ما تستخدم المعروضات المضمنة في المحفظة لتكملة أنواع التقييم الأخرى.
يكتسب التعلم الخدمي شعبية كأداة تقييم وتعليم بديلة لأنه يتطلب من الطلاب إظهار معارفهم ومهاراتهم ومواقفهم في مواقف الحياة الواقعية.
يشارك الطلاب في أنشطة مصممة لتلبية الأهداف التعليمية مع توفير خدمة مفيدة للمجتمع.
الغرض من التعلم الخدمي هو تحسين التعلم الأكاديمي مع تعزيز المهارات الشخصية والمسؤولية المدنية من خلال مشاريع منظمة تلبي احتياجات المجتمع الحقيقية.

تحليل العناصر

يوفر تحليل العناصر معلومات حول صعوبة الاختبار ومدى تمييز عنصر اختبار معين بين المتقدمين للاختبار بنفس الطريقة التي يميز بها الاختبار العام.
يمكن إجراء تحليل العناصر بواسطة برنامج كمبيوتر أو حسابه يدويًا بواسطة معلمي الفصل.

صعوبة البند

مؤشر صعوبة العنصر هو إجراء إحصائي يشير إلى نسبة الطلاب الذين أجابوا بشكل صحيح على عنصر.
كلما اقترب المؤشر من 1، زادت نسبة الطلاب الذين أجابوا بشكل صحيح على هذا العنصر وأصبح العنصر أسهل.
يشار إلى مصطلح مؤشر صعوبة العنصر في العديد من المصادر على أنه مؤشر سهولة العنصر لأنه يشير إلى نسبة الطلاب الذين يجيبون بشكل صحيح على عنصر معين.
يتطلب حساب هذا المؤشر فصل عناصر الاختبار للطلاب ذوي الدرجات العالية والطلاب ذوي الدرجات المنخفضة عن تلك التي سقطت درجاتها في النطاق المتوسط.
اعتمادًا على العدد الإجمالي للطلاب، قد يعني هذا استخدام أعلى 25٪ وأقل 25٪ في التحليل.
إذا كان العدد الإجمالي للطلاب صغيرًا، فيمكن استخدام جميع الطلاب في التحليل عن طريق تجميع الطلاب إما في مجموعة الدرجات العالية أو مجموعة الدرجات المنخفضة.
ثم يتم حساب مؤشر الصعوبة عن طريق إضافة الرقم في المجموعة ذات الدرجات العالية التي حصلت على العنصر بشكل صحيح إلى الرقم في المجموعة ذات الدرجات المنخفضة التي حصلت على الرقم بشكل صحيح وقسمة المجموع على إجمالي عدد الطلاب.

تمييز البند

تمييز العناصر هو إجراء إحصائي يشير إلى مدى تمييز عنصر بين الطلاب ذوي الدرجات العالية
والطلاب ذوي الدرجات المنخفضة في عنصر اختبار معين بنفس الطريقة التي يميز بها الاختبار الإجمالي بين أولئك الذين يعرفون المحتوى وأولئك الذين لا يعرفونه.
يتطلب هذا الإجراء أيضًا وضع عناصر الاختبار للطلاب ذوي الدرجات العالية
والطلاب ذوي الدرجات المنخفضة في مجموعات منفصلة.
إذا كان عنصر ما يميز بشكل مناسب بين المجموعة ذات الدرجات العالية والمجموعة ذات الدرجات المنخفضة
فيجب أن يحصل الطلاب في المجموعة ذات الدرجات العالية على عنصر معين بشكل صحيح في كثير من الأحيان أكثر من الطلاب في المجموعة ذات الدرجات المنخفضة.
سينتج عن التمييز السلبي (غير المرغوب فيه) إذا فات الطلاب في المجموعة ذات الدرجات العالية عنصرًا في كثير من الأحيان أكثر من الطلاب في المجموعة ذات الدرجات المنخفضة.
يمكن حساب مؤشر تمييز العنصر عن طريق طرح عدد الإجابات الصحيحة على عنصر واحد من الطلاب في المجموعة ذات الدرجات المنخفضة من عدد الإجابات الصحيحة للطلاب على نفس العنصر في المجموعة ذات الدرجات العالية وقسمة هذا الاختلاف على عدد من الطلاب في إحدى المجموعات.
سيكون مؤشر التمييز الناتج بين 0، مما يشير إلى عدم وجود تمييز، و 1، مما يشير إلى تمييز مثالي بين الطلاب ذوي الدرجات العالية والمنخفضة في عنصر ما.
يشير المؤشر القريب من 1 إلى تمييز عالٍ بين المجموعتين على عنصر معين، وبالتالي، فهذا هو العنصر الأكثر استحسانًا.
يوفر تحليل العناصر نظرة ثاقبة على طريقة عمل عناصر محددة داخل الاختبار.
يمكن أن يساعد هذا التحليل المعلمين على زيادة موثوقية وصلاحية اختباراتهم.
بالإضافة إلى ذلك، يمكن أن يوفر التحليل للمعلمين معلومات بخصوص العناصر التي يصعب على الطلاب، وأيها أسهل، وأين يلزم إجراء تعديلات في المحتوى أو عملية التدريس.
في كتابهم “المدرسون ووظائفهم”، يوضح دبليو آر ميلر و إم إف ميلر الإجراءات الإحصائية المفيدة للمعلمين الذين يقومون بتحليل العناصر.

موثوقية الاختبار

الموثوقية والصلاحية مفهومان مهمان في التقييم.
تشير الموثوقية إلى اتساق أو استقرار الاختبار في إنتاج نفس الدرجات أو درجات مماثلة على مدار الإدارات المتكررة للاختبار.
على سبيل المثال، إذا حصل طالب على درجة عالية أو منخفضة في اختبار فهم الكلمات في الصباح، فيجب على المرء أن يتوقع أنه إذا تم إجراء نفس الاختبار أو اختبار مشابه في فترة ما بعد الظهر، فسيكون للطالب نفس الدرجة أو درجة مماثلة بشرط عدم إجراء أي تغييرات في مستوى معرفة الطالب أو إدارة الاختبار للتحيز في النتائج.
إذا أسفرت إدارتا الاختبار عن نفس النتائج أو نتائج مماثلة، فسيكون الاختبار موثوقًا به؛ ومع ذلك، إذا كان هناك تباين كبير بين الإدارتين، فسيكون الاختبار غير موثوق به.
تتأثر الموثوقية بمصادر مختلفة للخطأ، والتي تسمى الأخطاء العشوائية.
الاختلافات بسبب سمات الفرد مثل المعرفة العامة والقدرة والمهارات والتحفيز والصحة والانتباه كلها مصادر للخطأ.

تقدير التباين في الاختبارات التعليمية: دور الخطأ العشوائي ومعاملات الارتباط في تقييم الموثوقية

بالإضافة إلى ذلك، قد تكون الأخطاء العشوائية ناتجة عن اختلافات في خصائص الاختبار.
يمنح الاختبار القصير جدًا ميزة للطلاب الذين يعرفون الإجابة الصحيحة على بعض الأسئلة، بينما قد لا يعرف الطلاب الذين لديهم قاعدة معرفية أوسع في الواقع إجابات الأسئلة القليلة المطروحة.
من المفيد للمعلمين معرفة مقدار التباين الحقيقي (انتشار مجموعة من الدرجات) وتباين الخطأ المنعكس في درجة اختبار معينة.
في الاختبارات التعليمية، يفترض أن كل درجة اختبار ملحوظة لها مكون درجة حقيقي ومكون درجة خطأ؛ يساوي تباين الدرجة المرصودة تباين الدرجة الحقيقية بالإضافة إلى تباين الخطأ.
ومع ذلك، من الناحية العملية، من المستحيل حساب درجة اختبار حقيقية لأنه سيتعين على المرء إجراء اختبار عدد لا حصر له من المرات.
إذا كان هذا ممكنًا، فسيكون مجموع الأخطاء ومتوسط الأخطاء 0.

من الناحية النظرية، فإن الدرجة الحقيقية لفرد واحد هي متوسط الدرجة التي تم الحصول عليها من القياسات المتكررة؛ يعتبر في مكان ما بين زائد وناقص هامش خطأ معين، يسمى الخطأ المعياري للقياس (SEM).
يتم اشتقاق SEM من الانحراف المعياري لأخطاء أخذ العينات.
يتضح هذا المفهوم من قبل طالب يحصل على 80 درجة في اختبار تحصيل رياضيات و SEM 3.
2.يقال إن الدرجة الحقيقية للطالب تقع في مكان ما بين 76.8 و 83.2.
الممارسة الشائعة لتحديد استقرار درجات الاختبار هي حساب معامل الارتباط، المعروف باسم معامل الموثوقية، بين إدارتين مستقلتين لنفس الاختبار لعينة كبيرة ضمن فترة زمنية معقولة بين الإدارات (معامل موثوقية الاختبار وإعادة الاختبار أو معامل الاستقرار ).
الإجراءات الأخرى للتأكد من الموثوقية هي
(أ) ربط درجات الأشكال البديلة لنفس الاختبار الذي تم إدارته على التوالي لمجموعة كبيرة (معامل التكافؤ)
(ب) ربط الدرجات على أشكال متكافئة من اختبار تم إجراؤه في إدارتين مستقلتين خلال فترة زمنية قصيرة (معامل الاستقرار والتكافؤ).
يتراوح معامل الموثوقية من 0، مما يشير إلى عدم وجود موثوقية للاختبار، إلى 1، مما يشير إلى موثوقية مثالية.

تحقيق الاتساق الداخلي في الاختبارات: تقنية النصف المنفصل وأدوات التقييم الإحصائية

إجراءات موثوقية مختلفة مطلوبة للتأكد من مدى قياس جميع العناصر في الاختبار لنفس المعلومات.
يعرف هذا باسم الاتساق الداخلي للاختبار.
تقنية النصف المنفصل هي إجراء شائع الاستخدام لتحديد الاتساق الداخلي.
يتضمن ذلك إجراء اختبار، وتقسيم العناصر بشكل مستقل إلى نصفين متكافئين، وحساب معامل الارتباط بين النصفين.
تستخدم الإجراءات الإحصائية لـ Spearman-Brown لحساب الاتساق الداخلي باستخدام أنصاف منفصلة.
تعد صيغ Kuder-Richardson 20 و 21 و Cronbach alpha مفيدة لتقييم تجانس العناصر داخل الاختبار.
لا تتطلب هذه الإجراءات الأخيرة تقسيم الاختبار؛ بدلاً من ذلك، فهي تستند إلى خصائص الاختبار بأكمله.
يعد تطوير اختبارات موثوقة تحديًا، والحصول على موثوقية مثالية أمر مستحيل أو صعب في أحسن الأحوال.
تتأثر الموثوقية بمستوى صعوبة الاختبار.
يمكن أن يكون الاختبار شديد الصعوبة أو السهل جدًا موثوقًا به من حيث أن النتائج متشابهة.
ومع ذلك، في حالة الاختبار شديد الصعوبة، يوفر الاختبار نتائج الصدفة، وفي حالة الاختبار السهل جدًا، لن يسفر الاختبار عن نتائج ذات مغزى.
ومع ذلك، يمكن للمعلمين تحسين الموثوقية عن طريق
(أ) خلق بيئة اختبار إيجابية
(ب) إتاحة الوقت الكافي للطلاب لإكمال الاختبار
(ج) اختيار أو إنشاء اختبارات تغطي عينة تمثيلية من المحتوى، بما في ذلك عدد كافٍ من العناصر لاختبار اتساع المحتوى
(د) تضمين عناصر اختبار تثبط التخمين بحيث تظل درجات الطلاب مستقرة من إدارة اختبار إلى أخرى أو من شكل اختبار إلى آخر.
تتعلق الموثوقية باستقرار درجات الاختبار بمرور الوقت، وعلى الرغم من أن معلمي الفصل
لا يحسبون بشكل عام موثوقية اختباراتهم، فمن المتوقع أن يقوم مطورو الاختبار بتقييم والإبلاغ عن موثوقية جميع الاختبارات المعيارية.
الموثوقية شرط ضروري للصلاحية.

مقالات ذات صلة

اترك تعليقاً

لن يتم نشر عنوان بريدك الإلكتروني. الحقول الإلزامية مشار إليها بـ *

زر الذهاب إلى الأعلى

أنت تستخدم إضافة Adblock

برجاء دعمنا عن طريق تعطيل إضافة Adblock