Цена доставки диссертации от 500 рублей 

Поиск:

Каталог / ПЕДАГОГИЧЕСКИЕ НАУКИ

Тесты как средство контроля за качеством учебных достижений младших школьников по русскому языку

Диссертация

Автор: Калашникова, Светлана Георгиевна

Заглавие: Тесты как средство контроля за качеством учебных достижений младших школьников по русскому языку

Справка об оригинале: Калашникова, Светлана Георгиевна. Тесты как средство контроля за качеством учебных достижений младших школьников по русскому языку : диссертация ... кандидата педагогических наук : 13.00.12 Омск, 2006 232 c. : 61 07-13/370

Физическое описание: 232 стр.

Выходные данные: Омск, 2006






Содержание:

Введение
Глава 1Анализ состояния проблемы тестирования в России и за рубежом
1Л Исторический обзор использования тестов за рубежом
12Развитие тестологии в России
Выводы
Глава 2Теоретические и методические основы тестологии
21 Понятие «тест», требования, предъявляемые к тестам
22Классификация тестов
23Тесты достижений, их особенности, назначение, достоинства, недостатки, возможности использования
Выводы
Глава ЗТеория и практика использования тестов по русскому языку для начальной школы
31Особенности тестовых задач и методические требования, предъявляемые к ним в начальной школе
32Классификация тестовых заданий
33Этапы тестирования
34Возможности использования тестов на разных этапах уроков русского языка в начальной школе
Выводы

Введение:
В «Концепции модернизации российского образования на период до 2010 года» одним их приоритетов является новое современное качественное образование, которое может быть достигнуто через внедрение и использование тестовых методов контроля знаний учащихся. Актуальность нашего исследования обусловлена тем, что в последние годы все больше растет интерес к педагогическому тестированию как наиболее объективному методу оценки качества образования. Оценка качества образования приобретает в последнее время все большую значимость.
Тесты дают возможность заметно улучшить образовательный процесс, потому что обладают рядом преимуществ перед другими методами контроля знаний. Проверка знаний должна быть объективной и давать сведения об итогах процесса обучения. Традиционная для нашей школы оценка учителя этим требованиям зачастую не отвечает. При объективном итоговом контроле знаний и умений учащихся часто обнаруживаются расхождения с оценкой учителя. Эти расхождения могут быть следствием как субъективности учителя, так и объективных изменений в качестве знаний учащихся в конце учебного года. Отрицательное отношение большинства младших школьников к обычным видам контроля знаний объясняется, как правило, тем, что его результаты часто связаны с негативной оценкой их личности. Ежегодный тестовый контроль даст возможность каждому школьнику самостоятельно проверить свои знания по объективным критериям. Для этого ему достаточно выполнить без посторонней помощи тест, предлагавшийся при итоговом контроле в прошлом году, осуществить проверку по прилагаемому ключу, сосчитать правильные ответы и сравнить их с результатами, показанными школьниками при проверке знаний год назад. Если к тесту даются сведения о распределении школьников по количеству правильных ответов, то полученный при самоконтроле результат позволит определить свой относительный успех.
Являясь обязательной частью многих педагогических новаций, тесты снижают затраты на проверку знаний, помогают выявить индивидуальный темп обучения, а также пробелы в текущей и итоговой подготовке.
Быстрыми темпами развивается компьютерное тестирование, что дает возможность перейти к созданию современных систем адаптивного обучения и контроля. Без тестов невозможен переход к самому прогрессивному обучению учащихся на основе системы полного усвоения знаний. Обучение желательно начинать с входного тестирования, сопровождать текущим контролем с помощью заданий в тестовой форме и заканчивать объективным тестированием учебных достижений. Кроме того, тесты позволяют наладить самоконтроль - самую гуманную форму контроля знаний, а также организовать рейтинг - эффективное средство повышения учебной мотивации.
Растет число научно-методических изданий, посвященных педагогическому тестированию. Однако большинство из изданных книг под названием «Тесты по русскому языку» таковыми не являются. Это неплохие сборники заданий, которые при соответствующих доработках возможно использовать для создания тестового инструмента.
Выявленное нами противоречие между тестами как контрольным инструментом и их содержанием с учетом возрастных и психологических особенностей младших школьников позволило сформулировать тему исследования: «Тесты как средство контроля за качеством учебных достижений младших школьников по русскому языку».
Проблема исследования состоит в выявлении связей между содержанием тестов как контрольного инструмента и как средства обучения с учетом особенностей учащихся начальной школы.
Цель нашего исследования формулируется следующим образом: разработать тесты по русскому языку на основе требований, предъявляемых к тестам достижений, с учетом возрастных и психологических особенностей детей и определить их место в процессе обучения.
Объект исследования: тесты как объективный инструмент контроля учебных достижений.
Предмет исследования: тесты достижений, их место в системе обучения младших школьников русскому языку.
В исследовании мы исходили из гипотезы, согласно которой использование тестов при обучении русскому языку в начальной школе, разработанных на основе определенных требований, учитывающих возрастные и психологические особенности младших школьников, значительно повысит качество контроля и обучения учащихся начальных классов по русскому языку.
В соответствии с поставленной целью и выдвинутой гипотезой были сформулированы следующие задачи:
1.Изучить и проанализировать современное состояние проблемы использования тестов достижений как средства контроля за обучением.
2.0пределить место тестов школьных достижений в процессе обучения русскому языку младших школьников.
3.Исследовать содержание тестов с точки зрения учета особенностей обучения младших школьников.
4.Разработать. методику составления тестов по русскому языку с учетом задач обучения в начальной школе и особенностей учащихся.
5.Составить тесты в соответствии с разработанной методикой.
6.Провести экспериментальное исследование по оценке качества разработанных тестов.
Логика исследовательской работы обусловила применение комплекса следующих методов исследования:
•теоретические: теоретический анализ научных работ отечественных и зарубежных исследователей в области тестологии, сборников тестов по различным учебным предметам;
•эмпирические: педагогическое наблюдение, изучение и обобщение опыта использования тестов на уроках русского языка, апробация разработанных тестов с целью определения их места и соответствия особенностям младших школьников.
Методологической основой нашего исследования являются:
• ведущие положения психолого-педагогической науки об объективной необходимости постоянного совершенствования содержания, форм и методов обучения, а также средств контроля и оценки учебных достижений школьников с учетом их возрастных, психологических и личностных особенностей;
•концепции отечественных и зарубежных ученых-тестологов, исследовавших проблему использования тестов в области образования.
Этапы исследования
Исследование проводилось в течение 2000 - 2005 гг. и включало три этапа.
На первом этапе исследования (2000-2001) проводился анализ психолого-педагогической и специальной литературы с целью определения степени разработанности проблемы; определены теоретическая база и параметры исследования: актуальность, проблема, цель, объект, предмет и задачи, сформулирована рабочая гипотеза, был организован констатирующий эксперимент, направленный на изучение проблемы использования тестов на уроках русского языка в начальной школе.
На втором этапе ( 2002-2004) продолжалось изучение литературы по проблеме исследования, осуществлялась опытная проверка гипотезы, в ходе которой создавались тесты по русскому языку для начальной школы, разрабатывалась структура и содержание специального учебного курса «Использование тестов на уроках русского языка в начальных классах», осуществлялась апробация.
На третьем этапе (2004-2005) была завершена экспериментальная работа, проведена обработка, анализ и теоретическое осмысление полученных результатов, материалы оформлялись в диссертацию.
Научная новизна выполненного нами исследования состоит в том, что:
1)выявлены и экспериментально проверены требования к составлению тестов по русскому языку, учитывающие особенности младших школьников;
2)на этой основе разработаны тесты достижений по русскому языку для начальной школы;
3)определено место тестов как средства контроля среди других при обучении русскому языку младших школьников.
Теоретическая значимость исследования заключается в разработке методики составления тестов по русскому языку с учетом их места в учебном процессе и особенностей младших школьников.
Практическая значимость исследования определяется составлением тестов на основе предложенной методики; определении ее места, возможности и эффективности в процессе обучения русскому языку в начальной школе.
Достоверность и обоснованность результатов исследования обеспечивается методологической обоснованностью исходных позиций исследования; комплексным использованием разнообразных методов, адекватных предмету, целям и задачам исследования; сочетанием количественного и качественного анализа результатов экспериментальной работы.
На защиту выносятся следующие положения:
1 .В основе методики разработки тестов по русскому языку для начальной школы лежит учет специфики данной ступени обучения: правила формулирования содержания и инструкции выполнения тестовых заданий должны отвечать определенным требованиям; обязательна проверка с точки зрения объективности, корректности заданий и соответствия назначению теста; подбор адекватных дистракторов (вариантов ответов, которые не являются правильными, но внешне близки им); глубокое знание учебного предмета и специальные знания и навыки в области теории и практики тестологии.
2.0тбор тестового материала по русскому языку для начальной школы определяется общими требованиями: легкостью понимания его учениками, относительной новизной для школьников по способу решения и содержанию, лаконичностью, экономичностью с точки зрения выполнения; тестовое задание проверяет один элемент знания, четко сформулировано, имеет однозначный ответ.
3.Место тестов в системе обучения русскому языку младших школьников определяется особенностями изучаемого материала, подготовленностью класса и учителя к данной работе, который одновременно ставит и решает общепредметные задачи (воспитание средствами учебного предмета, развитие логического мышления, формирование умений самостоятельно выполнять задания, работать со справочной литературой).
4.Использование тестов в качестве формы контроля за уровнем учебных достижений младших школьников по русскому языку дает возможность объективной оценки знаний и умений учащихся по единым критериям и приучает их к осознанному выполнению учебных заданий на всех этапах усвоения материала и способствует формированию самоконтроля - одного из важнейших психических новообразований.
Апробация и внедрение результатов и материалов исследования осуществлялись в процессе обучения младших школьников в 3-4 тест-классах на базе средних школ № 55, 120 г.Омска, Тюкалинской СОШ №1, Кормиловского лицея, Нововаршавской гимназии, Саргатской СОШ №1, Русскополянской СОШ №2 Омской области в течение 2000-2005 г. В настоящее время данные тесты используются в практике учебного процесса учителями начальных классов Калачинского, Крутинского, Москаленского и Таврического районов Омской области. Кроме того, результаты внедрения обсуждались на курсах повышения квалификации учителей общеобразовательных учреждений Казахстана и Узбекистана с русским языком обучения, а основные выводы исследования докладывались и были одобрены на Всероссийской научно-практической конференции «Развитие системы тестирования в России» (Москва, 2000 г.), заседаниях кафедры русского языка, литературы и методики их преподавания, семинарах Центра образовательных инициатив Омского государственного педагогического университета. Разработана и апробирована программа специального курса «Использование тестов на уроках русского языка в начальной школе» для студентов факультета педагогики и психологии детства Омского государственного педагогического университета, а также для учителей начальных классов г. Омска.
По результатам исследования опубликовано 8 работ.
1.Анализ состояния проблемы тестирования в России и за рубежом в ее историческом развитии.
1.1.Исторический обзор использования тестов за рубежом.
Тестология - это система знаний о методах измерения и оценки индивидуальных особенностей личности, система, которая используется с дифференциальными целями в различных областях человеческой деятельности, иными словами, тестология - наука о тестах и их эффективном применении. Цель тестологии - достижение обоснованного вывода о знаниях учащихся на основе содержания теста.
Рассмотрим коротко историю зарождения и развития психологического тестирования, так как именно психологические тесты, в сущности, явились основой создания тестов достижений.
Испытания, подобные тестированию, можно найти еще в древнем мире. Так, ко времени расцвета Китайской империи относится одно из первых упоминаний о системе гражданских испытаний, которая была создана для отбора чиновников и охватывала весьма широкий спектр - от умения писать до поведения в быту. Свидетельством использования испытаний тестового характера служат рукописи, в которых излагаются основы религиозно-философского учения чань-буддизма (5-6 в. н.э.) Учителя чань-буддизма в качестве одного из методов обучения и проверки знаний использовали загадки, вопросы, парадоксы, параллельно создавая ситуации психологического стресса. Отвечать ученики должны были сразу, без размышлений. Как указывает Н.В. Абаев, чаньские парадоксальные загадки использовались в качестве тестов на определенный «чаньский» код мышления. В зависимости от того, как тестируемый отвечал на эти загадки, опытный наставник определял, на каком уровне тот находится и какие меры нужно принять для углубления его чаньского опыта (1, с. 173). Отметим, что парадоксальная ситуация и сегодня является основой ситуативных тестов, широко используемых для профотбора в различных сферах современной жизни.
Примеры использования различных методов, напоминающих тесты, можно найти в истории Древнего Египта и Древней Греции. Так, в Древнем Египте тот, кто посвящался в жрецы, должен был выдержать проверку на то, что в настоящее время называется профессиональной пригодностью. Начальным элементом системы отбора являлась оценка внешнего вида кандидата и беседа, в ходе которой оценивалось умение говорить и уровень образованности. Затем следовали испытания угрозой смерти, огнем и водой, а также проверка умений трудиться; на заключительном этапе - испытание красивой женщиной. Известно, что эту систему испытаний успешно прошел и Пифагор. А когда он вернулся после учебы в Грецию, то создал свою школу, в которую принимал только после серии испытаний.
В Древней Греции испытания использовались для оценки физического совершенства и искусства мыслить и рассуждать. Платон придавал большое значение природным задаткам, которые не только отличают людей друг от друга, но и влияют на их способности к тому или иному делу. «Люди рождаются не слишком похожими друг на друга, их природа различна, да и способности к тому или иному делу также. Поэтому можно сделать все в большем количестве, лучше и легче, если выполнять одну какую-нибудь работу соответственно своим природным задаткам» (75, с.227). Им была предложена серия испытаний военных способностей, которые проводили при отборе воинов в описанном им идеальном государстве. Можно сказать, что перечень этих испытаний - это первое систематическое описание тестов способностей.
Таким образом, идея, отдельные методы проверки способностей людей использовались тысячелетия назад. Если понятие «тест» определять как испытания такого рода, то можно сказать, что тесты зародились давно и применялись для решения задач, выдвинутых социальной практикой в сфере отбора, обучения и определения людей на различные должности в зависимости от степени их пригодности. Следовательно, можно говорить о раннем историческом периоде возникновения тестов.
Но история собственно тестирования, которое определяется как стандартизированное измерение индивидуальных различий, начинается с конца 19 века. Основной причиной, обусловившей начальный этап тестирования, принято считать выдвинутую врачебной практикой потребность в диагностике и лечении умственно отсталых и душевнобольных людей. Многие институты Европы и Америки, которые и были созданы для решения этих проблем, испытывали необходимость в доступных стандартах и надежных классификациях, позволяющих решать задачу практической дифференциации умственной отсталости от душевной болезни. Первые исследования, проведенные на клиническом материале, можно считать ранним этапом зарождения тестирования.
Французский врач Ж.Е.Д. Эскироль, автор одной из ранних публикаций, посвященной вопросам умственной отсталости, доказал, что между крайними полюсами нормальности и идиотии существует континуум многочисленных степеней умственной отсталости. Эти данные легли в основу первой в истории психологического тестирования классификации, позволяющей диагностировать различные степени проявления умственной отсталости. Эскироль отметил, что индивидуальный характер употребления языка в большей мере предопределяет интеллектуальный уровень человека. Заметим, что критерии задержки умственного развития, используемые в настоящее время, являются языковыми, а современные тесты интеллекта, как правило, -вербальными.
Неоценимый вклад в развитие тестирования внес другой французский врач - Э. Сегэн, который при помощи специальных методик тренировки сенсорного различения и развития моторного контроля опровергнул господствующее в то время мнение о неизлечимости умственной отсталости. Им была создана методика исследования уровня умственного развития детей - «Доска форм Сегэна» (Seguin Form Board) (20, с.298). Тест предельно прост, поэтому может быть использован при обследовании детей дошкольного возраста. В настоящее время тест широко используется при диагностике умственного развития детей-олигофренов, дифференциальной диагностике задержки умственного развития и нарушений, связанных с поражений центральной нервной системы.
Первые психологи-экспериментаторы конца 19 века заложили основы психологического тестирования и диагностики индивидуальных различий, хотя и не признавали существование последних как таковых. На развитие психологического тестирования повлияли работы, вышедшие из Лейпцигской лаборатории, основанной В.Вундтом. В них впервые четко выявилась необходимость стандартизации самой процедуры тестирования. Потребность в строгом контроле за условиями тестирования вытекала из таких установленных фактов, как влияние на ответ испытуемого характера и содержания инструкции, особенностей и параметров предъявляемых раздражителей. Со временем стандартизация процедуры проведения тестирования стала одним из отличительных признаков тестов.
Особое место в истории тестирования принадлежит Ф. Гальтону. Благодаря деятельности Гальтона, тестирование развивается как самостоятельное направление. С его именем связано первое широкое использование опросников, тестов словесной ассоциации. Гальтоном разработано множество простых тестов, многие из которых знакомы нам в модифицированном виде («линейка Гальтона» для зрительного различения длины, «свисток Гальтона» для определения верхнего частотного порога слуховых ощущений). Его можно назвать пионером в применении психологических тестов. В своих работах Гальтон (106, 107) доказал целесообразность применения математической статистики в экспериментальной практике. Он отобрал и адаптировал большое количество математических приемов, позволяющих количественно оценить результаты экспериментальной работы. Гальтоном была высказана идея сравнения результатов тестирования с каким-либо внешним, независимым от эксперимента критерием, что позволяло узнать, какой тест является более информативным. Так, впервые была высказана идея валидности теста, которая впоследствии развилась в концепцию валидности. Гальтон первым указал на то, что повторное тестирование является одним из лучших критериев проверки пригодности тестов. В современном обществе повторное тестирование с одним и тем же тестом одной и той же группы - один из распространенных методов проверки надежности тестов.
Итак, Ф. Гальтона можно по праву назвать основоположником метода тестов, который он считал адекватным методом изучения индивидуальных различий.
Первым ученым, который употребил в литературе термин «интеллектуальный тест», был американский психолог Дж. М. Кеттэлл. Этот термин приобрел широкую известность после статьи Кеттэлла «Интеллектуальные тесты и измерения», опубликованной в журнале «Mind» в 1890 году, в которой автор описал серию тестов для определения интеллектуального уровня студентов колледжей. Вслед за Гальтоном Кеттэлл утверждает, что применение серии тестов к большому числу индивидов даст возможность открыть закономерности психологических процессов и тем самым приведет к преобразованию психологии в точную науку. Вместе с тем он высказывает мысль о том, что научная и практическая ценность тестов возрастет, если условия их проведения будут однообразными. Кроме этого, Кеттэлл выдвигает еще ряд требований, которым должно соответствовать тестирование:
•ограничение времени тестирования;
•отсутствие зрителей в лабораториях, где проводится тестирование;
•наличие хорошего оборудования, располагающего людей к тестированию;
•единообразие инструкций для испытуемых, четкое понимание ими задач деятельности.
Так, вслед за В.Вундтом Кеттэлл доказал необходимость стандартизации тестов с целью возможности сравнения их результатов, и именно его исследования заложили основы современных тестов интеллекта, прообразом которых стала впоследствии шкала Бине-Симона.
Метод тестов начинают применять и другие американские лаборатории, вследствие чего возникает необходимость в организации специальных координационных центров по его использованию. В 1895-96 гг. в США были созданы два национальных комитета, призванных объединить усилия тестологов и придать общее направление тестологическим работам. А Бине и В. Генри критически оценили исследования Ф. Гальтона и Дж. Кеттэлла по измерению уровня умственного развития. Указывалось, в частности, что предлагаемые ими тесты ориентированы, прежде всего, на элементарные психические процессы, а следовательно, неадекватно измеряют высшие психические функции, лежащие в основе интеллекта.
Исследования, проводимые в это же время в Европе, были направлены на изучение более сложных психических функций. Так, Э. Крепелин разработал на клиническом материале серию тестов, позволяющих оценить такие процессы, как память и внимание по показателям выполнения простейших арифметических действий. В работах Г. Эббингауза (105) тесты на выполнение арифметических действий используются для оценки непосредственного запоминания, которая дает высокие корреляции с оценкой школьной успеваемости. Можно назвать тесты Эббингауза первыми тестами достижений.
Отметим, что большинство тестов, действующих на рубеже 19-20 веков, имело специфическую сенсорную направленность, в них выделялись исключительно простейшие, единичные и узковыраженные функции. Ни в одном из этих исследований не было системы работы с тестами, кроме того, в них не учитывались возрастные нормы испытуемых, не было сопоставлений результатов тестирования с успеваемостью учащихся. Период до начала 20 века можно назвать подготовительным этапом на пути создания собственно психологического тестирования.
Дальнейшая разработка тестирования связана с именем А. Бине, создателем самой популярной для своего времени серии тестов. Можно сказать, что почти все дальнейшие конструкции интеллектуальных тестов так или иначе связаны с работами Бине (20, с.22-23). Эксперименты, проведенные под руководством Бине в школе, возникли под давлением требований жизни. Необходимо было диагностировать степень умственного развития детей, поскольку претворение в жизнь закона об обязательном всеобщем обучении выявило значительные индивидуальные различия, которые или осложняли процесс обучения, или делали его невозможным. Однако задача диагностики степеней умственной отсталости с помощью тестов того времени еще не была решена. Первая редакция шкалы умственного развития была разработана А.Бине и Т.Симоном в 1905 году с целью выявления умственно неполноценных детей, не способных к обучению в обычной школе. Шкала состояла из 30 тестов-заданий, расположенных по мере возрастания трудности, так что вероятность успешного выполнения увеличивалась с хронологическим возрастом. Уровень трудности определялся на основе выборки из 50 нормальных детей в возрасте от 3 до 11 лет и небольшого числа детей, отстающих в развитии. Обследуемые с различными видами слабоумия не справлялись с заданиями выше определенного уровня сложности. На этой основе и проводилась дифференциация. Созданный тест рассматривался как вспомогательный инструмент изучения интеллекта, общий же показатель интеллекта не рассчитывался.
Вторая редакция шкалы Бине-Симона (1908) была существенно пересмотрена. Увеличилось количество тестов-заданий, исключены неудачные. Была значительно расширена выборка стандартизации. Авторы поставили перед собой более широкую задачу: кроме дифференциации детей на нормальных и слабоумных выделить разные уровни развития нормальных детей. Тесты-задания группировались по возрастным уровням. Для каждого возраста предполагалось не меньше 5-7 заданий, причем Бине отмечал, что важно не столько содержание тестов, сколько их многочисленность. По мнению А. Бине, это связано с тем, что интеллект является врожденным качеством и его уровень не изменяется с возрастом, меняется лишь содержание разрешаемых проблем. Поэтому смышленый ребенок всегда лучше справится с заданием, а большое количество заданий поможет избежать случайностей. Наибольшей трудностью при конструировании заданий была необходимость строить их таким образом, чтобы уровень знаний ребенка, его опыт не влиял на ответ. Только тогда, подчеркивал Бине, можно будет отличить обученного ребенка от ребенка способного, так как дети с высоким интеллектом, но не имеющие специального обучения, будут в равном положении с детьми, которых учили в хороших учебных заведениях или дома. Заметим, что это положение Бине остается актуальным и сегодня и является необходимым условием при разработке новых тестов и модификации старых, а также при переводе и модификации зарубежных тестов.
Было введено понятие «умственный уровень»; в дальнейшем это понятие в различных переводах и переработках теста было заменено термином «умственный возраст».
Третья редакция шкалы была опубликована в 1911 году. Она претерпела незначительные изменения: переставлены отдельные тесты-задания, введены новые задания, шкала продлена до уровня взрослого.
Существенным недостатком процедуры вычисления показателя умственного развития по шкале Бине-Симона является то, что одна и та же разность для различных возрастных ступеней имеет неодинаковое значение. Предложенный немецким психологом В. Штерном коэффициент IQ и вскрыл этот недостаток. Для его устранения Штерн стал определять не абсолютную меру интеллекта - разность, а относительную, т.е. частное, получаемое при делении умственного возраста на хронологический. Этот показатель он и назвал интеллектуальным коэффициентом.
Заслугой А. Бине, В. Генри и Т.Симона являются выдвинутые ими важнейшие принципы измерения интеллекта, которые положены в основу современных тестов. Шкалы Бине-Симона привлекли внимание многих психологов, были переведены на многие языки и широко использовались в начале века. Отметим, что шкала Бине-Симона получила широкое распространение и в СССР в 20-30-е годы; ее усовершенствовала A.M. Шуберт. Усовершенствование носило как частный, так и более принципиальный характер. Например, наблюдались трудности с интерпретацией полученных результатов, и поскольку степень владения речью существенно сказывалась на решении тестовых задач, было уменьшено число словесных тестов.
В настоящее время шкалы Бине-Симона являются одними из самых удачных и наиболее адекватно измеряют интеллектуальное развитие детей.
Их дальнейшее развитие было осуществлено в работах американского исследователя JI. Термена (116).
JI. Терменом была разработана шкала Станфорд-Бине, представляющая собой модификацию шкалы Бине-Симона: было добавлено более трети новых заданий, переделан ряд старых. Фактически уже первая редакция шкалы Станфорд-Бине - это новый тест. Тесты, включенные в батарею Станфорд-Бине, группируются по возрастным уровням. В батарею тестов включены задания, которые направлены на исследование широкого диапазона способностей, - от элементарного манипулирования до абстрактного рассуждения. На ранних возрастных уровнях тесты требуют зрительно-моторной координации, перцептивного различия, способности понимать инструкцию, узнавать предметы. На высших возрастных уровнях представлены тесты, использующие вербальное содержание заданий. Это словарный тест (объяснение значения слов), аналогии, завершение предложений, определение абстрактных понятий, объяснение смысла пословиц. Отдельные тесты направлены на характеристику качеств навыка чтения и речи (быстрое называние не связанных между собой слов, построение предложений с заданными словами). Среди заданий имеют место тесты общей осведомленности: на знание норм общественной жизни, правил поведения (ответы на вопросы, интерпретация ситуаций, обнаружение несоответствий в сюжетных рисунках или рассказах). В шкалу включены также тесты памяти, пространственной ориентации, а на высоких возрастных уровнях оценивается степень усвоения отдельных навыков, приобретенных в школе (умение читать, знание арифметики).
Внутри каждого возрастного уровня тесты расположены без учета сложности заданий и одинаковы по степени трудности. Для каждого возрастного уровня предусмотрен запасной набор заданий.
Испытуемому предлагается не полный набор заданий, а только лишь те тесты, которые соответствуют его интеллектуальному уровню. Процедура обследования начинается с использования заданий, относящихся к более низкому уровню, чем тот, который соответствует возрасту испытуемого. Далее, в зависимости от успеха или неуспеха, осуществляется переход на более высокий или низкий уровень. «Базовый уровень» определяется как максимальный возрастной уровень, все задания которого выполнены. Исследование продолжается с переходом на возрастающие группы заданий до тех пор, пока все тесты данной группы окажутся нерешенными. Соответствующий уровень определяется как «потолочный».
Вся процедура обследования занимает немного времени: 40 минут для детей младшего школьного возраста и не более полутора часов для старших возрастных групп. При обследовании с помощью ряда тестов эта методика дает возможность для получения широкой качественной информации о методах работы испытуемого, о способах решения им задач; предоставляются возможности для наблюдения за личностными качествами: уровнем активности и мотивированности, уверенности, настойчивости.
В дальнейшем тест неоднократно совершенствовался, и в настоящее время используется уже третья его редакция (1972). По применению шкал Станфорд-Бине накоплен огромный опыт; по широте использования эта методика занимает одно из ведущих мест среди тестов интеллекта.
В 1915 году Р. Иеркесом была создана серия тестов, отличающаяся от тестов Бине системой подсчета. Вместо возрастных долей (по Бине) испытуемый получает за каждый правильно решенный тест известное количество баллов. По определению М.С. Бернштейна, «эти американские ревизии Бине представляли значительные удобства как в отношении проведения, так и в отношении подсчета результатов теста. В конечном счете количество полученных испытуемым баллов переводилось по приложенным стандартам в коэффициент одаренности или успешности» (12, с.52).
В эти же годы появляются первые стандартизированные педагогические тесты по различным дисциплинам. Отметим тесты К. Стоуна на проверку арифметики, Б. Бекингема на проверку правописания.
Направленность тестологии на быстрое решение практических задач способствовала ее широкому распространению. На основе тестов интеллекта решались вопросы обучения, профотбора, оценки достижений. Низкий IQ считался показателем обучения ребенка в специальной школе, высокий IQ давал возможность направить ребенка в школу для одаренных.
Итак, все тесты, созданные к началу 20 века, - это индивидуальные тесты, позволяющие проводить работу только с одним человеком. Использовать такие тесты могли специально подготовленные люди, имеющие высокую психологическую квалификацию. Все это ограничивало широкое распространение тестов. Практика же требовала диагностировать массы людей с целью отбора наиболее подготовленных к тому или иному виду деятельности, а также распределения по разным видам деятельности людей в соответствии с их индивидуальными особенностями. Как инструмент массового тестирования были разработаны групповые тесты, которые не только сделали реальными испытания больших групп, но и значительно упростили инструктирование, проведение процедуры и оценку результатов. Одними из первых тестов для массовых обследований стали разработанные в США А. Отисом армейские тесты «Альфа» и «Бета», направленные на оценку общих способностей при отборе новобранцев для прохождения службы. Тесты «Альфа» предназначались для знающих английский язык, а тесты «Бета» для неграмотных и иностранцев (тесты в виде картинок). Иными словами, тесты «Альфа» явились прототипом групповых словесных тестов, тесты «Бета» - прототипом групповых бессловесных тестов. С помощью этих тестов выявлялись умения и навыки, то есть тот наличный статус, который сложился к моменту испытания. Основные принципы, использованные при составлении этих тестов, впоследствии легли в основу методологии групповых тестов. Эти принципы были систематизированы М.С. Бернштейном и сведены к следующему:
1.Принцип ограничения времени. Время было рассчитано таким образом, чтобы только около 5% испытуемых могли выполнить весь тест. Показатель развития был поставлен в прямую зависимость от скорости выполнения заданий испытуемым.
2.Принцип детализированной инструкции как в отношении проведения, так и в отношении подсчета.
3.Тесты с выборочным методом формулирования ответа, с указанием подчеркивать наугад в случае незнания или сомнения.
4.Подбор тестов после тщательной статистической обработки и экспериментальной проверки (12, с58-60).
Эти принципы были положены впоследствии в основу большинства групповых тестов. Так, в начале 1918 года Артур Отис опубликовал первую серию групповых психологических тестов для школы. В это же время группа американских ученых-психологов (Йеркес, Торндайк, Тэрмен, Уиппл, Хаггерти) работает над созданием интеллектуальных тестов для школ всей страны. Эти тесты получили название «национальных тестов». «Национальные тесты» были составлены в двух сериях по два варианта в каждой серии. Совершенствуя методику, американские тестологи в этих тестах впервые перед каждым разделом теста дают примерные упражнения. «Национальные тесты» были опробованы на 4000 испытуемых каждой школьной группы.
После окончания первой мировой войны армейские тесты «Альфа» и «Бета» и их модификации получили самое широкое распространение. По образцу тестов «Альфа» созданы многие современные серии тестов.
В то время как индивидуальные тесты применялись в клинике и для консультирования, групповые тесты использовались преимущественно в системе образования, в промышленности и в армии.
Двадцатые годы 20 века можно охарактеризовать как тестовый бум. Создается множество разнообразных тестов.
Г. Мюнстербергом (1924) были предложены тесты для профориентации и профотбора. Эти тесты сначала проверялись на группе рабочих, достигших лучших результатов, а затем тестированию по ним подвергались вновь принимаемые на работу. Как отмечает М.Г. Ярошевский, предпосылкой данной процедуры, по-видимому, служила идея корреляции между психическими структурами, необходимыми для успешного выполнения деятельности, и теми структурами, благодаря которым испытуемый справляется с тестами. Корреляция могла быть достоверной только статистически, так как природа самих структур оставалась неясной (103, с. 272).
Измерение интеллекта с помощью теста рассматривается в качестве средства, позволяющего научно подойти к вопросам обучения, оценки достижений, профотбора. Тем не менее, валидизация выявила ограниченные возможности тестов интеллекта: необходимая точность прогнозирования на их основе успешности конкретных, достаточно узких видов деятельности часто не достигалась. Помимо знания общего уровня интеллекта потребовалась дополнительная информация об особенностях психики человека. Так возникло новое направление в тестологии - тестирование специальных способностей, которое сначала рассматривалось как дополнение оценки тестов интеллекта, а впоследствии выделилось в самостоятельную область. Разработка тестов способностей была связана с необходимостью решения практических задач в области профотбора и профориентации.
Широкое развитие измерения специальных способностей происходило за счет применения факторного анализа, позволившего определить и классифицировать их более точно. Работы этого направления были начаты английским психологом Ч. Спирменом (114). Ч. Спирмен доказал, что положительная корреляция между тестами на различные способности выявляет общий генеральный фактор; он обозначил его буквой «G". "G -фактор" понимается Спирменом как общая «умственная энергия», которой в равной мере наделены люди и которая влияет на успех выполнения любой деятельности. Из теории Спирмена следует ряд важных выводов для тестологии:
•фактор общей умственной энергии - единственное, что объединяет успешность решения самых различных тестов;
•корреляции результатов выполнения любой группой людей любых интеллектуальных тестов должны быть положительными;
•для тестирования фактора G лучше всего применять задачи на выявление абстрактных отношений.
Статистические методы Спирмена сыграли большую роль для дальнейшего развития метода тестов как в Америке, так и за ее пределами.
Кроме фактора, общего для всех видов деятельности, в каждом из них при его осуществлении обнаруживается специфический фактор, свойственный только данному виду деятельности («S - фактор»). Это направление было продолжено американскими исследователями Т. Килли и JI. Терстоуном (117). По мнению J1. Терстоуна, метод факторного анализа применяется для «конденсирования» тестовых оценок, сведения их к относительно малому числу независимых переменных и для выделения факторов, необходимых для описания индивидуальных различий тестовых результатов. Следовательно, факторный анализ определяется не только как метод статистической обработки исходных данных для их обобщений, но и широкий научный метод подтверждения гипотез относительно природы процессов, которые присущи самому измеряемому свойству. На основе факторных исследований были созданы многофакторные батареи тестов способностей, позволяющие измерять индивидуальный уровень каждой из способностей. В качестве примера назовем Батарею тестов общих способностей (GATB), которая включает тесты общих способностей для конкретных профессий. Батареи тестов множественных способностей получили широкое распространение после второй мировой войны и использовались прежде всего в армии. Созданные JI. Терстоуном тесты и теоретические разработки в методическом отношении определили развитие теории психологических и социологических измерений на несколько лет вперед.
Отметим, что в настоящее время методы факторного анализа представляют собой специальную область математической статистики.
Психологическое тестирование интеллекта и способностей, используемое в промышленности и в военном деле с целью классификации и отбора, затронуло и образование. При проведении экзаменов применяются новые технические приемы и формы, получившие общее название «тесты достижений». Историю развития стандартизированных тестов достижений можно проследить с того момента, когда в Бостонской школе (1845) устная форма экзаменов была заменена на письменную. Основным достоинством последней стало наличие однотипной ситуации для всех экзаменующихся, позволяющей проверить более широкий объем знаний, исключить элементы случайности, устранить субъективизм оценках. Предтечей тестов школьной успеваемости можно считать появившиеся в 1864 году шкалированные книги Дж. Фишера (scale books), где были даны вопросы и ответы для выбора. Эти книги содержали вопросы по правописанию, арифметике, чтению, грамматике и навигации. По справедливому замечанию А.Г. Шмелева, «наши обычные школьные контрольные работы по проверке знаний и умений являются не чем иным, как не слишком хорошо формализованными и отработанными тестами достижений» (73, с.50).Среди тестов достижений можно выделить две группы процедур. Одна из них представляет собой использование и стандартизацию принципов, разработанных в психологической лаборатории для тестирования особенностей правописания, арифметических вычислений и рассуждений (автор - Р. Торндайк), другая представлена различными сериями тестов достижений, в том числе и новейшими формами тестирования с помощью компьютера.
Однако началом систематических измерений в педагогике считается 1894 год. Эти измерения были проведены в Америке доктором С. Райсом, который составил первый педагогический тест. Этот тест измерял эффективность более или менее длительного обучения навыку письма. Результаты, полученные С. Райсом, в корне противоречили установившемуся методу обучения этому навыку. Поэтому его тестовый метод подвергся резкой критике со стороны преподавателей. Но с развитием педагогической науки идеи С. Райса стали привлекать внимание передовых американских педагогов.
Основоположником педагогических измерений считается Р. Торндайк. Под его руководством и при его непосредственном участии были созданы первые школьные тесты. Р. Торднайком выделено три периода в развитии измерений в области психологии и педагогики в 20 веке.
Исследование Р. Торндайка (118) явилось результатом большой исследовательской работы, дало мощный импульс всей тестовой работе в Америке и способствовало дальнейшему развитию школьных тестов. Первым стандартизированным тестом, опубликованным под руководством Р. Торндайка, был тест К. Стоуна на решение арифметических задач. С 1909 по 1914 год появляются: шкала оценки детского почерка Р. Торндайка; шкала оценки сочинений английского языка Хиллегаса; шкала правописания Б. Бекингема; оценочные шкалы почерка и правописания Айриса, составленные на основе эксперимента. В это же время появляются арифметические тесты С. Кортиса, которые измеряли знания четырех арифметических действий. Большое значение для дальнейшей разработки школьных тестов имели школьные обследования, целью которых было сравнение оценки работы разных школ и для которых разрабатывались специальные системы тестов.
В 1929 году в Нью-Йорке вышла книга В. Хенмона (109), посвященная детальному анализу тестирования, проводимого Американским и Канадскими комитетами по изучению современных языков. Практическая значимость книги, на наш взгляд, в том, что в ней обобщен опыт составления и использования тестов и обоснована необходимость создания объективных стандартных тестов, предназначенных для измерения прогресса, то есть того, каких конечных результатов достиг учащийся в процессе обучения. В книге также обобщены критерии, которым должны удовлетворять тесты по иностранным языкам, приведена последовательность составления тестов. Итак, создание тестов, по мнению В. Хенмона, необходимо для достижения следующих целей:
1 ^становление уровня знаний учащихся;
2)сравнение успехов в различных школах и классах при различных методах обучения и при различных условиях;
3)формирование классов по однородности знаний;
4)исследование метода преподавания, программы и целей преподавания;
5)диагностирование недостатков в преподавании и установлении путей исправления их.
В. Хенмон утверждает, что невозможно сделать глубокого анализа очень многих важных школьных проблем без такого объективного измерителя, как письменный тест, который выгодно отличается от «весьма субъективной, изменчивой и ненадежной системы школьных оценок».
Составление тестов по В. Хенмону включает следующие этапы:
1 Определение элементов языка, овладение которыми целесообразно контролировать с помощью тестов. Как уже указывалось, книга Хенмона посвящена проблеме тестирования в методике обучения иностранному языку; (с точки зрения проблемы нашего исследования этот этап можно определить как «установление тех разделов и тем курса русского языка, которые можно контролировать с помощью тестов»);
2)выбор и расположение заданий теста;
3)выбор метода выполнения теста и размера теста, который давал бы объективные и надежные результаты;
4)стандартизацию теста на базе широкого его проведения в различных учебных заведениях, которые отличаются составом учащихся, квалификацией преподавателей, условиями и методами обучения с целью установления точных норм выполнения для каждого контингента испытуемых.
В. Хенмоном проанализированы существовавшие тогда методы выполнения тестов - «testing technique»:
1.Метод дополнения (completion or recall technique), когда ученику следует заполнить пропуск.
2.Метод выбора, называемый по-разному ( multiple - choice, alternative -esponse, selection or recordnition technique), когда ученику для выбора предлагается несколько (обычно 4-5) конструкций, из которых только одна является ответом на поставленный вопрос.
3.Метод правильного и неправильного ответа (true - false technique), когда учащемуся даются для выбора два предложения: одно верное, а второе неверное.
4.Метод установления соответствия (matching technique), когда, например, необходимо сочетать прилагательные правого столбика с подходящими существительными левого столбика.
5.Метод свободного формулирования ответа, или метод изложения, (essay technique), при котором учащийся должен сам составить и написать ответ на заданный в тесте вопрос.
Все эти методы выполнения теста отличаются друг от друга надежностью, валидностью, временем выполнения, легкостью подсчета результатов, возможностью догадки и приемлемостью для определенных учебных предметов. Так, методы выбора правильного и неправильного ответа требуют меньше времени для выполнения, чем методы изложения и дополнения. Второй, третий, четвертый методы допускают возможность догадки, что исключается при первом и пятом методах. Обработку результатов теста легче провести при первом, втором, третьем и четвертом методах, когда ответы учащихся могут быть записаны на специальном бланке, который легко проверить с помощью шаблона. При пятом методе обработка результатов затруднена, так как учащиеся составляют ответы сами, и эти ответы сложно записать на специальном бланке. Кроме того, учащиеся могут дать правильный ответ в разной форме, что затрудняет обработку результатов, потому что формализация проверки становится практически невозможной.
Итак, В. Хенмоном был собран большой материал по методам проведения тестов, что, безусловно, внесло весомый вклад в классическую теорию тестов.
Интерес представляет разработка американскими тестологами прогностических тестов, что освещено в работе П. Симондза (115). П. Симондз разработал принципы составления прогностических тестов; техника их составления по П. Симондзу заключается в том, что перед составлением основного теста, учащимся предлагается выполнить несколько пробных тестов, которые анализируются и откладываются до конца года. В конце года этим же учащимся дается тест успешности, а затем результат каждого теста, данный в начале года, коррелируется с тестом успешности, данным в конце года. Тот тест, который покажет самую высокую корреляцию с тестом успешности, может иметь и самую высокую прогностическую ценность. Несомненно, этот метод определения лучшего прогностического теста имеет свои недостатки. Целью прогностического теста является выявление способностей, а итоговый тест успешности есть уже их результат, результат методов преподавания, интереса к предмету, квалификации преподавателя. Нельзя точно определить, как высока корреляция между способностями учащихся и их достижениями. Считаем, что целесообразно принять результаты при обычных условиях за критерий. П. Симондз утверждает, что в любом случае тесты, полученные в результате такой процедуры, будут значительно лучше, чем тесты, составленные на основе субъективного анализа материала предмета.
В 1905 году появились первые педагогические тесты во Франции, составленные Ванэ; построены они были чисто эмпирически и были тестами на счет, решение задач и правописание. Они были изданы в «Бюллетенях свободного объединения для психологического изучения ребенка». Этот же журнал в 1914 году печатает тест братьев Анфруа, тест был более упрощенный, чем у Ванэ. Однако оба теста не нашли применения. С 1925 года регулярно издаются школьные тесты на проверку счета, чтения и письма. Наряду с французскими тестами, используются американские тесты. Отметим, что тестовая работа во Франции не велась в таком объеме, как в Америке.
Продуктивно работают и английские тестологи. Так, в книге Фреда и Элеоноры Шоннел особое внимание уделяется вопросам тестирования, видам тестов и их применению (113). Авторы считают, что тесты, составленные для применения в системе образования, должны быть предназначены для определения целей и пригодны для определенной группы учащихся. Обучение без использования тщательно разработанных тестов может снизить, по их мнению, эффективность преподавания. Фред и Элеонора Шоннел отмечают, что ценность тестирования зависит от выбора теста, от того, насколько правильно он проведен, от умения оценить результаты теста и использовать их в дальнейшей работе. Они определяют критерии, которым должен соответствовать тест: пригодность (валидность), надежность, объективность, экономичность, простота обработки результатов.
Авторы разделяют тесты на два вида:
•стандартизированные, которые составляются на основе проверки их на большом количестве учащихся определенного возраста, определенной группы;
•тесты, составленные педагогом с целью проверки определенных знаний, умений и навыков, которым обучали в определенное ограниченное время в данном учебном заведении.
Большое внимание уделяется весьма существенному, по мнению авторов, этапу тестирования - проведению теста. Атмосфера, созданная в течение написания всего теста, как отмечают авторы, имеет огромное значение для количественных и качественных результатов теста. Очень важно создать дружественную, приятную обстановку. Учащимся следует объяснить в приветливом тоне, в чем состоит сущность теста, как его выполнять, указать, что, может быть, не на все задания будут даны правильные ответы. Нужно, чтобы тест проводил один человек. Чем больше экзаменаторов, тем больше отвлечений. Важно, чтобы экзаменатор ни с кем не разговаривал. Нельзя ходить между рядами, это также отвлекает испытуемых. Необходимо строго придерживаться инструкций теста. Всем своим поведением нужно воодушевить учащихся на его выполнение.
Большое внимание в книге уделяется вопросу использования результатов теста. Авторы считают, что результаты теста должны использоваться: -для распределения учащихся по группам;
•для диагностирования трудностей, которые встретились учащимся; -для изменения в содержании программы на основе сведений, полученных из тестов;
•для изменения в методах преподавания, причем особое внимание следует уделить «remedial method» - методу «исправления», который нужно использовать с учащимися отстающими и нуждающимися в помощи учителя.
Книгу Фреда и Элеоноры Шоннел можно назвать классическим пособием по тестированию: в ней дана классификация тестов, указаны требования, предъявляемые к тестам, определены своего рода нравственные нормы тестирования.
В книге Дж. Реймонда Гербериха (108) предлагается 227 тестов успешности и подробно объясняется, как проводить, оценивать и использовать результаты тестов. Даются также рекомендации по составлению тестов успешности. Дж. Герберих рекомендует такую последовательность в измерении: сначала определить, что измерять, а затем, как измерять. Большое внимание автор уделяет тому, что измеряется с помощью тестов. Приводя примеры из различных областей знаний, он доказывает, что тестами в основном измеряются умения и навыки. По мнению Дж. Гербериха, объективные тесты - это наиболее приемлемая форма измерения. Основными критериями качественного теста, вслед за Фредом и Элеонорой Шоннел, Герберих считает валидность, надежность, объективность, экономичность, простоту обработки результатов, а также возможность проведения теста в существующих условиях и их сравнимость.
Большой интерес представляют работы А.Дэвиса и Э. Инграм.
Книга А. Дэвиса (104) посвящена целям тестирования и видам тестов по иностранным языкам. Представляется интересной точка зрения А.Дэвиса о целях тестирования. Автор разделяет цели тестирования на исследовательские и практические, утверждая, что перед преподавателями выступают тесты только с их практической целью. Преподаватель, получая результаты теста, не только сравнивает учащихся, но ищет и находит причины неудачного выполнения теста, видит недостатки своего преподавания, которые исправляет в своей дальнейшей работе. Считаем, что любой тест заключает в себе какое-либо исследование, которое приводит к практическим преобразованиям. Это касается не только тестирования иностранных языков. Интересна, на наш взгляд, мысль Дэвиса о том, что чем теснее связь между обучением и тестированием, тем эффективнее будет обучение.
В трудах Э. Инграм (110, 111, 112) решается проблема конструирования и проведения диагностических тестов и тестов достижений. Интерес представляет проблема анализа заданий теста. Ценность любого теста, считает Э. Инграм, зависит от каждого задания, включенного в тест. Отсюда следует первоочередная задача составителя теста - провести качественный и количественный анализ заданий теста. Анализ заданий является средством оценки того, сколько и какую информацию содержит каждое задание по отношению ко всей информации, содержащейся в тесте в целом. Данные для анализа следует получить из результатов теста, проведенного с экспериментальной группой учащихся. С этим утверждением автора нельзя не согласиться, как нельзя не согласиться и с рекомендациями составителям тестов, предложенными Р. Торндайком и Е. Хаген (118):
1.Задания должны легко читаться, т.е. по трудности изложения и по словарному составу задания должны быть максимально доступны.
2.Если это тест успеваемости, то задания не должны воспроизводить формулировки, данные в учебнике.
3.Знания одних заданий не должны зависеть от знаний других заданий.
4.В тестах с выборочными ответами правильные ответы по заданиям должны распределяться в случайном порядке.
5.Формулировки заданий не должны содержать двусмысленностей, а тем более ловушек.
6.В тестах альтернативной формы следует избегать слов-подсказок. Задания, начинающиеся словами «все», «всегда», «никогда» - часто бывают неправильными, а начинающиеся словами «обычно», «иногда», как правило, бывают верными.
7.В тестах, где требуется заполнение пропусков в заданиях, следует избегать большого количества пропусков в каждом отдельном задании. Пропущенные слова должны быть ключевыми для правильного понимания задания.
8.Для выборочного теста сама суть должна содержаться в головном вопросе. Его не следует перегружать второстепенными деталями. Среди предполагаемых ответов не должно быть явно нелепых, равно как и ловушек.
Составленный набор заданий подвергается опытной проверке на репрезентативной выборке, то есть на испытуемых, соответствующих по полу, возрасту, уровню образования, социальной и культурной среде, по жизненному опыту тем контингентам, для испытания которых этот тест предназначен. «Многие исследования показали влияние жизненного опыта и обучения на тестовые показатели. Это показывает, насколько опасно сравнивать группы с различным жизненным опытом по одним и тем же тестам», - пишут Торднайк и Хаген (118, с.255).
Р. Торндайк и Е. Хаген справедливо отметили, что точной науки конструирования тестов не существует. В то же время их научно обоснованные рекомендации необходимо учитывать при составлении различных тестов, в том числе и тестов достижений. Мнение Р. Торндайка и Е. Хаген разделяют и другие тестологи. Например, П. Клайн (Великобритания) считает, что конструирование теста - это и наука, и искусство. Наука состоит в умении использовать достаточно отработанный механизм проверки диагностических методик при установлении их валидности и надежности. Искусство разработчика теста заключается в удачно подобранном содержании заданий, в их соответствии умственному развитию той выборки, для которой и создавался тест (49).
В создаваемых в последующие годы за рубежом тестах, несмотря на возрастающую их численность, количество принципиально новых идей и решений ограничено.
В настоящее время тестирование - ведущий метод психологической и педагогической диагностики. К. Ингенкамп (Германия) справедливо отмечает, что тестирование, способствующее улучшению учебного процесса, ориентируется на следующие цели:
•внутренняя и внешняя коррекция в случае неверной оценки результатов обучения;
•определение пробелов в обучении; -подтверждение успешных результатов обучения; -планирование последующих этапов учебного процесса; -мотивация с помощью поощрения за успехи в учебе и регулирования сложности последующих шагов; -улучшение условий учебы.
Эти цели характеризуют собственно тесты достижений (тесты школьной успеваемости) (43).
Новые тенденции развития тестирования позволяют снять многие критические замечания, высказанные в его адрес. Так, создаются тесты обучаемости, основанные на идее «зоны ближайшего развития». В таких тестах есть этап педагогического воздействия; можно проследить успешность дальнейшего продвижения ученика после вмешательства педагога; моделируется процесс обучения или развития. Ю. Гутке и У. Волраб (Германия, 1986) предлагают два типа тестов обучаемости:
1 .Кратковременные тесты обучаемости. Эти тесты включают три этапа: предварительный тест, в ходе которого устанавливается исходный уровень; фаза педагогического воздействия, которая имеет два типа обратной информации («правильно - неправильно» и «правильно - неправильно» + подсказки); заключительный тест. Заключительный тест в узком смысле можно назвать тестом обучаемости, так как он выявляет достигнутое благодаря фазе педагогического воздействия, в то время как предварительный тест приравнивается к традиционному.
2.Долговременные тесты обучаемости (тесты с тренировкой) имеют следующий порядок тестирования:
Первый день: предварительный тест (форма А или Б); Третий день: тренировка с помощью обучающей программы; Пятый день: тренировка с помощью обучающей программы; Седьмой день: заключительный тест (форма А или Б). При таком тестировании удается избежать недостатка, свойственного традиционному: выявление уровня достижений без ориентировки на потенциальные возможности ученика. Можно сказать, что Ю. Гутке и У. Волраб идут принципиально новым путем в разработке тестов обучаемости. Основное отличие заключается в том, что они фиксируют сам процесс обучения, а не разницу в результатах между первым и вторым тестированием, то есть не только результат обучения. Показатели процесса обучения и служат критериями обучаемости. В качестве критериев эти авторы используют помощь, необходимую учащимся в процессе выполнения заданий. Такие тесты обучаемости, по мнению Ю. Гутке и У. Волраба, позволяют прогнозировать успешность учебной деятельности (82, с. 154-155).
Оценка качества образования приобретает в последнее время все большую значимость. В связи с этим актуальными стали международные сравнительные исследования в области школьной успеваемости. Эти исследования дают возможность странам всесторонне оценить эффективность своих образовательных систем. Международные исследования проводятся под руководством организации IEA (Международная ассоциация по оценке школьной успеваемости). Исследования IEA строятся в определенной последовательности и базируются на объяснительных моделях, основанных на учебных программах. Предполагается обследование тысяч учащихся в каждой стране с помощью академических тестов, составляемых на основе школьных программ. Используемые тесты успеваемости направлены на измерение достижений учащихся, которые можно оценить в баллах, скорректировать и сравнить с аналогичными данными по стране, а также соотнести с другими факторами, влияющими на успеваемость. Цель такого исследования - создание достаточно гибкой модели, позволяющей измерить комплексное воздействие школы на процесс овладения знаниями. Исследование включает шесть этапов:
•разработка вопросов политики исследования;
•определение методологии и составление плана исследования;
•разработка инструментария;
•проведение выборки участников исследования;
•сбор и обработка данных;
•анализ результатов и составление отчета.
Информация после проведенного анализа составляет основу для разработки тестов, куда входят наиболее оптимальные задания, предлагаемые странами-участницами. Результаты исследования дают возможность всесторонне проанализировать функционирование системы на различных уровнях. Анализ также дает ответы на многие вопросы: насколько реализуемый вариант содержания образования совпадает с планируемым; соответствует ли понимание учителями планируемого содержания намерениям на уровне системы; изучаются все темы программы или некоторые опускаются.
Проблемами международного тестирования занимаются также Институт образования ЮНЕСКО (Гамбург) и Международный центр педагогических исследований (Париж).
Заметим, что Россия в этих исследованиях не участвует.
Данный обзор истории развития и становления тестирования за рубежом убеждает в широком разнообразии тестов по цели, форме и содержанию. Сам факт возникновения тестирования вызван непосредственным требованием жизни и преследовал одну общую цель - удовлетворить это требование. Любой тест так или иначе отражает целевую установку. Это основная черта почти всех западных тестологических исследований.