Система тестов
Рассмотрим описание тестовых данных, необходимых для оценки работоспособности и качества программ учащихся.
Первый тест должен быть максимально прост, так как его цель – проверить, работает ли программа вообще. Вполне допустимо в качестве первого теста использовать тест из условия задачи. Именно с помощью такого теста преподаватель сможет определить – верно ли понято учащимися условие задачи, соответствует ли программа описанным в условии форматам входных и выходных данных и правильно ли в ней названы входной и выходной файлы (если в условии задачи предполагается, что ввод и/или вывод осуществляется через файл). Если это не так, то при автоматической проверке учащемуся будет указан следующий вид ошибки: нарушение формата представления входных данных (Presentation Error).
Вторая группа тестов должна отслеживать так называемые вырожденные случаи. То есть случаи, когда решение задачи или не существует (тогда в условии задачи должно быть оговорено, что именно должна сообщать программа в такой ситуации), или коренным образом отличается от основного алгоритма решения. В первую очередь к данной группе относятся нулевые примеры. Для числовых данных это обычно нулевые значения (конечно, если по условию задачи ноль является допустимым значением для той или иной переменной), а для текстовых – это пустой входной файл, а также последовательность из пробелов и/или символов перевода строки. Другой пример вырожденности – нарушение общности входных данных , требующее специальной их обработки. Так, если в учебной задаче требуется решить уравнение для любых действительных значений a,b,c, то при а=0 квадратное уравнение в общем случае становится линейным, что программа учащегося несомненно должна учитывать. Причем только в этом случае существенным становится равенство нулю значения параметра b. Таким образом , для проверки данной задачи необходимы следующие тесты на «вырожденность»:
Если же в задаче входными параметрами являются координаты N точек на плоскости, а требуется, например, найти такую точку на той же плосткости, расстояние от которой до наиболее удаленной из N точек минимально, то, очевидно, , что при решении задачи случаи N=1 и N=2 следует рассматривать отдельно.
Следующая группа тестов должна проверять граничные случаи (входные и выходные данные принимают граничные значения). Основное назначение подобных тестов – обнаружить возможные программистские ошибки, которые могли быть сделаны учащимися при реализации в том числе и правильного алгоритма. прежде всего в данном случае следует проверить, что при написании программы для переменных были выбраны подходящие типы данных. Так, как если программа вычисляет суммы целых чисел, каждое из которых по модулю не превосходит 32 767, то есть для представления таких чисел можно использовать двухбайтовый знаковый тип данных (integer), то для вычисления результата такого типа уже явно недостаточно. Причем может даже оказаться, что получение точного результата возможно с помощью так называемой «длинной арифметики» – организации выполнения арифметических действий с помощью массивов, что существенно меняет сложность решения.
В задачах при решении которых используются численные методы, к граничным можно отнести тестовые данные, для обработки которых требуется максимальная точность вычислений, в частности, большие или очень маленькие, но отличные от нуля значения для входных параметров.
Часто критичным для программы является количество оперативной памяти, которое используется во время ее выполнения. Если все переменные располагаются в статической памяти, то наиболее распространенная ошибка при программировании – выход за границу массива данных во время выполнения программы, причем появиться эта ошибка может зачастую лишь на входных данных максимального объема. Если же максимально допустимое количество данных по условию задачи таково, что программист должен использовать динамическую память, то обязательно должны присутствовать тесты, проверяющие программу на корректность работы с ними. Так, начинающий программист может неправильно выделять необходимую оперативную память во время работы программы и/или неаккуратно к ней обращаться. Также память в программе может использоваться неэффективно. В этом случае возможно подобрать тест, на котором программа учащегося работать не будет как раз в силу недостатка динамической памяти, хотя эталонная программа в подобных условиях функционирует нормально.
При работе со строками программа учащегося часто не может обрабатывать корректные с точки зрения условия задачи строки текста, длина которых превышает 255 символов. Это связано с особенностями используемого языка программирования или применением массива символов фиксированной длины вместо одной, двух переменных.
Если по условию задачи требуется обработать файл, состоящий из заранее неизвестного количества чисел или строк, то для многих программ критичным оказывается наличие пробелов после последнего числа и пустых строк в конце файла. Иногда при тестировании подобная небрежность в программировании намеренно прощается, тогда при подготовке текстов приходится следить, чтобы признак конца файла располагался непосредственно за последним значащим символом входных данных, причем обязательно в той же самой строке.
В следующую группу можно объединить тесты, проверяющие правильность алгоритма решения задачи в целом. Они делятся на общие тесты и тесты специального вида. Последние должны проверить работоспособность программы в случае специальной организации входных данных. Например, входные данные могут быть отсортированы сначала в порядке возрастания, а затем в порядке убывания, хотя по условию определенный порядок над ними не предполагается, однако алгоритм решения может использовать сортировку входных величин. Или значения всех параметров можно сделать равными между собой. Помимо выявления специфики работы программ на таких тестах, они хороши тем, что зачастую позволяют проверяющему определить правильность выходных данных «вручную». Это уменьшает объем работы при проверке компьютерных результатов.
Общие тесты должны проверить все ветви логической схемы алгоритма, такая проверка называется испытанием ветвей. Однако если алгоритм решения задачи никак не зависит от особенностей входных данных, то есть логическое ветвление как таковое в алгоритме отсутствует, то в таком случае можно ограничиться одним-двумя общими тестами. Если же в программе или ее части подразумеваются два и более исходов, то каждый из возможных путей работы программы желательно проверить. К этой группе тестов относятся невырожденные примеры входных данных, для которых программа должна определять, что решение в задаче отсутствует, если подобная возможность оговорена в условии.
Если решение задачи может привести к ошибочному применению эвристических алгоритмов, то необходимо подобрать такие наборы тестовых данных, на которых такие приближенные решения будут работать неверно. Иногда для этого приходится рассматривать или даже реализовывать несколько различных эвристических подходов к решению задачи, подбирая для опровержения каждого из них свой собственный тест. Гораздо сложнее подобрать тестовый пример для случая, когда задача решается с помощью «перебора с предпочтением» и самостоятельно заканчивает свою работу, если время работы приближается к максимально допустимому. В этом случае говорят, что программа написана с отсечением во времени. Если перебор организован грамотно, то подобная программа зачастую быстро находит нужный вариант, а в дальнейшем незаконченным перебором лишь пытается доказать, что найденный вариант действительно лучший. К счастью, подобные проблемы возникают в основном при тестировании олимпиадных задач, для которых описанный прием решения считается приемлимым.
Если прогон программы на предыдущих группах тестов показал ее правильность в целом, то тогда следует приступить к проверке эффективности используемых алгоритмов. Данное качество является наиболее уязвимым как в учебных программах, так и в решении олимпиадных задач по информатике. Упрощая для себя решение задачи или ее реализацию, учащиеся неоправданно увеличивают вычислительную сложность алгоритма, зачастую делая его непригодным для работы над большими, однако допустимыми по условию входными данными. Осознать данный факт самостоятельно они при этом не всегда могут. Соответственно возрастает значимость подобного рода тестирования.
Последнюю группу составляют так называемые случайные тесты. Такие тесты должны отражать реальные в полном объеме входные данные. Генерация входных данных для такой группы тестов (часто достаточно одного-двух тестов) не представляет труда. Однако проверка правильности работы программы учащегося сложна именно на таких тестах. Объясняется это тем, что в данном случае трудно проверить «вручную» результаты работы программы. Зачастую для этого необходимо написать специальную программу, по сложности не уступающую решению исходной задачи. Особенно это характерно для «большого случайного теста», которым завершается тестирование программы.
Yandex.RTB R-A-252273-3
- Единицы инф-ции.
- Понятие “Информатика”
- 39 Методы обучения информатике.
- Информатика в младших классах
- I. Информатика (1-6 классы) а.В. Горячев, а.С. Лесневский.
- Цели и задачи курса
- Организация учебно-воспитательного процесса и состав учебно-методического материала по курсу
- III. Информатика 1 – 4 класс . В. Буцик.
- Содержание обучения ( 1 – 4 класс)
- Олимпиады по информатике
- Принципы проверки учебных и олимпиадных задач по информатике
- Система тестов
- Мпи как новый раздел педагогики.