Я тоже посоветую начать с тест-дизайна и взять за основу тестирование, которое проверяет, что все заявленные требования работают.
Что я имею в виду... Не надо пока что распыляться и проверять всё подряд: все граничные значения, разбиение на классы эквивалентности, стресс-тестинг и так далее.
В первую очередь функционал должен работать без всяких там негативных тестов, ведь если, например, калькулятор должен умножать, то не нужно бросаться и проверять что станет, если туда вбить отрицательные или какие-нибудь бесконечные значения чисел. Просто проверьте, что калькулятор вообще умножает цифры, двух-трех-четырех-пятизначные числа и убедитесь, что всё работает как надо. Ведь если вы проверите умножение двух-трехзначных чисел и умножение отрицательных, а калькулятор сломается на умножении четырехзначного числа, то это полный фэйл. 90% пользователей будет умножать одно и тоже, и только 10% пользователей будут извращаться и умножать -9999 на 0.
В общем, так как вы один и не сможете объять необъятное, проверяйте общий workflow, чтобы всё работало для обычного юзера, а все остальные ситуации, которые случаются в 1% случаев, оставляйте на потом.