Если кому вдруг будет интересно или актуально поделюсь опытом решения проблемы с тестированием описанной выше системы:
для проверки самих юниверсов, о которых шла речь, был разработан скрипт на perl (в принципе на питоне аналог тоже написали, но он медленнее работает из-за меньшей скорости обработки текстовых данных). Скрипт обращается к веб сервису (через REST API), с которого можно получить данные юниверса, а так же данные из базы, прошедшие "обработку" юниверсом. Далее скрипт генерит набор необходимых SQL напрямую к базе данных и получает аналогичные данные. Затем сравнивает то, что получили из базы, с тем, что выдал юниверс. Собственно, это то, что и было нужно.
А т.к. репорты оказалось возможным просматривать через веб, то их решили тестировать с помощью selenium.