Есть необходимость протестировать заливку данных (45000 строк). Чтобы покрыть 100% необходимо сравнить сурс файл с экспортированным отчетом с сайта. Если обе таблицы одинаковы - профит.
Что значит одинаковы?
- Если в одном файле в полях появились концевые пробелы — это значимое отличие?
- Если разные окончания строк — это отличие?
- Важен ли формат строк, чисел, дат? ("тест" и "Тест" — это одно и тоже? А 4 и 4.0? А 22.12.2018 и 22/12/208?)
Что вам важно будет знать, если файлы вдруг неодинаковы:
- Строки, которые отличаются и дальше уже выверка глазами вручную?
- Конкретные расхождения в данных (в каком поле, как именно отличаются?)
Ну и 45 тыс. для 12 млн — это нерепрезентативная выборка для сравнения и тестирования миграции данных