Тестовые данные
#1
Отправлено 25 января 2012 - 12:09
Хотел бы узнать, существуют ли готовые тестовые наборы подобных данных типа набор изображений, набор документов и т.п. или все делают такие наборы самостоятельно?
#2
Отправлено 25 января 2012 - 13:32
Добрый день. Для многих тестов, как ручных, так и автоматических часто нужен специфический контент. По созданию тестовых наборов текстовых данных типа email, логины, пароли и т.п. проблем обычно не возникает. Но вот при работе с файлами есть очень много нюансов. Например везде, где есть работа с изображениями надо тестировать разные форматы, размер, разрешение, соотношение сторон, иногда даже цветовые параметры.
Хотел бы узнать, существуют ли готовые тестовые наборы подобных данных типа набор изображений, набор документов и т.п. или все делают такие наборы самостоятельно?
Добрый день!
Для получения различных графических файлов вы можете снимать скриншоты рабочего стола. Если лень делать это в ручную, то можно воспользоваться вот таким скриптом, который написан на powershell (его только надо допилить для того чтобы делать скриншоты разного размера)
[void][Reflection.Assembly]::LoadWithPartialName("System.Windows.Forms") $size = [Windows.Forms.SystemInformation]::VirtualScreen $bitmap = new-object Drawing.Bitmap 500, 500 $size.Width = 500 $size.Height = 500 $graphics = [Drawing.Graphics]::FromImage($bitmap) $graphics.CopyFromScreen(500,500,0,0, $size.Size) $graphics.Dispose() $bitmap.Save(".\screenshort.png") $bitmap.Dispose()
Исходный скрипт взят тут
#3
Отправлено 25 января 2012 - 13:36
#4
Отправлено 10 мая 2012 - 19:59
То же и с изображениями, надо спросить какие настройки сканирования у заказчика, сделать изображения с его настройками, сделать изображения с другими (найти оптимальные, если есть желание), провести тесты и предложить свои рекомендации.
Подготовка тестовых данных - сложная задача. А результат - бесценен. Единожды подготовленная база согласованных данных на пару десятков гигабайт долгое время будет служить мерилом производительности, совместимости, конвертации, ...
Интересная история была с тестовыми данными. Тексты генеририровались на основе случайной выборки из орфографического словаря (hunspell). И при демонстрации работы системы с тестовыми данными проявились не очень приятные слова (но вполне литературные, из словаря же), например, "тошнота". Ничего страшного, но просто попались документы, в названиях которых были слова про тошноту, фашистов, и так далее, в причудливых комбинациях. Поэтому, для тестовых текстов не только размер, но и содержание имеют большое значение. Надо подбирать обезличенные тексты, обезличенных польователей. Генерировать случайные данные - плохо, создавать на основе реальных и повторяющихся - нельзя.
По поводу изображений. Если нужны полноцветные изображения без текста, то давайте напишем программу генерирующие разноцветные фракталы. Вспомним математику. Наличие такой программы ценее самых файлов. Вот есть у меня на рабочей машине 80 Гб документов, рассортированных так, что точно известно процентное содержание определённых слов в каждом из них. Нужны они мне для проверки релевантности полнотекстового поиска. Поиск этот проверять надо редко. И хранить 80 Гб файлов постоянно - не хочется, всё собираюсь удалить их. Их повторная генерация займёт 2-3 ночи. Вот как место кончится, удалю, ведь есть инструмент для создания файлов.
#5
Отправлено 11 мая 2012 - 09:33
Сообщение отредактировал bncom: 11 мая 2012 - 09:34
Количество пользователей, читающих эту тему: 1
0 пользователей, 1 гостей, 0 анонимных