Просмотр новых публикаций

Документация для проектов с data science, ML и о наболевшем...

Автор abrr, 06 июн 2019 08:30

#data science #documents #ML #DS

Авторизуйтесь для ответа в теме

Сообщений в теме: 11

#1 abrr

Новый участник

Members
6 сообщений

ФИО:Василий

Отправлено 06 июня 2019 - 08:30

Доброго времени суток! Мой вопрос, в большей степени, ориентирован на QA, который работают или работали на проектах с data science и ML.

1.От заказчика прилетает big data/data set. Разработчики обрабатывают эти данные и полученное выдают в тестирование. Как тестировщику понять что на этих данных можно обучать модель?

2.А/В тестами мы проверяем наши модели. Есть ли ещё способы тестирования моделей?(не white box)

3.Какая документация тестирования должна быть на проектах с DS и ML?

0

Наверх

#2 Spock

Профессионал

Members
1 772 сообщений

ФИО:Роман

Отправлено 06 июня 2019 - 08:34

звучит прямо как вопрос с собеседования

0

Наверх

#3 abrr

Новый участник

Members
6 сообщений

ФИО:Василий

Отправлено 06 июня 2019 - 08:49

звучит прямо как вопрос с собеседования

Кстати да) но это случайность) просто рассчитываю на развёрнутые ответы

0

Наверх

#4 Spock

Профессионал

Members
1 772 сообщений

ФИО:Роман

Отправлено 06 июня 2019 - 08:57

Кстати да) но это случайность) просто рассчитываю на развёрнутые ответы

и кто такие вопросы задал если это не собеседование?

0

Наверх

#5 abrr

Новый участник

Members
6 сообщений

ФИО:Василий

Отправлено 06 июня 2019 - 09:06

Кстати да) но это случайность) просто рассчитываю на развёрнутые ответы

и кто такие вопросы задал если это не собеседование?

в компании где я работаю, проекты с ds и ml появились недавно. я являюсь лидом на этих проектах. вот так и появились вопросы, т.к. хочу выстроить процессы и сделать всё по уму

0

Наверх

#6 Spock

Профессионал

Members
1 772 сообщений

ФИО:Роман

Отправлено 06 июня 2019 - 09:17

в компании где я работаю, проекты с ds и ml появились недавно. я являюсь лидом на этих проектах. вот так и появились вопросы, т.к. хочу выстроить процессы и сделать всё по уму

ну и что Вы уже выяснили как лид?

0

Наверх

#7 Little_CJIOH

Профессионал

Members
1 515 сообщений

ФИО:Власкин Павел
Город:Санкт-Петербург

Отправлено 06 июня 2019 - 09:20

Испытывайте модель на тестовом датасете, который не входит в обучающий датасет. Придумайте метрику измеряющую качество и замеряйте ее для модели.
В одной из команд с которой я работал была практика что результат новой модели не должен отличаться от результата старой более чем на 2%. Банально чтобы у заказчика не возникало вопросов.

0

Наверх

#8 abrr

Новый участник

Members
6 сообщений

ФИО:Василий

Отправлено 06 июня 2019 - 09:38

Испытывайте модель на тестовом датасете, который не входит в обучающий датасет. Придумайте метрику измеряющую качество и замеряйте ее для модели.
В одной из команд с которой я работал была практика что результат новой модели не должен отличаться от результата старой более чем на 2%. Банально чтобы у заказчика не возникало вопросов.

с датасетом так и делаем.

Метрика качества, вот тут есть вопрос. Если например говорить о распознавании текста с картинки, то тут метрика точность распознавания. сколько символов распознали верно, сколько не распознали совсем и сколько неверно. что в это случае будет качеством?

0

Наверх

#9 Little_CJIOH

Профессионал

Members
1 515 сообщений

ФИО:Власкин Павел
Город:Санкт-Петербург

Отправлено 06 июня 2019 - 11:21

Если говорить о качестве распознавания, то f1 score достаточно хороша была. Если конкретно по распознаванию символов текста, то можно кроме общей считать по шрифтам и по отдельным символам.

0

Наверх

#10 abrr

Новый участник

Members
6 сообщений

ФИО:Василий

Отправлено 06 июня 2019 - 12:08

Если говорить о качестве распознавания, то f1 score достаточно хороша была. Если конкретно по распознаванию символов текста, то можно кроме общей считать по шрифтам и по отдельным символам.

ок. спасибо. А какая документация тестирования была у вас на проекте?

0

Наверх

#11 Little_CJIOH

Профессионал

Members
1 515 сообщений

ФИО:Власкин Павел
Город:Санкт-Петербург

Отправлено 06 июня 2019 - 12:10

Если говорить о качестве распознавания, то f1 score достаточно хороша была. Если конкретно по распознаванию символов текста, то можно кроме общей считать по шрифтам и по отдельным символам.

ок. спасибо. А какая документация тестирования была у вас на проекте?

был тест-план писаный для заказчика. нужды в другой документации не было.

0

Наверх

#12 abrr

Новый участник

Members
6 сообщений

ФИО:Василий

Отправлено 06 июня 2019 - 12:26

Если говорить о качестве распознавания, то f1 score достаточно хороша была. Если конкретно по распознаванию символов текста, то можно кроме общей считать по шрифтам и по отдельным символам.

ок. спасибо. А какая документация тестирования была у вас на проекте?

был тест-план писаный для заказчика. нужды в другой документации не было.

Спасибо!

0

Наверх

Обратно в Управление тестированием

Количество пользователей, читающих эту тему: 0

0 пользователей, 0 гостей, 0 анонимных

Реклама на портале

Документация для проектов с data science, ML и о наболевшем...

Количество пользователей, читающих эту тему: 0

Войти