Главная / Базы данных /
Data Mining / Тест 18
Data Mining - тест 18
Упражнение 1:
Номер 1
Для какого вида набора данных важно определение наличия сезонной компоненты:
Ответ:
 (1) для упорядоченных данных 
 (2) для неупорядоченных данных  
 (3) для тех и других 
Номер 2
Выберите неверную формулировку
Ответ:
 (1) все типы грязных данных в базе данных могут быть автоматически обнаружены и очищены  
 (2) появление некоторых грязных данных может быть предотвращено  
 (3) некоторые грязные данные непригодны для автоматического обнаружения и очистки 
 (4) появление некоторых грязных данных невозможно предотвратить 
Номер 3
Наличие дубликатов в наборе данных может быть:
Ответ:
 (1) результатом ошибок при подготовке данных 
 (2) способом повышения значимости некоторых записей 
 (3) оба ответа верны 
Упражнение 2:
Номер 1
Если набор данных упорядочен и в нем присутствует сезонная или цикличная компонента, то каково минимальное количество данных, которое необходимо иметь для возможности анализа?
Ответ:
 (1) данные за один сезон/цикл 
 (2) данные за половину сезона/цикла 
 (3) данные за два сезона/цикла 
Номер 2
Выберите верную(-ые) формулировку(-и).
Ответ:
 (1) все типы грязных данных в базе данных могут быть автоматически обнаружены и очищены 
 (2) появление некоторых грязных данных может быть предотвращено 
 (3) некоторые грязные данные непригодны для автоматического обнаружения и очистки 
 (4) появление некоторых грязных данных невозможно предотвратить 
Номер 3
При наличии дубликатов в наборе данных следует использовать такой вариант их обработки:
Ответ:
 (1) удалить всю группу записей, содержащую дубликаты 
 (2) заменить группу дубликатов на одну уникальную запись 
 (3) оба варианта можно использовать при обработке дубликатов 
Упражнение 3:
Номер 1
Если набор данных не упорядочен, то количество данных, которое необходимо иметь для возможности анализа данных:
Ответ:
 (1) не имеет значения 
 (2) должно быть больше одного цикла 
 (3) желательно, чтобы количество записей в наборе данных было значительно больше количества переменных 
Номер 2
Все типы грязных данных в базе данных могут быть автоматически обнаружены и очищены
Ответ:
 (1) формулировка неверна 
 (2) формулировка верна 
 (3) в зависимости от метода очистки данных 
Номер 3
Ваши действия при обнаружении выбросов в наборе данных:
Ответ:
 (1) их следует сразу же исключить из дальнейшего анализа 
 (2) оценить степень их влияния на результаты дальнейшего анализа 
 (3) такой набор данных вообще не поддается анализу 
Упражнение 4:
Номер 1
Какой из перечисленных этапов является первым в процессе Data Mining?
Ответ:
 (1) анализ предметной области 
 (2) подготовка данных 
 (3) построение модели 
Номер 2
Если данные являются неупорядоченными, это означает …
Ответ:
 (1) невозможность процесса Data Mining 
 (2) возможность процесса Data Mining 
 (3) необходимость их упорядочения перед проведением анализа 
Номер 3
Качество данных – это критерий, определяющий такие качества данных как:
Ответ:
 (1) полноту 
 (2) точность 
 (3) своевременность 
 (4) возможность их интерпретации 
 (5) все варианты верны 
Упражнение 5:
Номер 1
Постановка задачи …
Ответ:
 (1) является необходимым этапом процесса Data Mining 
 (2) является необязательным этапом процесса Data Mining 
 (3) не является этапом процесса Data Mining 
Номер 2
Репрезентативность выборки означает, что …
Ответ:
 (1) выборка должна представлять как можно больше возможных ситуаций 
 (2) выборка должна включать более ста записей 
 (3) число записей выборки должно соответствовать числу переменных 
Номер 3
Существуют такие типы грязных данных:
Ответ:
 (1) данные, которые могут быть автоматически обнаружены и очищены 
 (2) данные, которые не могут быть автоматически обнаружены и очищены 
 (3) данные, появление которых можно было предотвратить 
 (4) данные, появление которых невозможно было предотвратить