игра брюс 2048
Главная / Базы данных / Data Mining / Тест 18

Data Mining - тест 18

Упражнение 1:
Номер 1
Для какого вида набора данных важно определение наличия сезонной компоненты: 

Ответ:

 (1) для упорядоченных данных 

 (2) для неупорядоченных данных  

 (3) для тех и других 


Номер 2
Выберите неверную формулировку

Ответ:

 (1) все типы грязных данных в базе данных могут быть автоматически обнаружены и очищены  

 (2) появление некоторых грязных данных может быть предотвращено  

 (3) некоторые грязные данные непригодны для автоматического обнаружения и очистки 

 (4) появление некоторых грязных данных невозможно предотвратить 


Номер 3
Наличие дубликатов в наборе данных может быть: 

Ответ:

 (1) результатом ошибок при подготовке данных 

 (2) способом повышения значимости некоторых записей 

 (3) оба ответа верны 


Упражнение 2:
Номер 1
Если набор данных упорядочен и в нем присутствует сезонная или цикличная компонента, то каково минимальное количество данных, которое необходимо иметь для возможности анализа? 

Ответ:

 (1) данные за один сезон/цикл 

 (2) данные за половину сезона/цикла 

 (3) данные за два сезона/цикла 


Номер 2
Выберите верную(-ые) формулировку(-и).

Ответ:

 (1) все типы грязных данных в базе данных могут быть автоматически обнаружены и очищены 

 (2) появление некоторых грязных данных может быть предотвращено 

 (3) некоторые грязные данные непригодны для автоматического обнаружения и очистки 

 (4) появление некоторых грязных данных невозможно предотвратить 


Номер 3
При наличии дубликатов в наборе данных следует использовать такой вариант их обработки:

Ответ:

 (1) удалить всю группу записей, содержащую дубликаты 

 (2) заменить группу дубликатов на одну уникальную запись 

 (3) оба варианта можно использовать при обработке дубликатов 


Упражнение 3:
Номер 1
 Если набор данных не упорядочен, то количество данных, которое необходимо иметь для возможности анализа данных:

Ответ:

 (1) не имеет значения 

 (2) должно быть больше одного цикла 

 (3) желательно, чтобы количество записей в наборе данных было значительно больше количества переменных 


Номер 2
Все типы грязных данных в базе данных могут быть автоматически обнаружены и очищены

Ответ:

 (1) формулировка неверна 

 (2) формулировка верна 

 (3) в зависимости от метода очистки данных 


Номер 3
Ваши действия при обнаружении выбросов в наборе данных:

Ответ:

 (1) их следует сразу же исключить из дальнейшего анализа 

 (2) оценить степень их влияния на результаты дальнейшего анализа 

 (3) такой набор данных вообще не поддается анализу 


Упражнение 4:
Номер 1
Какой из перечисленных этапов является первым в процессе Data Mining? 

Ответ:

 (1) анализ предметной области 

 (2) подготовка данных 

 (3) построение модели 


Номер 2
Если данные являются неупорядоченными, это означает …

Ответ:

 (1) невозможность процесса Data Mining 

 (2) возможность процесса Data Mining 

 (3) необходимость их упорядочения перед проведением анализа 


Номер 3
Качество данных – это критерий, определяющий такие качества данных как: 

Ответ:

 (1) полноту 

 (2) точность 

 (3) своевременность 

 (4) возможность их интерпретации 

 (5) все варианты верны 


Упражнение 5:
Номер 1
 Постановка задачи …

Ответ:

 (1) является необходимым этапом процесса Data Mining 

 (2) является необязательным этапом процесса Data Mining 

 (3) не является этапом процесса Data Mining 


Номер 2
Репрезентативность выборки означает, что …

Ответ:

 (1) выборка должна представлять как можно больше возможных ситуаций 

 (2) выборка должна включать более ста записей 

 (3) число записей выборки должно соответствовать числу переменных 


Номер 3
Существуют такие типы грязных данных:

Ответ:

 (1) данные, которые могут быть автоматически обнаружены и очищены 

 (2) данные, которые не могут быть автоматически обнаружены и очищены 

 (3) данные, появление которых можно было предотвратить 

 (4) данные, появление которых невозможно было предотвратить 




Главная / Базы данных / Data Mining / Тест 18