Главная / Базы данных /
Data Mining / Тест 14
Data Mining - тест 14
Упражнение 1:
Номер 1
При использовании какого метода необходимо задавать количество кластеров?
Ответ:
 (1) метод k-средних  
 (2) метод ближнего соседа  
 (3) вся группа иерархических методов  
 (4) все ответы неверны  
Номер 2
К какой группе методов относится метод ближнего соседа?
Ответ:
 (1) иерархический КА  
 (2) быстрый КА  
 (3) оба ответа неверны  
Номер 3
Процесс последовательного укрупнения кластеров лежит в основе работы...
Ответ:
 (1) иерархического КА 
 (2) быстрого 
 (3) всех методов 
Номер 4
Основные меры расстояния между объектами при использовании иерархического метода КА:
Ответ:
 (1) евклидово расстояние 
 (2) квадрат евклидова расстояния 
 (3) манхэттенское расстояние 
 (4) расстояние Чебышева 
Упражнение 2:
Номер 1
Какой метод требует априорной информации о количестве кластеров?
Ответ:
 (1) метод k-средних 
 (2) метод ближнего соседа 
 (3) вся группа иерархических методов 
 (4) все ответы неверны 
Номер 2
К какой группе методов относится метод k-средних?
Ответ:
 (1) иерархический 
 (2) быстрый 
 (3) оба ответа неверны 
Номер 3
Пересчет кластерных центров и перераспределение объектов между кластерными центрами – это шаги...
Ответ:
 (1) иерархического 
 (2) быстрого 
 (3) всех методов 
Номер 4
Перед началом кластеризации все объекты считаются отдельными кластерами, которые в ходе алгоритма объединяются. Это характеристика...
Ответ:
 (1) иерархического 
 (2) быстрого 
 (3) всех методов 
Упражнение 3:
Номер 1
Какой метод рекомендуется использовать при небольших объемах выборки?
Ответ:
 (1) метод k–средних 
 (2) метод ближнего соседа 
 (3) вся группа иерархических методов 
 (4) все ответы неверны 
Номер 2
К какой группе методов относится алгоритм PAM (partitioning around Medoids)?
Ответ:
 (1) иерархический КА 
 (2) КА, основанный на разделении данных 
 (3) оба ответа неверны 
Номер 3
Чувствительность к выбросам – это недостаток...
Ответ:
 (1) иерархического КА 
 (2) быстрого КА 
 (3) всех методов КА 
Номер 4
Дендрограмма – результат работы …
Ответ:
 (1) дивизимного кластерного анализа 
 (2) быстрого кластерного анализа 
 (3) агломеративного кластерного анализа 
Упражнение 4:
Номер 1
Назовите достоинства алгоритма кластеризации k-средних
Ответ:
 (1) простота использования 
 (2) быстрота использования 
 (3) понятность и прозрачность алгоритма 
 (4) нечувствительность к выбросам 
Номер 2
Какие методы выявляют более высокую устойчивость по отношению к шумам и выбросам, некорректному выбору метрики, включению незначимых переменных в набор, участвующий в кластеризации?
Ответ:
 (1) неиерархические методы 
 (2) иерархические методы 
 (3) оба ответа верны 
Номер 3
Какие методы отказываются от определения числа кластеров, а строят полное дерево вложенных кластеров?
Ответ:
 (1) иерархические методы 
 (2) неиерархические методы 
 (3) самоорганизующиеся карты 
Упражнение 5:
Номер 1
Назовите недостатки алгоритма быстрой кластеризации
Ответ:
 (1) сложность использования 
 (2) чувствительность к выбросам 
 (3) алгоритм может медленно работать на больших базах данных 
 (4) все ответы верны 
Номер 2
Назовите сложности иерархических методов кластеризации:
Ответ:
 (1) ограничение объема набора данных 
 (2) выбор меры близости 
 (3) негибкость полученных классификаций 
 (4) наличие предположений относительно числа кластеров. 
Номер 3
Преимуществом какой группы методов кластеризации является их наглядность и возможность получить детальное представление о структуре данных
Ответ:
 (1) иерархические методы 
 (2) неиерархические методы 
 (3) оба варианта верны