Главная / Базы данных /
Алгоритмы интеллектуальной обработки больших объемов данных / Тест 2
Алгоритмы интеллектуальной обработки больших объемов данных - тест 2
Упражнение 1:
Номер 1
N-мерное нормальное распределение имеет количество параметров порядка
Ответ:
 (1) ln(N) 
 (2) N 
 (3) N*ln(N) 
 (4) N^2 
 (5) N^3 
Номер 2
Дендрограмма формируется как результат работы:
Ответ:
 (1) Дивизимного кластерного анализа 
 (2) Метода Apriori 
 (3) Агломеративного кластерного анализа 
 (4) Численного прогнозирования 
Упражнение 2:
Номер 1
Суть алгоритма Expectation-Maximization:
Ответ:
 (1) Выбор вектора параметров для максимизации функции правдоподобия, соответствующей семейству параметрических моделей. 
 (2) Максимизация математического ожидания многомерного нормального распределения с неизвестными параметрами. 
 (3) Присваивание ожидаемых значений скрытым переменным на основании текущих оценок параметров и переоценка этих параметров с учетом обновленных ожидаемых значений. 
 (4) Вычисление математического ожидания максимума функции правдоподобия, построенной на входной выборке. 
 (5) Нет правильного ответа. 
Номер 2
Укажите недостатки DBSCAN (возможен выбор нескольких вариантов):
Ответ:
 (1) Не работает при разных плотностях кластеров; 
 (2) Не требует К; 
 (3) Не вполне детерминированный; 
 (4) Кластеры произвольной формы; 
 (5) Не учитывает выбросы; 
Упражнение 3:
Номер 1
На плоскости даны 8 точек с координатами A(1;1), B(2;2), C(2;4), D(3;3), E(4;2), F(4;4), G(5;5), H(6;6). Изначально центроиды находятся в точках (1;3), (6;4). Применив алгоритм 2-средних с евклидовой метрикой, определите точки, принадлежащие тому же кластеру, что и точка A, при достижении стационарного состояния.
Ответ:
 (1) Кроме A точек нет 
 (2) A, B 
 (3) A, B, C 
 (4) A, B, C, D 
 (5) A, B, C, D, E 
 (6) A, B, C, D, E, F 
Номер 2
При больших наборах данных MAP, какой из алгоритмов (мaximum likelihood, maximum a posteriori) будет эффективнее при условии нахождении глобальных максимумов?
Ответ:
 (1) мaximum likelihood эффективнее 
 (2) результаты обоих алгоритмов равнозначны 
 (3) оба алгоритма не эффективны 
 (4) maximum a posteriori эффективнее 
Упражнение 4:
Номер 1
Основная задача кластеризации:
Ответ:
 (1) Отыскать "скрытую структуру" данных. 
 (2) Разделить набор данных на предопределенные классы. 
 (3) Определить центр набора данных 
 (4) Упорядочивание объектов в статистически однородные группы 
Номер 2
Выберите составляющие шаги для агломеративного подхода в иерархической кластеризации?
Ответ:
 (1) начинается с ситуации, когда каждый объект отдельный - кластер 
 (2) на каждом шаге совмещаем два наиболее близких кластера 
 (3) на каждом шаге разделяем два , один из кластеров пополам 
 (4) останавливаемся, когда получаем требуемое количество или единственный кластер 
 (5) останавливаемся, когда получаем требуемое количество или N кластеров 
Упражнение 5:
Номер 1
Укажите этапы EM-алгоритма?
Ответ:
 (1) Evaluation 
 (2) Estimation 
 (3) Expectation 
 (4) Minimisation 
 (5) Maximisation 
Номер 2
Для использования алгоритмов иерархической кластеризации текста, какие подходы существуют для выбора "типичного" представителя - кластроида в каждом из кластеров ?
Ответ:
 (1) минимизируем сумму расстояний до других объектов к кластере 
 (2) минимизируем сумму квадратов расстояний до других объектов к кластере 
 (3) минимизируем сумму порядков расстояний до других объектов к кластере 
 (4) минимизируем максимальное расстояние до других объектов к кластере 
Упражнение 6:
Номер 1
Как называется данный граф?
Ответ:
 (1) Граф состояний 
 (2) Дендрограмма 
 (3) Гистограмма 
 (4) Древо кластеров 
Номер 2
Назовите причины использования алгоритмов кластеризации.
Ответ:
 (1) заниматься разметкой данных бывает достаточно дешево 
 (2) позволяет разбить данные без разметки данных 
 (3) позволяет увеличить значимое количество признаков 
 (4) позволяет отслеживать изменения данных во времени 
Упражнение 7:
Номер 1
Напишите название подхода иерархической кластеризации, при использовании которого перед началом кластеризации все объекты считаются отдельными кластерами, а затем, в ходе алгоритма, объединяются.
Ответ:
 Агломеративный 
Номер 2
Выберите алгоритмы которые решают задачи кластеризации
Ответ:
 (1) K-средних 
 (2) Деревья решений 
 (3) EM-алгоритм 
 (4) К-медиан 
Номер 3
Решение проблемы чувствительности функции расстояния к преобразованиям в данных
Ответ:
 (1) Преобразовать обучающую выборку так, чтобы оси совпадали с главными компонентами матрицы ковариации 
 (2) Преобразовать тестовую выборку так, чтобы оси не совпадали с главными компонентами матрицы ковариации 
 (3) Преобразовать обучающую выборку так, чтобы оси совпадали с второстепенными компонентами матрицы ковариации 
 (4) Преобразовать тестовую выборку так, чтобы оси не совпадали с второстепенными компонентами матрицы ковариации