игра брюс 2048
Главная / Базы данных / Алгоритмы интеллектуальной обработки больших объемов данных / Тест 2

Алгоритмы интеллектуальной обработки больших объемов данных - тест 2

Упражнение 1:
Номер 1
N-мерное нормальное распределение имеет количество параметров порядка

Ответ:

 (1) ln(N) 

 (2)

 (3) N*ln(N) 

 (4) N^2 

 (5) N^3 


Номер 2
Дендрограмма формируется как результат работы:

Ответ:

 (1) Дивизимного кластерного анализа 

 (2) Метода Apriori 

 (3) Агломеративного кластерного анализа 

 (4) Численного прогнозирования 


Упражнение 2:
Номер 1
Суть алгоритма Expectation-Maximization:

Ответ:

 (1) Выбор вектора параметров для максимизации функции правдоподобия, соответствующей семейству параметрических моделей. 

 (2) Максимизация математического ожидания многомерного нормального распределения с неизвестными параметрами. 

 (3) Присваивание ожидаемых значений скрытым переменным на основании текущих оценок параметров и переоценка этих параметров с учетом обновленных ожидаемых значений. 

 (4) Вычисление математического ожидания максимума функции правдоподобия, построенной на входной выборке. 

 (5) Нет правильного ответа. 


Номер 2
Укажите недостатки DBSCAN (возможен выбор нескольких вариантов):

Ответ:

 (1) Не работает при разных плотностях кластеров; 

 (2) Не требует К; 

 (3) Не вполне детерминированный; 

 (4) Кластеры произвольной формы; 

 (5) Не учитывает выбросы; 


Упражнение 3:
Номер 1
На плоскости даны 8 точек с координатами A(1;1), B(2;2), C(2;4), D(3;3), E(4;2), F(4;4), G(5;5), H(6;6). Изначально центроиды находятся в точках (1;3), (6;4). Применив алгоритм 2-средних с евклидовой метрикой, определите точки, принадлежащие тому же кластеру, что и точка A, при достижении стационарного состояния.

Ответ:

 (1) Кроме A точек нет 

 (2) A, B 

 (3) A, B, C 

 (4) A, B, C, D 

 (5) A, B, C, D, E 

 (6) A, B, C, D, E, F 


Номер 2
При больших наборах данных MAP, какой из алгоритмов (мaximum likelihood, maximum a posteriori) будет эффективнее при условии нахождении глобальных максимумов?

Ответ:

 (1) мaximum likelihood эффективнее 

 (2) результаты обоих алгоритмов равнозначны 

 (3) оба алгоритма не эффективны 

 (4) maximum a posteriori эффективнее 


Упражнение 4:
Номер 1
Основная задача кластеризации:

Ответ:

 (1) Отыскать "скрытую структуру" данных. 

 (2) Разделить набор данных на предопределенные классы. 

 (3) Определить центр набора данных 

 (4) Упорядочивание объектов в статистически однородные группы 


Номер 2
Выберите составляющие шаги для агломеративного подхода в иерархической кластеризации?

Ответ:

 (1) начинается с ситуации, когда каждый объект отдельный - кластер 

 (2) на каждом шаге совмещаем два наиболее близких кластера 

 (3) на каждом шаге разделяем два , один из кластеров пополам 

 (4) останавливаемся, когда получаем требуемое количество или единственный кластер 

 (5) останавливаемся, когда получаем требуемое количество или N кластеров 


Упражнение 5:
Номер 1
Укажите этапы EM-алгоритма?

Ответ:

 (1) Evaluation 

 (2) Estimation 

 (3) Expectation 

 (4) Minimisation 

 (5) Maximisation 


Номер 2
Для использования алгоритмов иерархической кластеризации текста, какие подходы существуют для выбора "типичного" представителя - кластроида в каждом из кластеров ?

Ответ:

 (1) минимизируем сумму расстояний до других объектов к кластере 

 (2) минимизируем сумму квадратов расстояний до других объектов к кластере 

 (3) минимизируем сумму порядков расстояний до других объектов к кластере 

 (4) минимизируем максимальное расстояние до других объектов к кластере 


Упражнение 6:
Номер 1
Как называется данный граф?
files

Ответ:

 (1) Граф состояний 

 (2) Дендрограмма 

 (3) Гистограмма 

 (4) Древо кластеров 


Номер 2
Назовите причины использования алгоритмов кластеризации.

Ответ:

 (1) заниматься разметкой данных бывает достаточно дешево 

 (2) позволяет разбить данные без разметки данных 

 (3) позволяет увеличить значимое количество признаков 

 (4) позволяет отслеживать изменения данных во времени 


Упражнение 7:
Номер 1
Напишите название подхода иерархической кластеризации, при использовании которого перед началом кластеризации все объекты считаются отдельными кластерами, а затем, в ходе алгоритма, объединяются.

Ответ:

 Агломеративный 


Номер 2
Выберите алгоритмы которые решают задачи кластеризации

Ответ:

 (1) K-средних 

 (2) Деревья решений 

 (3) EM-алгоритм 

 (4) К-медиан 


Номер 3
Решение проблемы чувствительности функции расстояния к преобразованиям в данных

Ответ:

 (1) Преобразовать обучающую выборку так, чтобы оси совпадали с главными компонентами матрицы ковариации 

 (2) Преобразовать тестовую выборку так, чтобы оси не совпадали с главными компонентами матрицы ковариации 

 (3) Преобразовать обучающую выборку так, чтобы оси совпадали с второстепенными компонентами матрицы ковариации 

 (4) Преобразовать тестовую выборку так, чтобы оси не совпадали с второстепенными компонентами матрицы ковариации 




Главная / Базы данных / Алгоритмы интеллектуальной обработки больших объемов данных / Тест 2