Главная / Базы данных /
Интеллектуальный анализ данных средствами MS SQL Server 2008 / Тест 16
Интеллектуальный анализ данных средствами MS SQL Server 2008 - тест 16
Упражнение 1:
Номер 1
Выберите корректное утверждение относительно упрощенного алгоритма Байеса:
Ответ:
 (1) предполагается, что все входные атрибуты взаимосвязаны 
 (2) предполагается, что все входные атрибуты взаимно независимы 
 (3) никаких предположений относительно степени взаимной зависимости входных атрибутов не делается 
Номер 2
Выберите наиболее корректное продолжение фразы: "При использовании алгоритма Microsoft Naive Bayes числовые входные параметры…"
Ответ:
 (1) могут быть только непрерывными 
 (2) могут быть только дискретными 
 (3) могут быть только дискретными или дискретизированными 
 (4) могут быть дискретными, дискретизированными или непрерывными 
Номер 3
Среди представленных в списке алгоритмов интеллектуального анализа выберите наиболее быстрый (требующий наименьшего количества вычислений):
Ответ:
 (1) Microsoft Clustering 
 (2) Microsoft Naive Bayes 
 (3) Microsoft Neural Network 
Упражнение 2:
Номер 1
Выходной числовой параметр алгоритма Microsoft Decision Trees, может быть …:
Ответ:
 (1) только непрерывным 
 (2) только дискретным (или дискретизированным) 
 (3) как непрерывным, так и дискретным (или дисретизированным) 
Номер 2
Деревья решений позволяют решать задачи (отметьте все подходящие варианты):
Ответ:
 (1) классификации 
 (2) кластеризации 
 (3) регрессии 
 (4) поиска взаимосвязей 
Номер 3
Явление, заключающееся в том, что модель отлично классифицирует данные из обучающего набора, но имеет невысокую точность прогнозирования для новых данных, принято называть:
Ответ:
 (1) переобучение 
 (2) недостаточное обучение 
 (3) избыточность 
 (4) зацикленность 
Упражнение 3:
Номер 1
Выберите наиболее точное утверждение относительно алгоритма Microsoft Linear Regression в SQL Server 2008 (2008 R2):
Ответ:
 (1) Microsoft Linear Regression ( это алгоритм с полностью самостоятельной реализацией 
 (2) выбор Microsoft Linear Regression приводит к вызову алгоритма Microsoft Decision Trees c особыми параметрами 
 (3) выбор Microsoft Linear Regression приводит к вызову алгоритма Microsoft Logistic Regression c особыми параметрами 
 (4) выбор Microsoft Linear Regression приводит к вызову алгоритма Microsoft Neural Networks c особыми параметрами 
Номер 2
В алгоритмах регрессии "регрессором" называется:
Ответ:
 (1) независимая переменная (аргумент) 
 (2) зависимая переменная 
 (3) выявленная алгоритмом зависимость 
Номер 3
При анализе временных рядов, как правило, предполагается, что предсказываемый атрибут:
Ответ:
 (1) текстовый 
 (2) числовой непрерывный 
 (3) числовой дискретный 
Упражнение 4:
Номер 1
В приведенном списке отметьте два основных формата представления временных рядов, применяемых в ходе интеллектуального анализа данных:
Ответ:
 (1) столбчатый 
 (2) чередующийся 
 (3) непрерывный 
 (4) перекрестный 
Номер 2
Выберите наиболее корректное продолжение фразы "Реализация алгоритма ARIMA добавлена в алгоритм Microsoft Time Series, чтобы улучшить…":
Ответ:
 (1) точность прогноза ближайших членов ряда 
 (2) точность долгосрочного прогноза 
 (3) точность прогноза при наличии трендов 
 (4) точность прогноза при наличии периодичности 
Номер 3
В Microsoft SQL Server 2008 учет перекрестного влияния временных рядов производится алгоритмом Microsoft Time Series в случае использования (отметьте все подходящие варианты):
Ответ:
 (1) алгоритма ARTxp 
 (2) алгоритма ARIMA 
 (3) алгоритма c-means (к-средних) 
Упражнение 5:
Номер 1
В SQL Server 2008 алгоритм Microsoft Clustering содержит реализацию двух алгоритмов кластеризации:
Ответ:
 (1) к-средних (c-means) 
 (2) "нечеткий" алгоритм к-средних (Fuzzy с-means) 
 (3) дерево авторегрессии с перекрестным прогнозированием (ARTxp) 
 (4) алгоритм максимизации ожиданий (Expectation Maximization) 
Номер 2
Алгоритм "к-средних" (c-means) относится к алгоритмам …
Ответ:
 (1) классификации 
 (2) "жесткой" кластеризации 
 (3) "мягкой" кластеризации 
 (4) поиска взаимосвязей 
Номер 3
По умолчанию алгоритм Microsoft Clustering использует:
Ответ:
 (1) масштабируемую версию алгоритма максимизации ожидания 
 (2) немасштабируемую версию алгоритма максимизации ожидания 
 (3) масштабируемую версию алгоритма к-средних 
 (4) немасштабируемую версию алгоритма к-средних 
Упражнение 6:
Номер 1
Термин "жесткая кластеризация" означает что:
Ответ:
 (1) каждый вариант будет отнесен только к одному кластеру 
 (2) каждый вариант будет отнесен к одному или нескольким кластерам с разными вероятностями 
 (3) каждый кластер будет содержать ровно один вариант 
Номер 2
При использовании масштабируемого алгоритма максимизации ожидания на больших объемах данных, в SQL Server 2008 по умолчанию сначала анализируется:
Ответ:
 (1) 1 000 вариантов (записей) 
 (2) 5 000 вариантов (записей) 
 (3) 10 000 вариантов (записей) 
 (4) 50 000 вариантов (записей) 
 (5) 100 000 вариантов (записей) 
Номер 3
В алгоритме Apriori и основанном на нем алгоритме Microsoft Association Rules для измерения популярности набора элементов используется показатель поддержка (англ support) Поддержка набора элементов {A,B}
это:
Ответ:
 (1) число транзакций, которые содержат или A, или B, или их вместе 
 (2) число транзакций, которые содержат как A, так и B 
 (3) сумма числа транзакций, содержащих A, и числа транзакций, содержащих B 
 (4) произведение числа транзакций, содержащих A, и числа транзакций, содержащих B 
Упражнение 7:
Номер 1
В алгоритме Apriori и основанном на нем алгоритме Microsoft Association Rules, чтобы оценить взаимную зависимость двух элементов используется показатель importance (важность) Importance({A,B})=1
означает что (выберите наиболее точный ответ):
Ответ:
 (1) элементы A и B на 100% взаимозависимы (всегда встречаются вместе) 
 (2) элементы A и B независимы 
 (3) A и B имеют положительную корреляцию 
 (4) A и B имеют отрицательную корреляцию 
Номер 2
Корректно завершите утверждение: "Microsoft Sequence Clustering является гибридным алгоритмом, сочетающим методы кластеризации с…":
Ответ:
 (1) анализом марковских цепей 
 (2) анализом нейронных сетей 
 (3) поиском ассоциативных правил 
Номер 3
Корректно завершите утверждение относительно алгоритмов, входящих в стандартную поставку SQL Server 2008: "Алгоритм логистической регрессии, по сути, является …":
Ответ:
 (1) алгоритмом нейронных сетей, запускаемым с особыми параметрами 
 (2) алгоритмом деревьев решений, запускаемым с особыми параметрами 
 (3) алгоритмом линейной регрессии, запускаемым с особыми параметрами 
 (4) упрощенным алгоритмом Байеса, запускаемым с особыми параметрами 
Упражнение 8:
Номер 1
Нейронная сеть, формируемая алгоритмом Microsoft Neural Network, может включать:
Ответ:
 (1) только один слой нейронов 
 (2) только два слоя нейронов 
 (3) до трех слоев нейронов 
 (4) до четырех слоев нейронов 
Номер 2
В качестве функции активации в алгоритме Microsoft Neural Network скрытые нейроны используют:
Ответ:
 (1) функцию тангенса 
 (2) функцию гиперболического тангенса 
 (3) функцию гиперболического синуса 
 (4) сигмоидальную (логистическую) функцию 
Номер 3
В качестве функции активации в алгоритме Microsoft Neural Network выходные нейроны используют:
Ответ:
 (1) функцию тангенса 
 (2) функцию гиперболического тангенса 
 (3) функцию гиперболического синуса 
 (4) сигмоидальную (логистическую) функцию