игра брюс 2048
Главная / Базы данных / Интеллектуальный анализ данных средствами MS SQL Server 2008 / Тест 32

Интеллектуальный анализ данных средствами MS SQL Server 2008 - тест 32

Упражнение 1:
Номер 1
В приведенном списке отметьте все характерные особенности алгоритма Microsoft Naive Bayes:

Ответ:

 (1) входные атрибуты с типом содержимого Continuous (непрерывный) не допускаются 

 (2) должен быть определен хотя бы один выходной атрибут 

 (3) выходной атрибут должен быть числовым с типом содержимого Continuous (непрерывный) 

 (4) входные атрибуты могут иметь только числовые типы данных 


Номер 2
Чтобы на SQL Server 2008 (2008 R2) создать модель интеллектуального анализа, использующую стандартную реализацию упрощенного алгоритма Байеса, в коде на DMX в качестве названия алгоритма надо указать:

Ответ:

 (1) Bayes 

 (2) Naive Bayes 

 (3) Microsoft_Naive_Bayes 

 (4) Microsoft Naive Bayes 


Номер 3
Выберите наиболее точное утверждение относительно алгоритма Microsoft Naive Bayes:

Ответ:

 (1) алгоритм поддерживает детализацию 

 (2) алгоритм ограниченно поддерживает детализацию (в зависимости от типа выходных и выходных параметров) 

 (3) алгоритм не поддерживает детализацию 


Упражнение 2:
Номер 1
Параметр MAXIMUM_STATES указывает максимальное количество состояний атрибута, поддерживаемое алгоритмом Если количество состояний больше, то алгоритм использует наиболее частые состояния атрибутов и считает остальные состояния отсутствующими Значение по умолчанию для этого параметра алгоритма Microsoft Naive Bayes:

Ответ:

 100 


Номер 2
Выберите правильное продолжение утверждения относительно алгоритма Microsoft Decision Trees: "Если прогнозируемый атрибут дискретен, а входные данные непрерывны, вход непрерывных столбцов автоматически …":

Ответ:

 (1) игнорируется 

 (2) дискретизируется 

 (3) кластеризуется 

 (4) усредняется 


Номер 3
Выберите правильное продолжение утверждения: "Параметр FORCE_REGRESSOR, требующий от алгоритма обязательно использовать указанные столбцы в качестве регрессоров …"

Ответ:

 (1) может использоваться для деревьев решений только при прогнозировании категориального атрибута (текстового или дискретного числового) 

 (2) может использоваться для линейной регрессии и деревьев решений, прогнозирующих непрерывный атрибут 

 (3) не может использоваться ни для линейной регрессии, ни для деревьев решений 


Упражнение 3:
Номер 1
Укажите параметр алгоритма Microsoft Decision Trees, который определяет метод, используемый для разбиения узлов (использовать бинарное разбиение или полное):

Ответ:

 (1) SPLIT_METHOD 

 (2) SCORE_METHOD 

 (3) COMPLEXITY_PENALTY 

 (4) MAXIMUM_OUTPUT_ATTRIBUTES 


Номер 2
В приведенном списке отметьте характерные особенности алгоритма Microsoft Linear Regression:

Ответ:

 (1) каждая модель должна содержать один ключевой столбец (тип key); составные ключи не допускаются 

 (2) необходимо наличие как минимум одного прогнозируемого столбца 

 (3) допустимы прогнозируемые столбцы с типом данных Text 


Номер 3
Для алгоритма Microsoft Time Series параметром MISSING_VALUE_SUBSTITUTION определяется:

Ответ:

 (1) порядок обработки пропущенных значений ряда 

 (2) порядок резервирования данных для проверочного набора 

 (3) порядок формирования моделей "с предысторией" для оценки точности 


Упражнение 4:
Номер 1
Параметр PERIODICITY_HINT алгоритма Microsoft Time Series позволяет:

Ответ:

 (1) явно указать алгоритму известную периодичность 

 (2) указать алгоритму на необходимость автоматически определять периодичность 

 (3) указать алгоритму, что из исходного набора нужно с заданной периодичностью резервировать данные в обучающую выборку 


Номер 2
Для алгоритма Microsoft Time Series значением по умолчанию параметра FORECAST_METHOD является:

Ответ:

 (1) ARTXP 

 (2) ARIMA 

 (3) MIXED 


Номер 3
Для алгоритма Microsoft Time Series параметр PREDICTION_SMOOTHING указывает:

Ответ:

 (1) как модель должна использовать сочетание двух алгоритмов для оптимизации прогнозов 

 (2) интервал времени между двумя последовательными моделями с предысторией 

 (3) степень "чувствительности" автоматического обнаружения периодичности 


Упражнение 5:
Номер 1
В приведенном списке отметьте характерные особенности алгоритма Microsoft Clustering:

Ответ:

 (1) обязательно должен присутствовать ключевой столбец, применение составных ключей не допускается 

 (2) наличие прогнозируемого столбца необязательно 

 (3) варианты с вложенными таблицами алгоритмом не поддерживаются 


Номер 2
У алгоритма Microsoft Clustering есть параметр MINIMUM_SUPPORT Он указывает:

Ответ:

 (1) минимальное число создаваемых кластеров 

 (2) минимальный размер кластера 

 (3) минимальную оценку вероятности принадлежности, при которой вариант считается включенным в кластер 


Номер 3
У алгоритма Microsoft Clustering есть параметр, содержащий признак завершения построения модели - оценку максимального числа вариантов, которые могут изменить свое членство в кластерах Этот параметр называется:

Ответ:

 (1) MODELLING_CARDINALITY 

 (2) SAMPLE_SIZE 

 (3) STOPPING_TOLERANCE 

 (4) MINIMUM_SUPPORT 


Упражнение 6:
Номер 1
У многих встроенных в SQL Server 2008 алгоритмов интеллектуального анализа есть параметр MAXIMUM_INPUT_ATTRIBUTES (максимальное количество входных атрибутов, которые алгоритм может обработать перед вызовом процедуры выбора характеристик) со значением по умолчанию:

Ответ:

 255 


Номер 2
Выберите правильное утверждение относительно алгоритма Microsoft Association Rules:

Ответ:

 (1) входные столбцы могут быть только непрерывными 

 (2) входные столбцы могут быть только дискретными 

 (3) входные столбцы должны быть дискретными или дискретизированными 

 (4) входные столбцы могут иметь любой допустимый DMX тип содержимого 


Номер 3
В алгоритме Microsoft Association Rules минимальное количество элементов, допустимых в наборе, можно указать, используя параметр:

Ответ:

 (1) MINIMUM_IMPORTANCE 

 (2) MINIMUM_ITEMSET_SIZE 

 (3) MINIMUM_SUPPORT 


Упражнение 7:
Номер 1
В запросах к модели, основанной на алгоритме Microsoft Sequence Clustering, в которых требуется получить наиболее вероятное продолжение последовательности, надо использовать функцию:

Ответ:

 (1) Predict() 

 (2) PredictSequence() 

 (3) PredictNext() 

 (4) PredictProbability() 


Номер 2
У алгоритма Microsoft Sequence Clustering есть параметр CLUSTER_COUNT, указывающий примерное количество кластеров, создаваемых алгоритмом Его значение по умолчанию:

Ответ:

 10 


Номер 3
Выберите корректное продолжение утверждения: "Модель, использующая алгоритм Microsoft Neural Network, должна содержать, по крайней мере, …"

Ответ:

 (1) один входной столбец, но может не иметь выходных (прогнозируемых) атрибутов 

 (2) два входных столбца и один выходной (прогнозируемый) 

 (3) один входной и один выходной (прогнозируемый) столбец 

 (4) один входной и два выходных (прогнозируемых) столбца 


Упражнение 8:
Номер 1
В модели, использующей алгоритм Microsoft Neural Network, вложенная таблица…

Ответ:

 (1) может использоваться и как входной, и как прогнозируемый атрибут 

 (2) не может использоваться ни как входной, ни как прогнозируемый атрибут 

 (3) может использоваться как входной атрибут, но не может использоваться в качестве прогнозируемого 

 (4) может использоваться как прогнозируемый атрибут, но не может использоваться в качестве входного 


Номер 2
В алгоритме Microsoft Neural Network соотношение числа скрытых, входных и выходных нейронов указывается с помощью параметра:

Ответ:

 (1) HIDDEN_NODE_RATIO 

 (2) HOLDOUT_PERCENTAGE 

 (3) SAMPLE_SIZE 


Номер 3
Для алгоритма Microsoft Logistic Regression параметр HIDDEN_NODE_RATIO

Ответ:

 (1) неприменим (тк всегда должен быть равен 0

 (2) может принимать значение True или False (по умолчанию True

 (3) может принимать неотрицательные целые значения (по умолчанию 10




Главная / Базы данных / Интеллектуальный анализ данных средствами MS SQL Server 2008 / Тест 32