игра брюс 2048
Главная / Базы данных / Алгоритмы интеллектуальной обработки больших объемов данных / Тест 9

Алгоритмы интеллектуальной обработки больших объемов данных - тест 9

Упражнение 1:
Номер 1
Для 10 значений количественного признака X 1; 2; 3; 4; 5; 6; 7; 8; 9; 10 даны соответствующие значения Y: 2,5; 3,1; 0,4; -2,3; -3,2; -0,8; 2,0; 3,0; 1,2; -2,0. Функция регрессии ищется в виде Y=A*sin(X), A=3,174 (квадратичная функция потерь). Для более стабильного результата был применен алгоритм бэггинга (bagging). С помощью датчика случайных чисел были сделаны четыре выборки из указанных 10 примеров с возвращением (указаны только значения X): {1; 1; 2; 3; 4; 6; 8; 8; 10; 10}, {2; 2; 3; 4; 5; 7; 7; 8; 9; 10}, {1; 3; 3; 3; 6; 6; 7; 8; 8; 9}, {4; 4; 4; 5; 5; 5; 6; 9; 9; 9}. Для каждой из четырех выборок вычислите коэффициент A при sin (X) с квадратичной функцией потерь. В качестве ответа укажите среднее арифметическое этих четырех значений с точностью до двух знаков после запятой.

Ответ:

 3,14 


Номер 2
Укажите играть в гольф на открытой площадке или нет, основываясь на дерево решений ниже
files

Ответ:

 (1) Играть; 

 (2) Не играть; 


Упражнение 2:
Номер 1
Даны четыре примера (наблюдения) в трехмерном пространстве признаков: A(1;4;10), B(2;5;6), C(1;3;8) и D(2;4;8), при этом известно, что первый и третий примеры относятся к классу "1", а второй и четвертый – к классу "0". Для обучения на данных примерах применяется метод случайных подпространств (RSM, random subspace method). Случайным образом были выбраны 5 различных двумерных наборов признаков: (1;4;-), (2;-;6), (-;3;8), (2;4;-), (2;-;8). Принадлежность к классу определяется голосованием – числом наборов, которые относят тот или иной пример к определенному классу. Сколько наборов относят тестовый пример E(2;4;6) к классу "0"? (Напишите ответ в виде целого числа.)

Ответ:

 2 


Номер 2
В синхронных нейронных сетях в каждый момент времени свое состояние меняет

Ответ:

 (1) Все нейроны 

 (2) Один нейрон 

 (3) Произвольное количество нейронов 


Упражнение 3:
Номер 1
Даны четыре примера (наблюдения) в трехмерном пространстве признаков: A(1;4;10), B(2;5;6), C(1;3;8) и D(2;4;8), при этом известно, что первый и третий примеры относятся к классу "1", а второй и четвертый – к классу "0". Для обучения на данных примерах применяется алгоритм случайный лес (random forest). Случайным образом были выбраны 5 наборов примеров и признаков: (1) пример 1 (признаки 1,2) + пример 2 (признаки 1,3); (2) пример 3 (признаки 2,3) + пример 4 (признак 1); (3) пример 2 (признаки 1,2,3) + пример 3 (признак 1); (4) пример 1 (признаки 1,3) + пример 2 (признак 1) + пример 3 (признак 3); (5) пример 1 (признаки 2,3) + пример 4 (признаки 2,3). Для этих пяти наборов были построены соответственно пять деревьев по алгоритму CART, нечистота (impurity) вычислялась по Джини. Принадлежность к классу определяется голосованием – числом деревьев, которые отнесли тот или иной пример к определенному классу. Сколько деревьев отнесут тестовый пример F(2;3;6) к классу "0"? (Напишите ответ в виде целого числа.)

Ответ:

 3 


Номер 2
Где лучшая область применения нейронных сетей ?

Ответ:

 (1) распознавание образов в видеопотоке и изображениях 

 (2) распознавание речи 

 (3) текстовая классификация 

 (4) информационный поиск данных 


Упражнение 4:
Номер 1
Что Вы видите на данном графике?
files

Ответ:

 (1) Переобучение модели 

 (2) Недообучение модели 

 (3) Выбор оптимальной степени полинома 

 (4) Настройка модели 


Номер 2
Где лучшая область применения ансамблей деревьев решений ?

Ответ:

 (1) информационный поиск данных 

 (2) текстовая классификация 

 (3) автопилотирование транспорта 

 (4) распознавание речи 


Упражнение 5:
Номер 1
Укажите основные подходы к построению стохастических методов:

Ответ:

 (1) Stacking 

 (2) Bootstrap aggregation 

 (3) Метод случайных подпространств 

 (4) Построение ансамблей классификаторов 


Номер 2
Назовите основные недостатки алгоритма Random Forest ?

Ответ:

 (1) модели получаются большие и не интерпретируемые 

 (2) алгоритм требует сложной настройки параметров 

 (3) алгоритм плохо параллелится 

 (4) алгоритм плохо работает с полиномиальными зависимостями 


Упражнение 6:
Номер 1
Укажите отрицательные стороны алгоритма Random Forest

Ответ:

 (1) Легко переобучается 

 (2) Требует сложной настройки параметров 

 (3) Требует нормализации данных 

 (4) Модели получаются неинтерпретируемые 

 (5) Плохо работает с полиноминальными зависимостями 

 (6) Медленно работает с большим объемом данных 


Номер 2
Выберите неверное высказывание про нейронные сети в сравнении с алгоритмическими композициям

Ответ:

 (1) достаточно легко проводить эксперименты 

 (2) подбирать параметры зачастую достаточно сложно, если о структуре данных априори ничего не известно. 

 (3) обучение нейронных сетей процесс не быстрый 

 (4) обладают сложной топологией 


Упражнение 7:
Номер 1
Если зависимая переменная принимает непрерывные значения, то дерево решений решает задачу:

Ответ:

 (1) Численного прогнозирования; 

 (2) Решение невозможно; 

 (3) Логистического прогнозирования; 


Номер 2
Физический смысл соотношения между большим смещением и маленькой дисперсией характеризуется

Ответ:

 (1) сложность модели недостаточно 

 (2) сложность модели избыточна 

 (3) хорошо предсказываем данные из обучающего множества и обобщаем на новые пример 

 (4) ни один из ответов не верен 


Номер 3
Укажите не верное выражение характеристики использования алгоритма RandomForest

Ответ:

 (1) Алгоритм прост 

 (2) Не переобучается 

 (3) Хорошо параллелится 

 (4) "Быстро" работает для большого объема данных 




Главная / Базы данных / Алгоритмы интеллектуальной обработки больших объемов данных / Тест 9