Главная / Базы данных /
Введение в аналитику больших массивов данных / Тест 18
Введение в аналитику больших массивов данных - тест 18
Упражнение 1:
Номер 1
Приведите округленный результат прогнозирования пустого значения в таблице с помощью функции ТЕНДЕНЦИЯ:
Ответ:
 209 
Номер 2
Каким будет округленный результат прогнозирования пустого значения в таблице с помощью функции ТЕНДЕНЦИЯ:
Ответ:
 (1) 209 
 (2) 210 
 (3) 220 
 (4) 301 
Номер 3
Приведите округленный результат прогнозирования пустого значения в таблице с помощью функции РОСТ:
Ответ:
 260 
Упражнение 2:
Номер 1
Какое значение запишет функция Flash (Мгновенное заполнение) Excel в пропущенной ячейке:
Ответ:
 3 
Номер 2
Какое значение запишет функция Flash (Мгновенное заполнение) Excel в пропущенной ячейке:
Ответ:
 (1) война и мир 
 (2) роман 
 (3) сказка 
 (4) Фильм 
Номер 3
Какое значение запишет функция Flash (Мгновенное заполнение) Excel в пропущенной ячейке
Ответ:
 Сказка 
Упражнение 3:
Номер 1
Существуют ли встроенные ограничения в Excel 2013 на количество элементов данных в одном ряду данных для плоских диаграмм?
Ответ:
 (1) да, не более 32 000 
 (2) да, не более 32 767 
 (3) да, не более 1 048 576 
 (4) нет, размер ограничен только объемом доступной оперативной памяти 
Номер 2
Каково ограничение в Excel 2013 на количество строк при загрузке csv-файла? (Если считаете, что размер ограничен только объемом доступной оперативной памяти напишите 0).
Ответ:
 1048576 
Номер 3
Каково ограничение в Excel 2013 на количество строк при загрузке csv-файла?
Ответ:
 (1) 1048576 
 (2) 65535 
 (3) нет, размер ограничен только объемом доступной оперативной памяти 
 (4) 2147483648 
Упражнение 4:
Номер 1
Отметьте верное представление типа данных "очень плохо"-"плохо"-"средне"-"хорошо-"очень хорошо" в файле типа ARFF:
Ответ:
 (1) @attribute estimation { “очень плохо”, плохо, средне, хорошо, “очень хорошо”}
 
 (2) @attribute estimation { очень плохо, плохо, средне, хорошо, очень хорошо}
 
 (3) @attribute estimation { [очень ]плохо, средне, [очень] хорошо}
 
 (4) @attribute estimation { “[очень ]плохо”, средне, “[очень ]хорошо”}
 
Номер 2
Какие из перечисленных признаков таблицы могут быть классификационными без предварительной обработки?
Ответ:
 (1) Temperature, Humidity 
 (2) Play, Outlook, Wind 
 (3) Play, Outlook, Temperature, Humidity, Wind 
 (4) Row No., Play, Outlook, Temperature, Humidity, Wind 
Номер 3
Какие из перечисленных признаков таблицы представлены в абсолютной шкале?
Ответ:
 (1) никакие 
 (2) Temperature 
 (3) Humidity 
 (4) Temperature, Humidity 
Упражнение 5:
Номер 1
Основной целью процесса на приведенной диаграмме является
Ответ:
 (1) произвести оценку качества работы алгоритма J48 
 (2) классифицировать выборку объектов алгоритмом J48 
 (3) оценить качество исходных данных 
 (4) выбрать наиболее релевантную обучающую выборку 
Номер 2
Можно ли с помощью приведённой схемы произвести оценку качества работы алгоритма J48 на загруженных данных?
Ответ:
 (1) нет 
 (2) да, достаточно одного прогона 
 (3) да, только после 10 запусков 
 (4) да, только после 100 запусков 
Номер 3
Что выведет в приведённой схеме TextViewer?
Ответ:
 (1) число 
 (2) текст 
 (3) обучающую выборку 
 (4) контрольную и обучающую выборку 
Упражнение 6:
Номер 1
Продукты аналогичные Knime, RapidMiner хорошо подойдут для
Ответ:
 (1) быстрого прототипирования модели обработки данных 
 (2) создания гибкой интерактивной модели обработки данных 
 (3) визуализации данных 
 (4) для разработки новых алгоритмов 
Номер 2
В каком случае применение Tableau наиболее оправдано
Ответ:
 (1) проведено исследование, результатом которого стала таблица объект-свойства, необходимо предоставить отчетность 
 (2) имеются данные, необходимо более получить ясное понимание этих данных 
 (3) необходимо реализовать гибкое интерактивное визуальное представление данных 
 (4) не оправдано 
Номер 3
Какой из языков наиболее богат библиотеками/фреймворками для интерактивной визуализации данных
Ответ:
 (1) Java Script 
 (2) R 
 (3) Python 
 (4) с 
Упражнение 7:
Номер 1
Какая из приведённых функций реализует алгоритм классификации
Ответ:
 (1) kmeans()
 
 (2) hcclust()
 
 (3) randomForest()
 
 (4) classify()
 
Номер 2
Какая из функций реализует алгоритм кластеризации
Ответ:
 (1) pam()
 
 (2) nnet()
 
 (3) party()
 
 (4) cluster()
 
Номер 3
Алгоритм какого типа реализует функция randomForest()?
Ответ:
 (1) кластеризации 
 (2) классификации 
 (3) регрессии 
 (4) визуализации в виде деревьев 
Номер 4
Основное преимущество Python перед R – это
Ответ:
 (1) быстродействие 
 (2) элементы функционального программирования 
 (3) Python превосходит R, как язык программирования 
 (4) строго типизирован 
Упражнение 8:
Номер 1
Назовите преимущества R, как инструмента data mining, перед другими языками
Ответ:
 (1) быстродействие 
 (2) большое кол-во библиотек алгоритмов ИАД и статистических пакетов 
 (3) удобная работа с данными 
 (4) работа с большими данными 
Номер 2
базовая библиотека для data science на Python
Ответ:
 (1) Scipy stack (NumPy & SciPy) 
 (2) Theano 
 (3) MDP 
 (4) Mahout 
Номер 3
Имеет ли Python аналог Data Frame из R
Ответ:
 (1) да, библиотека Pandas 
 (2) нет 
 (3) да, библиотека NumPy 
 (4) да, библиотека SciPy 
Упражнение 9:
Номер 1
Есть список на Python s = [1, 2, 3, 4, 6], что вернет выражение s[2:-2]
Ответ:
 (1) [3] 
 (2) [2, 4] 
 (3) [1,2,4,6] 
 (4) [2,-2] 
Номер 2
Есть список на Python s = [1, 2, 3, 4, 6], что вернет выражение s[2:-2]
Ответ:
 3 
Номер 3
Что будет присвоено переменной res (Python) в следующем выражении res = [x for x in xrange(1,5, 2)]
Ответ:
 (1) [1, 3] 
 (2) [1,2,3,4,5,1,2,3,4,5] 
 (3) [1,5,2] 
 (4) [152] 
Упражнение 10:
Номер 1
Необходимо провести предварительный анализ данных для их лучшего понимания, выберите наиболее подходящие инструменты
Ответ:
 (1) Tableau, Weka/Knime/Rapidminer 
 (2) R 
 (3) Python 
 (4) HBase 
Номер 2
Необходимо реализовать решение по анализу данных и передать его стороннему заказчику в эксплуатацию, выберите наиболее подходящие инструменты
Ответ:
 (1) Weka 
 (2) R 
 (3) Python 
 (4) RapidMiner 
Номер 3
Необходимо реализовать интерактивную визуализацию данных, которая будет доступна широкому кругу людей, выберите наиболее подходящие инструменты
Ответ:
 (1) Tableau 
 (2) JS фреймворк визуализации данных, например, D3 
 (3) Python matplotlib 
 (4) Weka