Главная / Базы данных /
Введение в аналитику больших массивов данных / Тест 9
Введение в аналитику больших массивов данных - тест 9
Упражнение 1:
Номер 1
Клиент покупает билет на самолет через интернет. В момент покупки, он хочет знать насколько может упасть стоимость этого билета в ближайшем будущем и когда. К какому типу относится эта задача анализа данных?
Ответ:
 (1) прогнозирование 
 (2) кластеризация 
 (3) классификация 
 (4) цензурирование 
Номер 2
Клиент покупает билет на самолет через интернет. Как бы в данном случае формулировалась задача прогнозирования?
Ответ:
 (1) в момент покупки предсказать, насколько и когда может упасть стоимость этого билета в ближайшем будущем 
 (2) в момент покупки определить, к какому сегменту относится пользователь и предложить выгодные для него условия сделки 
 (3) выдать пользователю прогноз погоды для того места, куда он летит 
 (4) спрогнозировать вероятность дополнительных покупок (отель, страховка, туристический тур) и предложить наиболее вероятные пользователю 
Номер 3
Клиент покупает билет на самолет через интернет. В момент покупки стоит задача определить вероятность дополнительных покупок (отель, страховка, туристический тур) и предложить наиболее вероятные пользователю. К какому типу относиятся эта задача анализа данных?
Ответ:
 (1) заполнение пробелов 
 (2) классификация 
 (3) прогнозирование 
 (4) цензурирование 
Упражнение 2:
Номер 1
Инвестиционный фонд интересуется тем, почему часть финансируемых им
проектов успешно переходят на второй год, а часть - нет. К какому типу относится эта задача анализа данных?
Ответ:
 (1) поиск информативных признаков 
 (2) построение решающего правила 
 (3) классификация 
 (4) цензурирование 
Номер 2
Инвестиционный фонд имеет ряд проектов, который успешно переходят на второй год финансирования и тех, кто не переходит. Как бы в данном случае формулировалась задача поиска информативных признаков?
Ответ:
 (1) определить, почему ряд проектов успешно переходят на второй год, а ряд – нет 
 (2) определить для нового проекта, перейдёт ли он через год на второй этап финансирования или нет 
 (3) восстановить некоторые характеристики проектов, которые изначально не заполнялись 
 (4) определить критерий успешности 
Номер 3
Инвестиционный фонд имеет ряд проектов, который успешно переходят на второй год финансирования и тех, кто не переходит. Фонд поставил задачу определить критерий успешности проекта. К какому типу задач анализа данных наиболее близка эта задача?
Ответ:
 (1) прогнозирование 
 (2) построение решающего правила 
 (3) поиск информативных признаков 
 (4) цензурирование 
Упражнение 3:
Номер 1
Коммерческая клиника желает установить структуру своих клиентов с
точки зрения вклада в доход клиники. К какому типу относится эта задача анализа данных?
Ответ:
 (1) прогнозирование 
 (2) кластеризация 
 (3) классификация 
 (4) цензурирование 
Номер 2
Коммерческая клиника обладает некоторыми данными о клиентах и о доходах от них. Как бы в данном случае формулировалась задача кластеризации?
Ответ:
 (1) определить основные сегменты клиентов 
 (2) определить, сколько денег принесёт тот или иной клиент в следующем периоде 
 (3) определить, когда вернётся тот или иной клиент 
 (4) определить, к какой группе "инноватор"-"последователь"-"консерватор" относится данный клиент 
Номер 3
Коммерческая клиника обладает некоторыми данными о клиентах и о доходах от них. Руководителем поставлена задача определить, к какой группе "инноватор"-"последователь"-"консерватор" относится данный клиент. К каким из типов задач анализа данных близка эта задача?
Ответ:
 (1) кластеризация 
 (2) прогнозирование 
 (3) классификация 
 (4) таксономия 
Упражнение 4:
Номер 1
Компания, проводящая социологические опросы, испытывает сложности с верификацией данных, поступающих от волонтеров непосредственно опрашивающих респондентов: многие анкеты заполнены не полностью; волонтеры фальсифицируют результаты опроса, самостоятельно заполняя часть анкет. К какому типу наиболее близка эта задача анализа данных?
Ответ:
 (1) прогнозирование 
 (2) кластеризация 
 (3) классификация 
 (4) цензурирование 
Номер 2
Компания, проводящая социологические опросы получает анкеты от волонтеров, непосредственно опрашивающих респондентов. При каких условиях разумна постановка задачи цензурирования?
Ответ:
 (1) многие анкеты заполнены не полностью 
 (2) стало известно, что волонтеры фальсифицируют результаты опроса, самостоятельно заполняя часть анкет 
 (3) от заказчика поступило требование уничтожить часть анкет, содержащих информацию о руководителях страны 
 (4) Часть анкет пришла в негодность, что не позволяет считать информацию с них со 100% уверенностью 
Номер 3
Компания, проводящая социологические опросы, испытывает сложности с верификацией данных, поступающих от волонтеров непосредственно опрашивающих респондентов: многие анкеты заполнены не полностью; волонтеры фальсифицируют результаты опроса, самостоятельно заполняя часть анкет. К какому типу задач анализа данных здесь прибегать не придётся?
Ответ:
 (1) заполнение пробелов 
 (2) цензурирование 
 (3) прогнозирование 
 (4) классификация 
Упражнение 5:
Номер 1
С некоторой периодичностью персонал предприятия списывает группы расходных материалов на различных участках учета. Для выявления ошибок, акты списания выборочно проверяются аудитором. Руководство компании заинтересовано в сокращении количества проверок, при сохранении точности выявления ошибочного списания на уровне 97%. Требуется выявлять сомнительные акты списания, подлежащие обязательной проверке аудитором. К какому типу относится эта задача анализа данных?
Ответ:
 (1) прогнозирование 
 (2) кластеризация 
 (3) классификация 
 (4) цензурирование 
Номер 2
С некоторой периодичностью персонал предприятия списывает группы расходных материалов на различных участках учета. Для выявления ошибок, акты списания выборочно проверяются аудитором. Как бы в данном случае формулировалась задача классификации?
Ответ:
 (1) определить характерные признаки ошибочных списаний 
 (2) научиться автоматически выявлять ошибочные списания с ожидаемой ошибкой не ниже 97% 
 (3) классифицировать типичные ошибки и составить их список 
 (4) определить три категории: "ошибочные", "под сомнением", "безошибочные" и найти правило отнесения к этим категориям 
Номер 3
С некоторой периодичностью персонал предприятия списывает группы расходных материалов на различных участках учета. Для выявления ошибок, акты списания выборочно проверяются аудитором. Определены три категории: "ошибочные", "под сомнением", "безошибочные". К какому типу задач анализа данных относится задача о построении правила автоматического отнесения списаний к этим категориям.
Ответ:
 (1) поиск информативных признаков 
 (2) кластеризация 
 (3) классификация 
 (4) цензурирование 
Упражнение 6:
Номер 1
Кардиологический центр исследовал возможность прогнозирования возникновения осложнений во время операционного вмешательства по до-операционным данным о пациенте: результатам физиологического и диагностического обследований. К какому типу задача анализа данных относится задача прогнозирования операционных осложнений?
Ответ:
 (1) поиск информативных признаков 
 (2) кластеризация 
 (3) классификация 
 (4) цензурирование 
Номер 2
В кардиологическом центре проводятся операции. До и во время операционного вмешательства с пациента снимаются определённые показания. Известны случаи осложнений во время проведения операций, эти случаи описаны тем же набором данных. Как бы в данном случае формулировалась задача классификации?
Ответ:
 (1) сгруппировать пациентов по похожим дооперационным показаниям 
 (2) спрогнозировать по дооперационным данным вероятность возникновения осложнений во время операции 
 (3) ранее были определены три группы риска среди пациентов. Все предыдущие случаи осложнений отнесены к определённым группам риска. Стоит задача определить группу риска для нового пациента, прошедшего дооперационные обследования 
 (4) часть данных о пациентах не содержит некоторых полей, требуется заполнить эти данные на основе статистики, чтобы включить данные об этих пациентах в выборку 
Номер 3
В кардиологическом центре проводятся операции. До и во время операционного вмешательства с пациента снимаются определённые показания. Известны случаи осложнений во время проведения операций, эти случаи описаны тем же набором данных. Ранее были определены три группы риска среди пациентов. Все предыдущие случаи осложнений отнесены к определённым группам риска. Стоит задача определить группу риска для нового пациента, прошедшего дооперационные обследования. К какому типу относится эта задача анализа данных?
Ответ:
 (1) прогнозирование 
 (2) кластеризация 
 (3) классификация 
 (4) цензурирование 
Упражнение 7:
Номер 1
К какому типу шкал относится шкала "очень плохо"-"плохо"-"средне"-"хорошо-"очень хорошо"?
Ответ:
 (1) порядковая 
 (2) абсолютная 
 (3) бинарная 
 (4) номинальная 
Номер 2
Какие из следующих шкал в точности являются порядковыми?
Ответ:
 (1) "Слабо", "Сильно" 
 (2) "Красный", "Желтый", "Зеленый" 
 (3) "удовлетворительно", "хорошо", "отлично" 
 (4) показания термометра