* 2023 민트책 모의고사 문제 중 혼동하기 쉬운 부분 정리해보기
과목 1: 데이터 이해
[객관식]
1. 데이터베이스의 특징으로 가장 부적절한 것은?
- 오답: 데이터베이스는 검색기능을 가지고 있으므로 다양한 방법으로 필요한 정보를 검색할 수 있다.
- 해설: 데이터베이스의 일반적인 특징 4가지는 통합된 데이터, 저장된 데이터, 공용 데이터, 운영 데이터임.
2. 데이터와 정보의 차이를 구분하는 것은 중요하다. 다음 중 정보에 대한 예로 가장 부적절한 것은?
- 오답: 주문 수량 (데이터)
- 다른 선지: 평균 구매액, 베스트셀러, 우량 고객 (정보)
3. 영화 '마이너리티 리포트'에서 나오는 것처럼 범죄 예측 프로그램에 의해 범행을 저지르기 전에 체포될 수도 있는 사례를 통해 알 수 있는 빅데이터 시대의 위기 요인으로 적절한 것은?
- 정답: 책임 원칙 훼손
- 오답: 소셜 네트워크, 사생활 침해, 데이터 오용
4. 다음 개인정보 비식별화 기술 중 아래에서 설명하고 있는 것으로 가장 적절한 것은?
- 정답: 가명처리
- 오답: 데이터삭제, 범주화, 데이터마스킹
[주관식]
1. 개인의 사생활을 방지하고 통계 응답자의 비밀사항은 보호하면서 통계자료의 유용성을 최대한 확보할 수 있는 데이터 변환 방법은 무엇인가?
- 정답: 마스킹
과목 2: 데이터 분석 기획
[객관식]
1. 분석기회 발굴의 범위 중 시장니즈 탐색 관점에서 고객 니즈의 변화에 해당하는 것이 아닌 것은?
- 오답: 대체제
- 해설: 시장 니즈 탐색 관점에서 고객 니즈의 변화는 고객, 채널, 영향자들에 의해 진행됨.
2. 다음 중 분석 과제 관리 프로세스에 대한 설명으로 가장 적절하지 않은 것은 무엇인가?
- 오답: 분석과제로 확정되면 분석 과제를 풀(Pool)로 관리한다.
- 해설: 분석과제 중에 발생된 시사점과 분석 결과물이 풀(Pool)로 관리하고 공유됨. 확정된 분석과제는 풀로 관리하지 않음.
3. 다음 데이터 분석 조직의 유형 중 별도의 분석 조직이 없고 해당 업무부서에서 분석을 수행하는 방식에 해당하는 것은?
- 정답: 기능형
- 해설: 기능구조는 별도 분석조직이 없고 해당 업무부서에서 분석을 수행함. 전사적 핵심분석이 어려우며, 부서 현황 및 실적 통계 등 과거 실적에 국한된 분석 수행 가능성이 높음.
4. 분석 과제를 도출하기 위한 상향식 접근방식에 대한 설명으로 옳지 않은 것은?
- 오답:
분석적으로 사물을 인식하려는 Why 관점에서 접근한다. - 다른 선지:
- 상향식 접근방식의 데이터 분석은 비지도 학습방법에 의해 수행된다.
- 인과관계로부터 상관관계분석으로의 이동이라는 변화를 만들었다.
- 사물을 있는 그대로 인식하는 What 관점에서 접근한다.
5. 다음 중 분석 프로젝트 관리에 대한 설명으로 가장 부적절한 것은?
- 오답: 분석 프로젝트의 일정계획 수립 시 데이터 수집에 대한
철저한 통제와 관리가 필요하다. - 해설: 일정계획은 빈번하게 변경됨. Time boxing 기법으로 일정 관리함.
- 다른 선지:
- 분석 프로젝트 관리는 프로젝트 관리 지침을 가이드로 활용할 수 있다.
- 데이터 분석 모델의 품질을 평가하기 위해서 SPICE를 활용할 수 있다.
- 분석 프로젝트의 최종 결과물이 분석 보고서 형태 또는 시스템인지에 따라 프로젝트 관리에 차이가 있다.
[주관식]
1. 데이터 분석 기획을 위해서 데이터 분석 수준진단이 필요하다. 분석 준비도와 분석 성숙도를 통해 데이터 분석 수준을 진단하게 되는데, 분석준비도 6가지 영역 중 2가지를 적으시오.
- 정답: 분석업무, 분석기법, 분석인프라, 분석조직/인력, 분석기술, 분석데이터, 분석문화
2. 풀어야 할 문제에 대한 상세한 설명 및 해당 문제를 해결했을 때 발생하는 효과를 명시함으로써 향ㅎ 데이터 분석 문제로의 전환 및 적합성 평가에 활용하도록 하는 것은 무엇인가?
- 분석 유즈케이스
과목 3: 데이터 분석
[객관식]
1. 다음 중 모분산의 추론에 대한 설명으로 적절하지 않은 것은 무엇인가?
- 오답: 평균모집단에서 n개를 단순임의 추출한 표본의 분산은 자유도가 n-1인 t분포를 따른다.
- 해설: 표본의 분산은 카이제곱분포를 따름.
2. 다음 중 비모수검정이 아닌 것을 고르시오.
- 오답: 자기상관검정
- 해설: 윌콕슨의 순위합 검증, 맨-휘트니의 U검정, 스피어만의 순위상관계수, 부호검정, 런검정
3. 두 변량 X, Y의 상관분석에 관한 내용이다. 설명이 옳지 않은 것은?
- 오답: R에서 상관계수를 구하기 위해서는 rcor()함수를 사용하면 되고 type인자를 통해 피어슨과 스피어만 상관계수를 선택할 수 있다.
- 해설: cor() 혹은 rcorr() 사용할 수 있으며, 후자의 경우에 type으로 설정 가능함.
4. 데이터 마이닝 모델링 방법 중 분류 방법으로 활용되지 않는 R패키지는 무엇인가?
- 오답: kmeans
- 해설: rpart, rpartordinal, randomforest, party, tree, margintree, maptree 등 사용 가능함.
5. 종속변수를 설명하는데 가장 중요한 독립변수로 적절한 것은?
- 정답: 표준화 자료로 추정한 계수가 가장 큰 변수
- 해설: 다중선형회귀분석의 종속변수를 설명하는 가장 중요한 독립변수는 추정한 계수가 클수록 종속변수에 가장 영향을 많이 미치게 됨. 특히 b0가 없는 표준화된 추정식을 만들게 되면 각 계수의 크기를 더욱 정확히 알 수 있게 됨.
6. 주성분분석은 차원의 단순화를 통해 서로 상관되어 있는 변수들 간의 복잡한 구조를 분석하는 것이 목적이다. 다음 중 주성분분석에 대한 설명으로 적절하지 않은 것은 무엇인가?
- 오답: p개의 변수들을 중요한 m(p)개의 주성분으로 표현하여 전체 변동을 설명하는 것으로 m개의 주성분은 원래 변수와는 관계없이 생성된 변수들이다.
- 해설: m개의 주성분은 원래 변수에서 선형결합으로 생성된 변수이다.
- 다른 선지:
- 다변량 자료를 저차원의 그래프로 표시하여 이상치 탐색에 사용한다.
- 변수들끼리 상관성이 있는 경우, 해석상의 복잡한 구조적 문제가 발생하는데 이를 해결하기 위해 사용한다.
- 회귀분석에서 다중공선성의 문제를 해결하기 위해 활용한다.
7. 데이터 마이닝 분석 기법 중 의사결정나무 분석의 특성으로 잘못 표현한 것은 어느 것인가?
- 오답: 의사결정나무 알고리즘은 비정상적인 잡음 데이터에서는 민감하여 분류가 쉽지 않다.
- 해설: 민감함 없이 분류할 수 있음.
8. 아래의 데이터 마이닝 분석 예제 중 비지도 분석을 수행해야 하는 예제는?
- 가. 우편물에 인쇄된 우편번호 판별 분석을 통해 우편물을 자동으로 분류
- 나. 고객의 과거 거래 구매 패턴을 분석하여 고객이 구매하지 않은 상품을 추천
- 다. 동일 차종의 수리 보고서 데이터를 분석하여 차량 수리에 소요되는 시간을 예측
- 라. 상품을 구매할 때 그와 유사한 상품을 구매한 고객들의 구매 데이터를 분석하여 쿠폰을 발행
- 정답: 나, 라
- 해설: 가, 다의 경우 이미 분류된 데이터에 대해 분석을 하므로 지도 분석임
[주관식]
1. 동시에 구매될 가능성이 큰 상품군을 찾아내는 연관석 측정에 시간이라는 개념을 포착시켜 순차적인 구매 가능성이 큰 상품군을 찾아내는 데이터 마이닝 기법은?
- 정답: 순차분석
'STUDY > 기술 ∙ Tech' 카테고리의 다른 글
| [SQL] 프로그래머스 SUM, MAX, MIN 문제 정답 (0) | 2023.11.06 |
|---|---|
| [SQL] 프로그래머스 SELECT 문제 정답 (0) | 2023.11.04 |
| [ADsP] 3장 데이터 분석 (4-5) (1) | 2023.10.18 |
| [ADsP] 3장 데이터 분석 (1-3) (1) | 2023.10.15 |
| [ADsP] 2장 데이터 분석 기획 (0) | 2023.09.22 |