공부 이야기/그냥 찾아보는 공부

ADsP - 데이터 이해 ~ 데이터 분석 기획

mind: 2020. 11. 8. 23:24

10 / 10 / 40 문제

1과목과 2과목은 합해서 20문제가 나오기 때문에 집중공략할 대상은 아니지만 과락은 면해야 한다.

 

1. 문제 유형별 키워드

2. 주관식 별도 정리

 

< 데이터 이해 >

단어 : 빅데이터 분석, 데이터웨어하우스

1. 빅데이터 분석에 경제성을 제공 -> 클라우드 컴퓨팅

- 온프레미스로 구축할 필요 없이 소정의 이용 대금으로 대형 네트워크망 및 데이터망 구축 가능

2. 의외로 빅데이터 분석의 특성이 아닌 것

- 모든 데이터를 많이 활용하는 것

- 다양한 대상보다는 주요한 대상에 집중해야 함

- 막대한 비용은 걸림돌이 아님

- 경험에 따른 추측에 의한 인사이트

3. 오류에는 로직 오류 / 프로세스 오류로 나뉜다.

4. DIKW : data, information, knowledge, wisdom

5. 빅데이터가 만들어 내는 변화

- 사전 처리 -> 사후 처리

- 인과관계 -> 상관관계

- 질 < 양

- 표본조사 -> 전수조사

6. [빅데이터 플랫폼] 3rd Party에 있는 API를 통해 공개된 데이터를 활용하는 것

7. 페타바이트 < 엑사바이트 < 제타바이트 < 요타바이트

8. 빅데이터로 달성할 수 있는 경영혁신 단계

생산성 향상 -> 발견에 의한 문제해결 -> 의사결정 향상 -> 새로운 고객가치와 비즈니스 창출

9. 미국 연방거래위원회가 제시한 '소비자 프라이버시 보호 3개 권고 사항'

- 상품 개발 단계에서부터 소비자 프라이버스 보호 방안 적용

- 소비자에게 수집된 정보 내용 공개 및 접근권 부여

- 소비자에게 공유 정보 선택 옵션 제공

10. 데이터 시각화는 소프트 스킬이 아니다. 일종의 스토리텔링에 더 가까움

11. 데이터웨어하우스 특징 : 주제 지향성, 데이터 통합, 시계열성, 비휘발성, 무결성(x)

- 기업 내의 의사결정지원을 위한 정보 기반을 제공하는 하나의 통합된 데이터 저장 공간

- ETL은 주기적으로 내부 및 외부 DB로부터 정보를 추출하고 정해진 규약에 따라 정보를 변환한 후 DW에 적재

- 재무, 생산, 운영과 같은 특정 업무에 초점을 맞추어 구축하는 데이터 마트와 다르게 전사적인 차원에서 접근

12. 구글 번역 서비스에서 활용된 빅데이터의 특성 -> Volume(양)

- 구글의 Ngram Viewer (모든 책을 디지털화해서 검색엔진에 편입하는 것) -> 빅데이터의 기능 <현미경>

13. 빅데이터 시대가 도래하면서 발생될 수 있는 부정적인 측면

- 책임원칙 훼손

- 사생활침해

- 데이터 오용

14. BI(Business Intelligence) : 데이터 기반 의사결정을 지원하기 위한 '리포트' 중심의 도구

- OLAP : 다차원의 데이터를 대화식으로 분석하기 위한 소프트웨어

- Analytics : 의사결정을 위한 통계적이고 수학적인 분석에 초점을 둔 기법

15. [데이터 사이언티스트] : 컴퓨터공학, 통계학, 수학 등의 학문적 지식은 물론 시각화 및 보안 등의 전문지식을 종합한 학문으로 '총체적 접근법'을 사용

- 정량 분석이라는 과학과 인문학적 통찰에 근거한 합리적 추론을 조합

16. 빅데이터가 기업에 주는 영향

-> 혁신 촉진, 경쟁력 제고, 생산성 향상

17. [데이터 익명화] : 데이터에 포함된 개인 식별 정보를 삭제하거나 알아볼 수 없는 형태로 변환하는 것

18. 내부 프로세스와 관련된 전형적인 분석 활용기법

- 베이즈 추론 : 증거를 관찰하기 전과 후의 가설에 대한 믿음의 정도를 나타내는 추정치로 수익예측에 사용

- 최적화 : 일부 변수의 값이 반드시 정수여야 하며 한정된 자원으로 특정 목적을 달성하는 솔루션 제공

- 몬테카를로 시뮬레이션 : 특정 결과 혹은 위험이 발생할 확률을 평가하는 계산 기법

- 신경망 분석 : 투입 요소들을 구분할 때까지 반복해서 학습이 이루어지며 주로 대규모 DB에서 사용

- 회귀 분석 : 주로 개인의 신용도 평가에 많이 활용

-> 문제가 IT를 요구하는 것인지 데이터 분석(빅데이터)인지를 분간해야 함

 

<데이터 분석 기획>

1. Active System Map - CLD

- 경영진의 의사결정 사항 3가지 : 정책 / 자산 / 거버넌스 

- [분석유즈케이스] : 선택이 결과를 발생시킬 것에 대한 가정을 실현시키기 위한 헬퍼

2. 기업의 프로세스 혁신 활동 : BPM, BPR, Best Practice, 6-sigma

- 운영상 개선효과는 가져올 수 있지만 영속적인 수익은 가져다주지 못함

-  이슈 중심의 상향식 접근 < 비즈니스 모델 및 시나리오 기반의 하향식 접근

- 신속성 관점의 업무 효율화 < 최적화 관점의 업무 처리 지능화를 통한 효과성 향상

- 업무프로세스의 실행시점에 필요한 Action을 강제화할 수 있도록 Analytics의 프로세스 내재화

- 프로세스의 중복제거/단순화/표준화 관점에서 업무 처리의 신속성과 시장대응 민첩성으로 진행

3. 분석 업무의 프로세스 내재화

- 정보계로 분리되어 분석 기번을 일괄배치로 실행시점에 내재화 및 의사결정이 강제로 이뤄지게 함

- 집계성 데이터 및 주기적 수집 데이터보다 실시간 발생데이터 중심으로 분석 수행

- DW를 포함한 비구조적 데이터, 반구조적 데이터를 포함한 분석 접근

- 이벤트 발생으로부터 실행까지의 프로세스 상의 의사결정 지연최소화 및 변화하는 신규 비즈니스 요건 대응의 민첩성 확보

4. 의사결정 최적화의 장애 요건

- 데이터 지연

- 분석 지연

- 의사결정 지연

5. 분석 선순환 구조 맵

- 특정 부서에서 수행한 분석의 결과가 다른 조직에 어떠한 영향을 미치는지 전사 목표 최적화 관점에서 파악

- 분석 목록을 선택과 결과로 모델링해서 연관성을 파악

- 각 분석에 따른 결과요소들 간에 서로 상충되는 요소가 있는지 확인

6. 잊혀질 권리 : 온라인 또는 SNS 상에서 생성/저장/유통되는 개인의 사진이나 거래 정보 등의 유통기한을 정해서 삭제 및 수정을 요청할 수 있는 권리 개념

7. 데이터 분석 구현을 위한 적용 우선순위 평가 고려사항

1) 적용

- 전략적 중요도

- 분석 ROI

- 실행 용이성

2) 적용 범위/방식

- 분석 데이터 적용 수준

- 업무내재화 수준

- 기술 적용 수준

8. 빅데이터 품질관리의 특성

- 이미 생성된 데이터에 대한 정제가 어렵다

- 개별 데이터에 대한 타당성 검증은 경우에 따라 불필요

- 혹시 발생 할지 모르는 데이터 사용자의 오류는 무시

* 데이터에 대한 오너쉽은 품질관리가 아닌 관리 책임성

9. 고객의 니즈를 구성하는 4가지 가치 유형

- 기능적 가치

- 재무적 가치

- 사회적 가치

- 감정 가치

10. [분석 유즈케이스] : 기업의 전사 또는 개별 업무별 주요 의사결정 포인트에 활용할 수 있는 분석의 후보들

- 비즈니스 모델을 구성하는 이론을 설명하고 하나 이상의 분석을 포함

- 프로세스 혁신의 수단으로 사용 가능

11. 데이터 분석을 위한 기업의 성숙도 모델 : 도입단계 -> 활용단계 -> 확산단계 -> 최적화단계

- 확산단계 : 전사 차원에서 분석을 관리하고 공유, 분석 전담 조직을 운영하고 데이터 사이언티스트를 확보, 전사 성과의 실시간 분석이 가능하고 분석 규칙 및 이벤트를 관리

12. 빅데이터 프로젝트에서 이익 실현 역량을 방해하는 3가지 요소

- 전문가 부족

- 사일로우 조직 (경쟁이 치열하거나 외부자극에 영향이 큰 기업)

- 새도우 IT 부상 (IT 부서 패싱)

13. [비즈니스 모델] : 기업운영 방식의 표현, 하나의 조직이 가치를 어떻게 만들고 제공하며 획득하는지에 대한 근본적 원리의 표현, 기업을 어떻게 경영하느냐를 설명하는 이야기

14. 분석기회(분석유즈케이스)를 구조화하고 분석방안을 구체화하기 위한 세부 Task

1) 분석 기회 구조화 : 유저스토리 정의 ,목표 가치 구체화, 분석 질문 구체화

2) 분석 방안 구체화 : 의사결정요소 모형화, 분석체계 도출, 분석 필요 데이터 정의

15. [분석마스터플랜] : 기업 또는 기관에서 다양한 분석과제를 대상으로 제한된 예산과 자원을 효과적으로 수행하기 위해 우선순위를 평가하고, 평가 결과에 따른 단계별 군현 로드맵을 수립하는 실행 계획

16. 분석 전담 조직의 역할

- 전사 분석과제를 발굴 및 구체화하고, 과제 적용을 위한 우선순위를 정함

- 고급 통계기법을 이해하고 다양한 분석 모델을 설계하고 검증

- 조직 내 분석 문화 확산을 위한 교육 및 변화관리 활동을 수행

17. Business Intelligence를 도입하고 얻고자 기대했던 사항

- 과거 성과, 과거 발생 위주 데이터를 산출

- 미래 예측, 트렌드 분석은 아님

18. 분석준비도 진단 6가지

- 분석 업무

- 분석 인력 및 조직

- 분석 기법

- 분석 데이터

- 분석 문화

- 분석 인프라