본문 바로가기

공부 이야기/그냥 찾아보는 공부

ADsP 단답형 정리 - 활용 1. 제 3의 변수 Z에 조건화 해서 X와 Y를 산출하는 상관계수는? -> 편상관 2. 여러 대상 간의 관계에 대한 수치적 자료를 이용해 유사성에 대한 측정치를 상대적 거리로 시각화하는 방법은? -> 다차원 척도법 3. X축을 특이도, Y축을 민감도로 그려지는 분류모형 평가용 그래프는? -> ROC 그래프 4. 일련의 개체 또는 사건들 간의 규칙을 발견하기 위해 사용되는 대표적인 정형 데이터 마이닝 기법은? -> 연관성 분석 5. n개의 관측값으로 나누는 군집분석 중 가까운 군집끼리 순차적으로 합해가는 방법은? -> 응집분석 6. 연관성분석의 평가 측도 세 가지 -> 지지도 / 신뢰도 / 향상도 7. 분석 결과 평가 방법 두 가지 -> 정확도 / 재현율(민감도) 8. 분해시계열 분석에서 고정된 주기를 가.. 더보기
ADsP 단답형 정리 - 기본 1 1) IoT를 통해 생산된 데이터를 저장해 두고 이 데이터를 3rd party에 API를 통해 공개하여 활용하는 것 -> 빅데이터의 활용 2) 페타바이트 생산성 향상 -> 발견에 의한 문제해결 -> 의사결정 향상 -> 새로운 고객가치와 비즈니스 창출 4) 다차원의 데이터를 대화식으로 분석하기 위한 소프트웨어 -> OLAP 5) 데이터 기반 의사결정을 지원하기 위한 리포트 중심의 도구 -> BI (Business Intelligence) 6) 의사결정을 위한 통계적이고 수학적인 분석에 초점을 둔 기법 -> Analytics 7) 총체적 접근법 / 인문학적 접근 -> 데이터 사이언티스트 8) 빅.. 더보기
데이터 분석 중간 정리 (4/4) # 산포, 사분위수 - 산포란 정중앙을 벗어난 타겟의 정도 - 사분위수 데이터 범위를 4개로 나눈 것으로 중심 위치를 나타내는 대표값이다. - 사분위수 범위를 이용하면 표본의 산포를 나타낼 수 있다. # 변수 축소, 주성분분석 - 기존 변수보다 적은 개수로 전체 자료의 변동을 설명할 수 있도록 선형/비선형 결합으로 새로운 변수를 생성하는 것 - 주성분분석과 연관이 있으며 다변량 자료 분석에 이용하는 방법으로 독립변수만 분석에 사용 - 차원 축소를 통해 자료의 시각화에 도움을 줄 수 있으며 회귀분석에도 적용 가능 - 변수들의 선형결합으로 이루어진 주성분은 서로 독립 - 부분최소제곱법이란 독립변수와 종속변수의 변동성을 가장 잘설명할 수 있는 새로운 변수를 설정하고 이들의 관계를 통해 종속변수와 독립변수의 인.. 더보기
데이터 분석 중간 정리 (3/4) # 연관 규칙 계산 1) 지지도 - 키워드 포함 / 전체 2) 신뢰도 - 키워드 포함 / 앞키워드 포함 # 단답형 1) 비정형 데이터마이닝 분석 방법 중 특정기간별 발생 문서량의 추이를 분석하는 것 -> buzz 분석 2) matrix(c(1:12),3.4) -> 1 4 7 10 2 5 8 11 3 6 9 12 3) 연관분석을 수행하기 위해 빈발 아이템 집합과 연관규칙이라고 하는 두 가지 형태로 표현하는, 연관성 분석을 수행하는 대표적인 1세대 알고리즘 -> 어프라이어리 알고리즘 - 최소지지도를 갖는 연관규칙 4) NaN : 수학적으로 불가능한 오류를 표시 5) 자료의 위치를 나타내는 척도의 하나 / 전체의 중앙에 위치하는 수치 / 자료의 분포가 비대칭인 경우 자료의 중심을 파악할 수 있는 방법 -> m.. 더보기
데이터분석 중간 정리 (2/4) # 분포의 종류, 검정통계량 반복적으로 관측되는 결과를 집합적으로 살펴보면 특정적으로 분포의 경향을 이루는 것을 확인할 수 있고 도출된 분포를 검정통계량에 활용할 수 있다. 즉, 검정통계량은 표본데이터에서 계산되는 값이고 특히 가설 검정 및 p-value 산출에 사용한다. dermabae.tistory.com/145 분포와 검정통계량 어떤 집단에서 개개의 관측값들을 측정하거나 혹은 동일한 현상에 대해 반복적으로 관측된 결과들을 집합적으로 살펴보면 특징적인 분포를 이루는 경향이 있다. 그러므로 우리가 연구를 통해 dermabae.tistory.com - 종 모양을 띄는 대칭형태의 분포를 정규분포라고 한다. - 이때 표준편차 값이 1인 정규분포는 표준정규분포라고 하고 평균 값을 통해 크기를 검정할 때 Z-검.. 더보기
데이터 분석 중간 정리 (1/4) # 1~48 (주관식 포함) # index [ 함수 / 데이터프레임 / 측도와 척도 / 카이제곱 문제 유형별 정리 # 함수, 데이터프레임 1. 결측치 (N/A, Not Available) 값 제거 -> na.omit(데이터프레임명) # 데이터프레임 2. 변수를 벡터로 추출하는 법 - [[index]].[["변수명"]] - 데이터프레임명$변수명 - [index].["변수명"] - 데이터프레임[[행번호]] # 함수, 데이터프레임 3. apply(데이터프레임명,1/2,통계량) - 1 : 행, 2 : 열 - 통계량 : mean - for, while문과 달리 루프문을 사용하지 않고도 간결하게 데이터를 산출할 수 있음 - lapply (데이터프레임명,통계량) -> list + apply로 리스트형으로 출력 ※ 리.. 더보기
ADsP - 데이터 이해 ~ 데이터 분석 기획 10 / 10 / 40 문제 1과목과 2과목은 합해서 20문제가 나오기 때문에 집중공략할 대상은 아니지만 과락은 면해야 한다. 1. 문제 유형별 키워드 2. 주관식 별도 정리 단어 : 빅데이터 분석, 데이터웨어하우스 1. 빅데이터 분석에 경제성을 제공 -> 클라우드 컴퓨팅 - 온프레미스로 구축할 필요 없이 소정의 이용 대금으로 대형 네트워크망 및 데이터망 구축 가능 2. 의외로 빅데이터 분석의 특성이 아닌 것 - 모든 데이터를 많이 활용하는 것 - 다양한 대상보다는 주요한 대상에 집중해야 함 - 막대한 비용은 걸림돌이 아님 - 경험에 따른 추측에 의한 인사이트 3. 오류에는 로직 오류 / 프로세스 오류로 나뉜다. 4. DIKW : data, information, knowledge, .. 더보기
What's new in Android 11, 부드러운 키보드 팝업을 구현 www.youtube.com/watch?v=acC7SR1EXsI&feature=youtu.be 유투브에서 댓글을 남기거나 움직이는 애니메이션 화면에서 글을 남길 때 특히 키보드가 턱하고 올라온다. 아! 구글형~ 키보드 왜 이래~ 좀 더 seamless하게 올라오면 안될까~? 안드로이드 11에선 이를 WindowInsetsAnimation을 이용해서 좀 더 부드럽게 키보드를 올라올 수 있도록 하 였다. 심지어 드래그를 이용해서 사용자가 원하는 수준만큼만 올라올 수 있도록 조종을 할 수 있다! 그럼 이를 어떻게 구현했을까? 1. ime Options과 화면 간의 동기화를 맞추는 방식으로 구현했다. 2. 키보드가 올라오는 과정을 하나의 생명주기로 구현했다. 3. SimpleImeAnimationControll.. 더보기