산업/주제 분류 |
질문 |
비고 | 예상응답 |
산업공통 | Support / Confidence / Lift 을 설명하여라 | 여름용모델... 겨울용모델로 따로 만들수도;; | |
장바구니 알고리즘 단점에 대한 해결법을 제시하여라. 모든 상품에 대해서 추천이 나오지 않을 수 있다. 어떻게 할 것인가? | 1. 자주사는 상품만 2. Rule이 안나오는 상품에 대해서는 어떤 p(A)->P(A) 해당 카테고리 내 베스트 상품을 넣기도 함. | ||
딥러닝에서 부스팅 방법을 활용하지 않는 이유가 무엇이라고 생각하나? | |||
당신은 왜 데이터 사이언티스트인가요? | SKT 전무가 물어봄 | 3가지를 잘해야하는데... | |
다른 경쟁자에 비해서, 어떤 우월점을 가지고 있죠? | 압박이 아니라.. | ||
최근에 딥러닝은 ROI가 안좋아 | |||
당신을 왜 뽑아야하나요? | |||
데이터 엔지니어 | 1. 대용량 인프라구축 2. 로그 플로우 디자인 3. 실제 서비스 인프라의 베이스라인을 잡음 | ||
머신러닝 엔지니어 | 빅데이터 인프라 활용 현실 서비스에 유용한 feature를 적용 및 서비스 개선 연구의 현실성/타당성을 검증한 뒤 실제적용 | ||
선행연구 엔지니어 | 계속 갈 수는 없을듯? 예) 네이버렙스->분사. 카카오AI도 마찬가지. | 논문이나 선행 획득해야하는 기술을 follow up 가장 관심이 높은 분야 모두 살아남기 어렵다 | |
CRM | 모든 고객의 가치는 동일한가? 악플을 다는 사람은 어떤 가치인가? | 1. 돈을 많이 쓰는 고객 2. 일반고객 3, 불량고객 | Background: 본인이 잘 아는 부분에 대해, 악플을 많이 달긴 하더라. 전체서비스에 대해 불만이 다 있는 것은 아니고, 특정 컨텐츠에 대해서만 불만이 있거나 |
비용관점 vs 모객 관점? | 유지비용보다 더 큰 이익이 되는 고객만 vs 고객 한명이라도 더 모집 | ||
자발적 이탈 vs 비자발적 이탈 | 예) 비자발적 이탈: 사용요금 미수 | 자발적이탈모델을 만들 때는 비자발적 이탈 사용자는 제외하고 모델을 만들어야함. | |
조기사망/사고사/자연사 | - 게임사: 게임 컨텐츠를 충분히 즐기고 그만두는 경우 - 사고사: 중간에 다른 외부요인으로 그만두는 경우 - 조기사망: 조기 이탈 | ||
화장품(아모레퍼시픽) - CRM | 한 번만 (단일 구매 행동) 구매전략을 세우기 위해서, 분석대상에 포함시킬 것 인가? | 한번만 사는 사람들은 자기 니즈에 있어, 크로스셀링의 관점에서는 고객이 아닐 수 있다(?) | |
카테고리까지는 추천해주는 경우는 안산제품중에서 어떻게 추천해줄것인가? 특정제품을 더 추천해줄것인가? 아니면 카테고리까지만 보여줄것인가? | 해당 트렌젝션(립스틱)이 발생한 경우, A:최대판매량, B:MD추천, C: 인구학적정보가 유사한 인구가 많이 산 제품 등 | ||
항공사 |
신규 노선 또는 부진노선을 이용할 확률이 높은 고객을 사전에 예측하고, 그 고객의 속성을 파악할 수 있다면? |
Background: 항공사는 대부분 에이전시를 이용해서 판다. 상용수송: 사람을 태우는게 아니라, 화물운송등.. (여행이 45% 나머지가 55%가 화물운송) - 대부분 노선을 1회 이용한다.2~5회 이상은 왔다갔다하는 거일 수 있음 - 대상기간 내 한번만 가는 경우-> 연관성분석하기가 어려움. - 과거 노선이 현재 폐지되었을 수 있음. - 한 도시에 여러 공항이 생겨있을 수 있음. | - Web graph로 시각화 하여+ Assocication Rule 적용 (룰적용시에는 min_sup을 결과보면서 조정을 해야할 듯) Support 을 기본적으로 보고, Lift 1이상을 보는 게 좋을듯 |
컨텐츠(카카오) |
서비스 이탈 vs 작품이탈 |
지금까지 쭉 읽고있었는데, 매일보다가 안들어오는 경우. 전체 컨텐스 서비스가 아니라, 서비스내 작품 내 관점 이탈이 되기전 관리하자 | |
|
이탈 가능성 변수를 생성 |
| [열람패턴] 작품수와 열람수가 줄어드는자 열람 패턴이 불규칙한지 여 장르를 보는사람이 낮고 영화 또는 방송만 보는 사람은 이탈가능성이낮다 최신편수가가 많을수록 가능성 낮음 [작품] 연재종료/휴재 [유상구매] 유상구매를 하는 사람일수록 [이탈경험] 복귀기간, 이탈경험 [환경] 여러 단말기일수록 낮을듯 |
컨텐츠(NC소프트) |
프로젝트 했던 과정에 대한 질문 |
실무진면접 | |
입사 후 진행하고 싶은 프로젝트에 대화 | |||
|
전직장 퇴사이유에 대한 질문 |
| |
카카오 | #graph 이론 #코드에서 time이 얼마나 걸릴지? O(n2) 등등 #tree 이론 #quick_sort 구현 #divide and conquer이 쓰인 유명한 알고리즘 예시 #l1, l2 차이 비교. 하는 이유 #likelihood의 개념, 확률과 likelihood의 차이 | ||
딥러닝은 병렬처리 가능/ SVM은 병렬처리의 최적화가 어렵다다던데;;
Background
고객획득과정: 예) 5억들어 MASS 광고(방문자 10만명) -> 2주생존율 (10%, 방문자 1만명) -> 구매 전환율 (50%, 방문자 5천명).
AARRR: 고객 획득과정:
-> Acqusition, Activation, Retention, Referral, Revenue 구매전환율을 고려해서 역산해서 광고비를 계산해서 비용을 산정하기도 함
https://www.greensystem.vn/en/blog/product-manager-framework-aarrr-metrics.html
신용평점모형(평점표 모형, Scorecard model)
Abbreviations
CLTV(Customer Life Time value)
AARRR model: Acqusition, Activation, Retention, Referral, Revenue
'Data science' 카테고리의 다른 글
오토마우스: 간호사, 의사 보수교육 사이버연수 자동클릭 (0) | 2022.10.29 |
---|---|
Data structure (0) | 2020.01.28 |
Network analysis (0) | 2019.11.20 |
Undersampleing & Oversampling (0) | 2019.07.08 |
Regular expression (0) | 2019.03.12 |