산업/주제 분류

 질문

 비고

 예상응답
 산업공통

Support / Confidence / Lift 을 설명하여라

 여름용모델... 겨울용모델로 따로 만들수도;; 
  장바구니 알고리즘 단점에 대한 해결법을 제시하여라. 모든 상품에 대해서 추천이 나오지 않을 수 있다. 어떻게 할 것인가?    1. 자주사는 상품만 

2. Rule이 안나오는 상품에 대해서는 어떤 p(A)->P(A) 해당 카테고리 내 베스트 상품을 넣기도 함.

 

딥러닝에서 부스팅 방법을 활용하지 않는 이유가 무엇이라고 생각하나? 

  
 

당신은 왜 데이터 사이언티스트인가요? 

  SKT 전무가 물어봄

3가지를 잘해야하는데...
데이터 사이언티스트라고 얘기하기보단 소신을 갖고 얘기하는 편이.. 

  다른 경쟁자에 비해서, 어떤 우월점을 가지고 있죠? 압박이 아니라..  
 

 최근에 딥러닝은 ROI가 안좋아

  
  당신을 왜 뽑아야하나요?  
 

 데이터 엔지니어

 

1. 대용량 인프라구축

2. 로그 플로우 디자인

3. 실제 서비스 인프라의 베이스라인을 잡음 

  머신러닝 엔지니어 

빅데이터 인프라 활용

현실 서비스에 유용한 feature를 적용 및 서비스 개선

연구의 현실성/타당성을 검증한 뒤 실제적용 

  선행연구 엔지니어

 계속 갈 수는 없을듯? 예) 네이버렙스->분사. 카카오AI도 마찬가지.

논문이나 선행 획득해야하는 기술을 follow up

가장 관심이 높은 분야

모두 살아남기 어렵다 

 CRM

모든 고객의 가치는 동일한가? 악플을 다는 사람은 어떤 가치인가?

1. 돈을 많이 쓰는 고객

2. 일반고객

3, 불량고객 

Background: 본인이 잘 아는 부분에 대해, 악플을 많이 달긴 하더라. 전체서비스에 대해 불만이 다 있는 것은 아니고, 특정 컨텐츠에 대해서만 불만이 있거나 

 

 비용관점 vs 모객 관점?

유지비용보다 더 큰 이익이 되는 고객만 vs 고객 한명이라도 더 모집 

 
 

 자발적 이탈 vs 비자발적 이탈

예) 비자발적 이탈: 사용요금 미수

자발적이탈모델을 만들 때는 비자발적 이탈 사용자는 제외하고 모델을 만들어야함.

 

 조기사망/사고사/자연사

- 게임사: 게임 컨텐츠를 충분히 즐기고 그만두는 경우 

- 사고사: 중간에 다른 외부요인으로 그만두는 경우

- 조기사망: 조기 이탈

 

 화장품(아모레퍼시픽) - CRM

 한 번만 (단일 구매 행동) 구매전략을 세우기 위해서, 분석대상에 포함시킬 것 인가?   한번만 사는 사람들은 자기 니즈에 있어, 크로스셀링의 관점에서는 고객이 아닐 수 있다(?)
  카테고리까지는 추천해주는 경우는 안산제품중에서 어떻게 추천해줄것인가? 특정제품을 더 추천해줄것인가? 아니면 카테고리까지만 보여줄것인가?  해당 트렌젝션(립스틱)이 발생한 경우,  A:최대판매량, B:MD추천, C: 인구학적정보가 유사한 인구가 많이 산 제품 등

항공사

 신규 노선 또는 부진노선을 이용할 확률이 높은 고객을 사전에 예측하고, 그 고객의 속성을 파악할 수 있다면?

Background:  항공사는 대부분 에이전시를 이용해서 판다. 

 상용수송: 사람을 태우는게 아니라, 화물운송등.. (여행이 45% 나머지가 55%가 화물운송)

- 대부분 노선을 1회 이용한다.2~5회 이상은 왔다갔다하는 거일 수 있음

- 대상기간 내 한번만 가는 경우-> 연관성분석하기가 어려움.

- 과거 노선이 현재 폐지되었을 수 있음.

- 한 도시에 여러 공항이 생겨있을 수 있음.

 - Web graph로 시각화 하여+ Assocication Rule 적용 (룰적용시에는 min_sup을 결과보면서 조정을 해야할 듯)


Support 을 기본적으로 보고, Lift 1이상을 보는 게 좋을듯

 컨텐츠(카카오)

 서비스 이탈 vs 작품이탈

지금까지 쭉 읽고있었는데, 매일보다가 안들어오는 경우. 전체 컨텐스 서비스가 아니라, 서비스내 작품 내 관점

이탈이 되기전 관리하자

 

 

이탈 가능성 변수를 생성 

 

[열람패턴]

작품수와 열람수가 줄어드는자

열람 패턴이 불규칙한지

여 장르를 보는사람이 낮고

영화 또는 방송만 보는 사람은 이탈가능성이낮다

최신편수가가 많을수록 가능성 낮음

[작품] 연재종료/휴재 

[유상구매] 유상구매를 하는 사람일수록

[이탈경험] 복귀기간, 이탈경험

[환경] 여러 단말기일수록 낮을듯

컨텐츠(NC소프트)

 프로젝트 했던 과정에 대한 질문

 실무진면접

 
 

 입사 후 진행하고 싶은 프로젝트에 대화

  

 

 전직장 퇴사이유에 대한 질문

 

 

 카카오

#graph 이론
#tree 이론
#quick_sort 구현
#divide and conquer이 쓰인 유명한 알고리즘 예시
#l1, l2 차이 비교. 하는 이유
#likelihood의 개념, 확률과 likelihood의 차이
#코드에서 time이 얼마나 걸릴지? O(n2) 등등 
  
    


딥러닝은 병렬처리 가능/ SVM은 병렬처리의 최적화가 어렵다다던데;;


Background


고객획득과정: 예) 5억들어 MASS 광고(방문자 10만명) -> 2주생존율 (10%, 방문자 1만명) -> 구매 전환율 (50%, 방문자 5천명).

AARRR: 고객 획득과정:

 -> Acqusition, Activation, Retention, Referral, Revenue 구매전환율을 고려해서 역산해서 광고비를 계산해서 비용을 산정하기도 함

https://www.greensystem.vn/en/blog/product-manager-framework-aarrr-metrics.html


신용평점모형(평점표 모형, Scorecard model)




Abbreviations


 CLTV(Customer Life Time value)

 AARRR model: Acqusition, Activation, Retention, Referral, Revenue 


반응형

'Data science' 카테고리의 다른 글

오토마우스: 간호사, 의사 보수교육 사이버연수 자동클릭  (0) 2022.10.29
Data structure  (0) 2020.01.28
Network analysis  (0) 2019.11.20
Undersampleing & Oversampling  (0) 2019.07.08
Regular expression  (0) 2019.03.12

+ Recent posts