본문 바로가기

전체 글176

데이터사이언티스트 면접 산업/주제 분류 질문 비고 예상응답 산업공통Support / Confidence / Lift 을 설명하여라 여름용모델... 겨울용모델로 따로 만들수도;; 장바구니 알고리즘 단점에 대한 해결법을 제시하여라. 모든 상품에 대해서 추천이 나오지 않을 수 있다. 어떻게 할 것인가? 1. 자주사는 상품만 2. Rule이 안나오는 상품에 대해서는 어떤 p(A)->P(A) 해당 카테고리 내 베스트 상품을 넣기도 함. 딥러닝에서 부스팅 방법을 활용하지 않는 이유가 무엇이라고 생각하나? 당신은 왜 데이터 사이언티스트인가요? SKT 전무가 물어봄3가지를 잘해야하는데... 데이터 사이언티스트라고 얘기하기보단 소신을 갖고 얘기하는 편이.. 다른 경쟁자에 비해서, 어떤 우월점을 가지고 있죠? 압박이 아니라.. 최근에 딥러닝은 .. 2020. 1. 15.
재무제표 읽는 법 (기본적 분석: 주식) 현금이 많은 기업을 찾아라.현금및현금성자산이 풍부하다는 것은 기업이 매출 채권을 원활하게 현금으로 회수하고 있다는 의미이다.- Key point: 주당순현금을 계산하여라 (주당순현금 = (현금및현금성자산 - 비유동부채) / 발행주식수* 주당순현금에 기반한 주가상승은 일시적일 수 있다.* CP (Commercial paper, 기업어음)과 CD(Certificate of deposit) 양도성예금증서는 현금처럼 생각할 수 있지만, 대차대조표에 허위기재되는 경우가 많아 분리해 생각하는것이 합리적이다.비유동부채를 차감하는 이유는 1년안에 갚아야하는 유동부채는 회사내 가지고있는 매출채권으로 상쇄가 가능하다고 가정하기 때문이다.주당순현금은 주식가격을 상쇄시킬 수 있다. 아래의 예시를 들어보자. 아래는 라온시큐어라.. 2019. 12. 28.
Network analysis Network 이란? Nodes와 Ties로 구성되어있는 개체. 텍스트로 구성되어있는 것을 semantic network. Nodes: 단어/객체Ties- Ties: 정의 단어들간의 관계. 이 관계를 중요하게 고려해야한다. Co-occurence을 기준으로(Within 문장/문단/문서). 예를 들어, 문장 내에서 동시에 출현하는 것을 한 동시출현으로 볼것인지, 문단으로 볼것인지, 문서로 볼 것인지. 이 정보를 추출 하는 것이 가장 중요하다.- Weight: Co-occurences- Direction / Objective1. 단어의 공통적인 출현(단어 사이의 유사도)2. 선택된 단어에 대해서, 어떤 관계를 맺고이는지를 확인할 수 있다. 문서마다 얼마나 다른지도 확인 할 수 있음. (관계가 같다 라는 귀무.. 2019. 11. 20.
Word2vec (Distributed Representations of Words and Pharses and their compsitionality) 2013년에 인공신경망 분야의 유명한 컨퍼런스인 신경정보처리시스템(NIPS, Nueral information processing systems)에 소개된 논문입니다. 단어나, 진단명, 음식명 등과 같이 어떤 개념들을 임베딩할 때 사용할 수 있을 것 같아, 공부겸 아래와 같이 국문번역을 진행해봤습니다. 원문: Mikolov, T., Sutskever, I., Chen, K., Corrado, G. S., & Dean, J. (2013). Distributed representations of words and phrases and their compositionality. In Advances in neural information processing systems (pp. 3111-3119). Requ.. 2019. 9. 12.
images 2019. 7. 17.
SMA 2019. 7. 17.