본문 바로가기

분류 전체보기200

버크셔 헤서웨이(Berkshire Hathaway) 미국시간 2019년 2월 22일 (금) 나스닥이 1~2%나 상승하는 가운데, 버크셔헤서웨이만 -2.5%이상 하락하였다. 이유는 캐첩회사로 유명한 Kraft Heinz가 -27%나 빠지면서인데, Kraft Heinz는 버크셔헤서웨이가 6번쨰로 많이 가지고 있는 주식 중 하나이기 때문이다. 2019.02.22.Kraft Heinz Co. 크레프트 헤인즈(KHC)는 가공식품(packaged food: 포장식품)으로 유명한데, 마카로니&치즈, 토마토 케첩이 주 식품이나. 이 회사가 -27%나빠지면서, 버크셔헤서웨이도 장부상 감가상각을 해야하기때문에, 자산평가에 불익이어서 시장에서 민감하게 반응해서 -2%이상 하락한 것으로 보인다. 원래 크레프트 헤인즈는 케시카우가 캐첩이기 때문에, 우리가 매일 구매해야하는 특성.. 2019. 2. 24.
SVM (Support Vector machine) 1980년대 이전에는 Linear한 방법으로만 학습을하고, 분류하는 것이 이루어졌다. 그 이후인 1980년대에는 비선형기법으로 Decision Tree와 NN을 이용하여 비선형인 방법을 이용하려고 했지만, 학습하는데 있어 local minima등이 해결이 안되어 모델에 제한이 있었다. 그이후 컴퓨터학습이론이 개발되면서 효율적으로 학습이가능한 비선형 머신러닝기법이 생겨났다. 앞에서 언급한것처럼, 1980년전에는 2차원에서는 선형방법은 데이터가 있을 때, Postive / Negative와 같이 두 분류로 결정된다. SVM은 유사하게 2차원에서의 선을 한 차원 더 올려서 3차원에서 plane 형태로 만들어거 분류하고자 하는게 가장 핵심적인 컨셉이다. SVM을 이해하기 위해서는 3가지의 개념을 이해해야하는데,.. 2019. 2. 23.
1. 확률변수와 확률분포 확률변수(Random variables)사건이 발생할 종류에 원하는 숫자를 대입한 것. 예) 동전 던지기와 같이 앞면이 2번 발생한 경우를 X= 2, 1번 발생한 경우를 X=1라고 할 수 있다. 확률변수는 2가지 종류가 있는데 다음과 같다.이산확률변수(Discrete random variables): 셀 수 있는 특정한 값으로 구성(값이 유한, finite). 이러한 확률변수에 대한 함수를 확률질량함수(Probability mass function)이라고 부른다.연속확률변수(Continuous random variables): 연속형이거나 무한한 경우와 같이 셀 수 없는 학률변수. 이러한 확률변수에 대한 함수를 확률밀도함수(probability density function)이라고 부른다. * 참고로, .. 2019. 2. 17.
Decision Tree (의사결정나무) 비선형 회귀 모델(상호작용모델)의 경우에는 만일 선형회귀식내에 다뤄야할 피쳐수가 너무 너무 많은경우에는 이러한 경우에 설명이 잘 되지 않는다. 비선형 회귀모델에서 이러한 방법을 대체할 수 있는 방법이 Partition이다. 이렇게 나누는 과정을 계속계속 나누다는 과정을 recursive partitioning이라고 부른다. 예측 나무는 나무를 이용하여 나누는 과정을 표현한다. 나무의 Terminal node와 leaves는 각 파티션의 한 부분을 의미한다. 위에서부터 각 x들이 어디에 속할지를 파악하기위해 root node부터 시작한다. 그리고 피쳐에 대해서 계속 질문을 해나가서면서 if else 형식으로 분류해 나간다. 또한 이러한 변수들은 모두가 같은 데이터타입의 형식이 아니어도된다. 어떤것은 연속형.. 2019. 2. 15.
경동나비엔 BM 분석 (KOSPI 009450), (English), Kyung Dong Navien 경동나비엔 - 회사탐방 (2018.07) Kyung Dong Navien, Company explorative visit IRKOR: 동사는 보일러 전문 제조업으로, 국내 140 만대의 보일러시장에서 Market share 1위 (30%)을 차지하는 기업이다. 최근 국내의 평 이한 성장률에 따라, 국내보다는 해외사업에 초점을 두고 있다. 1993년도는 북경, 2006년도는 상해와 미 국, 2008년도는 미국과 러시아, 그리고2014년도는 유럽지역까지 해외진출 로를 확보해나고 있다. 2006년도 상해는 석탄으로만 발전하기 시 기인 당시 진출하였고, 미국 경우 보일러가 아닌 ‘온수기 시장’으로 진출하였다. 당시 미국은 저가형, 저탕식 온수기가 주 시장이었 기 때문에, 계속해서 가열해야하는 불필요함 이 있었다.. 2019. 2. 15.
Pandas Dataframe Manipulation 파이썬에서 데이터프레임은 자체적으로 지원하지 않기 때문에, 데이터를 분석하는 분석가 입장에서는 판다스 객체를 따로 배워야한다. 판다스 객체를 핸들링하는 방법이 여러가지 있는데, 어떤 메소드들이 있고, R과 SQL에 익숙한 사용자들이 비교하기 쉽게 이해하는게 기억에 쉬울 것 같아 아래의 컨텐츠를 작성했다. Pandas Series 객체Pandas Series는 인덱싱된 1차원의 배열이다. 리스트나 배열로 부터 만들 수 있다. 앞에 인덱싱이 있기 때문에, 데이터프레임처럼 생겼는데 사실은 1차원이다. 12345678910import pandas as pddata = pd.Series([1,5,4,3,2])data --출력결과--0 11 52 43 34 2dtype: int64cs pd.Series.values.. 2019. 2. 14.