본문 바로가기

전체 글176

Regular expression Python []: 대괄호 내 존재하는 문자열 내 하나를 가리킨다.>>> [] R 2019. 3. 12.
머신러닝 모델 분류 구분하는 3가지 기준지도/비지도/준지도/강화 학습 온라인 학습 /배치 학습사례 기반 학습/ 모델 기반 학습 배치학습: 가용한 데이터를 모두 사용해서 훈련시킨 모델. 더 이상의 훈련이 진행되지 않고, 훈련은 주로 리소스를 많이 필요로 하기 때문에, 오프라인 학습이라고도 한다. 배치학습을 새롭게 업데이트 하려면, 이전에 훈련된 데이터를 포함하여 더 많은 데이터를 이용해서, 새롭게 모델을 학습시킨다음에 모델을 교체(replace)해야한다.온라인 학습데이터를 순차적으로 한 개씩 또는 Mini-batch라 불리는 작은 묶음 단위로 주입하여 훈련하는 시스템이다. 작은 단위씩 학습 되기 때문에, 학습에 들어가는 리소스가 적은 편이고, 데이터를 수집하고 모델이 들어가는만큼 바로 학습이 된다. 모델의 학습이 즉각적으로 .. 2019. 3. 12.
Reshape and Pivot table 데이터가 아래와 같을 때, 변환하는 과정을 Pivoting이라고 한다. 데이터베이스에 들어가는 로그는 업데이트를 하면 안된다. 그렇기 때문에 아래로 길어야하는 ROW 데이터 형식으로 로그형식을 나타내야한다. 단점은 사원번호가 변경되야할 경우가 있는데, 그럴경우는 row 포맷은 사용할 수 없다. 계속 축적되야하는 경우네는 row포맷으로 넣는다.------------------사원번호, 요일, 매출액2019253322,월,1002019253322,화,2002023738232,월,2002023738232,화,300 ---------------- 아래의 wide포맷은 row 포맷으로부터 바꿔 사용할 수 있다. 그렇게 될경우 전체 사원번호를 관리하기도 편하다. 사원정보는 변경되할 필요는 wide포맷으로 넣는다.-.. 2019. 3. 8.
1. 기본자료형, Python Built-in Code print("{1} {0} {owner} blog".format("this", "is", owner="lemoncandy's")) 본글에서는 파이썬의 기본 자료형(문자열, 논리, 기본연산자 등)을 다루고, 이에 대한 예시를 들어 독자의 설명을 돕고자합니다. 파이썬 & 객체파이썬의 중요한 특징 중 하나는, 객체 모델이다. 숫자, 문자열, 자료구조, 함수, 클레스, 모듈은 모두 파이썬 객체라는 것으로, 객체라는 것에 저장된다. 이 객체에 해다하는 자료구조들에 대한 것만 살펴보도록한다. 파이썬의 자료구조는 크게 4가지로 분류할 수 있는데, 문자열(String), 리스트(List), Tuple(튜플), 사전(dictionary)에 해당된다. 추가하자면 파일 등을 덧붙일 수 있을 것 같다. 아래는 파이썬 내장 자.. 2019. 3. 5.
Vatech : 덴탈이미징 No.1 (KOSDAQ: 043150), English 바텍은 덴탈이미징 의료기기 판매 회사이다. 주 품목은 3D, 2D x-ray이다. 의료기기이다보니, 의료기기의 산업특성을 띈다. 산업분석의료기기 산업특성: 다품종 소량생산. 미인허가 측면에서 국가간 인증제도가 상이하다. 교육에서는 비관세이긴하나, 미국 FDA의 인허가에 소요되는 기간이 7.2개월 중국은 13개월 정도걸린다고 한다. 즉, 개발하고, 해외로 수출하기 위한 장벽이 비교적 큰 산업구조이긴하다. 반대로 말하면 바텍이 가지고있는 의료기기 포지션은 다른 회사들이 진입하기엔 이 이정도의 기간이 필요하다고 생각 할 수 있다. 따라서, 실제 시장 진입을 위한 기간은 신규 회사들이 진입하기가 더 어려울 수 있다.인지도와 브랜드 파워: 의료기기 특성상, 마케팅 장벽과 충성도가 높다. 의료기기는 의료진들이 선택.. 2019. 3. 3.
2. 추론 통계(Inferential statistics) 통계의 두 가지 타입이 있는데, 하나는 기술통계이며 또하나는 추론통계이다. 기술 통계는 주어진 데이터의 분포나 빈도, 평균 등의 통계량을 통해서 데이터를 설명하기 위한 목적이라면, 추론통계의 목적은 주어진 데이터(sample)을 이용하여 모집단의 특성(모수)를 추론하는 것이다. 주로 추론 통계는 가설검정을 이용하여, 모수를 판단한다. 주로, 추론 통계는 1) 가설 설정 -> 2) 데이터 수집 -> 3) 귀무가설의 기각 여부를 결정하는 방법으로 이루어진다. 가설(Hypothesis)가설(Hypothesis): 주어진 사실 혹은 조사하고자 하는 사실이 어떠하다는 주장이나 추측을 의미한다.* 주의: 통계에서 의미하는 가설과 연구가설을 다르다. 연구 가설은 연구의 주제가 될 만한, 가정을 의미하는 것이지만 통계.. 2019. 2. 24.