Stack Building
1. AWS 시작하기 Amazon EC2 : https://aws.amazon.com/ko/ec2/?hp=tile&so-exp=below 본 예제에서의 설치버전 : Ubuntu Server 16.04 LTS (HVM), SSD Volume Type – ami-f293459c – 첫 가입시 무료로 이용할 수 있는 인스턴스 입니다. port 설정안내 – python에서 별도의 포트를 설정하지 않으면 기본으로 5000번 포트를 사용한다. – AWS에서 보안영역에서 5000번 포트를 개방하도록 설정이 필요하다. – 위치 : Console > NETWORK & SECURITY > Security Groups – 해당 인스턴스 선택 후 아래와 같이 설정해준다. 2. Python 서버 설정 step1 : 서버설정 전..
플라스크 서버에서 API 방식으로 데이터를 전송하면서 json을 payload로 사용하게 되었다. 객체나 메소드를 보내기보다 스트링을 전달하는 것이 오류 발생을 막기에 좋다. json으로 보낼 때에는 jsonify({'key':value, ...})를 return 하는 함수를 짜고, requests를 사용해 post 방식으로 url에 보내면 된다. 받아올 때에는 request.get_json()을 사용한 후 일반적인 파이썬 딕셔너리에 접근할 때처럼 접근하면 된다.
서비스 구축하기 https://blog.naver.com/n_cloudplatform/221245743135 [이렇게 사용하세요!] 나만의 LINE 챗봇(Chat Bot) 서비스 구축하기 네이버 클라우드 플랫폼에서 챗봇 서비스를 할 수 있다?!2018년 가장 관심도가 높아지고 있는 IT 서... blog.naver.com 오피셜 계정 생성 https://manager.line.biz/ LINE Business ID account.line.biz 메시지 API docs https://developers.line.biz/en/reference/messaging-api/ LINE Developers The LINE Developers site is a portal site for developers. It c..
위의 2개의 그래프에서 왼쪽에 있는 모형은 모집단의 모수식을 표현한 것이다. 즉, 우리가 궁극적으로 알고자 하는 실제의 식인 것이다. 이 경우, 모든 data 들(점)을 하나의 회귀식으로 100% 설명할 수 없다. 그래서 생각해 낸 것이 바로 오차(error) 라고 하는 것으로, 이 값은 회귀식의 값과 실제값과의 차이를 말한다. 여기에서는 어떤 하나의 점과 회귀식과의 차이를 표현한 입실론(epsilon)이 바로 오차이다. 이에 비해서 잔차(resudial)라고 하는 것은 표본의 회귀식에 나온 값이다. 표본에서도 마찬가지로 회귀식을 구할 수 있다. 그러나, 그 회귀식은 모집단의 실제 회귀식과는 차이가 있을 수 있다. 이때에 모집단의 회귀식과 마찬가지로 표본의 회귀식에서도 잔차라는 것을 생각할 수 있으며, ..
관계 데이터 모델에서 릴레이션을 조작하기 위한 연산에는 관계대수relational algebra와 관계해석relational calculus이 있다. 이 연산은 사용자 입장에서 볼 때 데이터를 처리하는 데이터 언어가 되는데, 이를 얼마나 자세하게 명시하느냐에 따라 절차언어procedural language와 비절차언어로 구분한다. 관계대수는 절차언어, 관계해석은 비절차언어로 구분할 수 있다. 1. 관계대수 "목표 데이터를 얻기 위해 어떻게 해야 하는가?" 각 연산의 피연산자operand가 모두 릴레이션이고, 결과도 릴레이션이다. 크게 일반집합연산인 합집합union, 교집합intersect, 차집합difference, 카티션 프로덕트cartesian product와 순수관계연산인 셀렉트select, 프로젝..
1. 관계 데이터 모델 관계 데이터베이스(이하 RDB)는 관계 데이터 모델에 기반을 두며, 이는 외적으로는 테이블(table) 구조이고, 이론적으로는 수학적 릴레이션을 기초로 한다. 테이블은 열column과 행row으로 이루어져 있는데, 각 열을 필드, 아이템 또는 애트리뷰트라고 부르고, 행을 레코드 또는 투플tuple이라고 한다. 예를 들어 "학생"이라는 테이블에 각 열이 "학번", "이름", "학년" 으로 존재한다면, "학생" 릴레이션의 애트리뷰트 값 "김수아"가 있다고 볼 수 있다. 관계 데이터 모델에서 가장 작은 논리적 단위는 이처럼 개개 데이터 값, 즉 애트리뷰트 값attribute이다. 이는 더 분해하려 해도 분해할 수 없어 원자값atomic value이라고도 불린다. 하나의 애트리뷰트가 취할..
Norm이란 선형대수학에서 벡터공간의 원소들에 일종의 '길이'를 부여하는 함수이다 ---위키백과 즉, '길이'를 부여함에 있어 어떤 종류의 정보에 의미를 두냐에 따라 종류가 구분된다. 1. 유클리디언 : 다차원 공간에서 두 점(p,q)간의 거리를 자로 잰거리다. 2. 마할라노비스 : 확률분포상의 거리 위와 같이 점A가 평균과 표준편차로 표현될 때 표준편차의 크기로 거리를 산정한다. 즉, 평균과의 거리가 표준편차의 몇배인지를 나타내는 값이다. A의 평균을 m, 공분산행렬을 C로 표시하였다. A의 경우 유클리디언 거리는 B가 더 가깝고 마할라노비스 거리는 C와 더 가깝다. 출처: https://tlaja.blog.me/220722933381
https://youtu.be/-tmypCjhfkE 우버 데이터 사이언티스트 수학 전공, 산업공학과 박사 데이터 사이언티스트란? ㅡ 회사마다 role이 다르다. 회사 규모와 니즈(알고리즘의 복잡도/개발과 유지보수의 초점)에 따라 다름 ㅡ 애널리스트: 분석 (ex. 얼마나 이득을 얻을 수 있나 등) ㅡ 사이언티스트: 분석결과를 알고리즘으로 변환 ㅡ 엔지니어: 비즈니스 과정을 코딩 빅데이터=머신러닝=인공지능 데이터를 가지고 분석을 할것인지 모델을 만드는지에 따라 이름은 조금씩 다르지만, 기초 방법론은 모두 비슷 하는 일? ㅡ 대부분 "예측" ㅡ 여태까지 데이터를 보고 기존 알고리즘과 새로운 알고리즘의 비교 및 분석 ㅡ 소비자 데이터를 보고 어떤 광고를 좋아할지 예측 ㅡ 클릭할 확률을 예측 하루 일과? ㅡ 현..
확률(Probability) vs 가능도(Likelihood) 김진섭June 5, 2016 시작하면서 확률 연속사건의 확률 특정 사건의 확률은 모두 0 특정 구간에 속할 확률: 확률밀도함수(Probability Density Function, PDF) 특정 사건이 일어날 가능성을 비교할 수는 없을까?: 가능도(Likelihood) 사건이 여러 번 일어날 경우에서의 가능도 진실을 찾는 방법: 최대가능도 추정량(Maximum Likelihood Estimator, MLE) 예1: 모양이 일그러진 동전 예2: 나의 실제 키 마치며 시작하면서 본 챕터에서는 가능도(Likelihood) 가 무엇인지 직관적으로 이해하는 것을 목표로 한다. 가능도는 정규분포부터 회귀분석과 최신 인공지능 알고리즘에 이르기까지 통계학의..
1. 3단계 데이터베이스 스키마란 데이터베이스의 구조와 제약조건에 대한 명세다. 스키마에는 개체(엔터티), 속성(애트리뷰트), 관계(relationship)에 대한 정의와 제약조건이 포함된다. 그러나 누가 데이터베이스를 보고 있느냐에 따라 스키마는 상이하다. 때문에 관리 측면에서 데이터베이스는 크게 사용자(외부 단계), 사용자 개개인의 모든 뷰를 종합한 것(개념 단계), 물리적 저장 장치의 뷰(내부 단계)의 3단계로 분류하여 기술하고 그들의 관계를 정의한다. 각 단계에서의 스키마는 단계의 이름을 따 외부 스키마, 개념 스키마, 내부 스키마라고 한다. (1) 외부 스키마 개개 사용자를 위한 것으로, 여러 형태의 외부 스키마가 존재할 수 있다. 공용을 위한 것이라기보다 특정 응용만을 위한 한정된 논리의 자료..