분류 전체보기
-
[Django] MTV Pattern🍓𝗪𝗲𝗯 2020. 8. 19. 09:48
웹을 구성하는 방식으로 프레임워크 동작한다. 웹을 구성하는 요소. 분업 및 협업을 진행할 때, 이런 식으로 나눠서 하기도 함. ~.~ 공장처럼 ! 1. UI : 화면에 보여지는 인터페이스 2. Data : 화면의 내용을 구성하는 데이터 3. Logic : 내용을 구성하는 방식을 처리하는 로직 django 1. UI -> templates * templates에 html을 만들어두고, response로 줄 수 있다. django의 html 문법이 있다. 2. Data -> models.py 데이터베이스에 저장되는 데이터를 표현. 장고는 SQL을 사용하지 않아도, 파이썬으로 데이터베이스를 관리할 수 있는 ORM을 제공한다. 3. Logic -> views.py ( 핵심🌟 ) 비즈니스 로직을 처리하고 Resp..
-
[머신러닝] 머신러닝 핵심 개념🤖𝗔𝗜 2020. 8. 18. 12:28
머신러닝을 위한 핵심개념 공부 머신러닝을 위한 데이터 준비 1. 머신러닝을 위한 핵심개념 Data : 현실 세계의 어떤 현상을 관찰하여 기록한 것 ex) 심장 데이터: 심장 상태를 관찰하여 기록한 것 특징 : 1) 객관화된 자료. 2) 의미가 없다. 3) 실제 세상 표현 Feature : 데이터를 컴퓨터가 이해할 수 있도록 수치 또는 디지털로 표현/표상한 것. Model : 실제의 무엇을 더 작게 추상화된 형태로 표현한 것. 모형 또는 본보기 Machine Learning Model : 어떠한 문제를 해결하기 위해 수립한 가설을 논리적, 수학적 함수식의 형태로 표현한 것 Algorithm : 입력된 자료를 바탕으로 원하는 결과를 유도하기 위해 일련의 논리적인 순서와 절차를 규칙화한 것 ex) 순서도 Ma..
-
[머신러닝] 머신러닝 업무 프로세스🤖𝗔𝗜 2020. 8. 15. 21:57
머신러닝 업무 프로세스 (삽질 과정 ㅠㅠ) 문제파악, 문제정의 -> 데이터 준비 -> 모델 구축 & 평가 -> 결과 공유 -> 모니터링 1. 문제파악 및 문제 정의 (1) 비즈니스 문제 파악 (2) 머신러닝 문제로 전환 (3) 머신러닝 도입 필요성/가능성 체크 (4) 도입에 따른 효과검증 설계 2. 데이터 준비 (1) 가능한 다양하고 많은 데이터 확보 (2) 머신러닝을 도입할 시스템 설계 (3) 데이터 분석 및 이해 - Understanding (4) 데이터 분석 및 이해 - Preprocessing (5) 데이터 분석 및 이해 - Exploring (6) Feature Engineering (7) 학습, 검증, 테스트 데이터셋 생성 3. 머신러닝 모델 구축 & 분석 (1) 사용한 모델/알고리즘 선택 (..
-
[머신러닝] 데이터과학자, 도메인 전문성🤖𝗔𝗜 2020. 8. 15. 21:41
데이터 과학자 ?! 👩🔬 21세기의 가장 섹시한 직업.. 워후~!!!! 데이터 과학은 컴퓨터를 활용해서 데이터를 분석하고 현실의 문제들을 해결하는 것 💡 필요한 skill 1. 프로그래밍 스킬 - 머신러닝, 병렬 처리 컴퓨팅, 데이터베이스 언어(SQL) 2. 수학 & 통계학 지식 3. 도메인 전문성 - 비즈니스에 대한 이해. 협업 능력. 기획력. + 의사소통 능력. 데이터 기반 인사이트를 의사결정에 활용하는 능력. 설득력. 정리: 컴퓨터와 IT 기술을 활용하고 프로그래밍을 할 수 있는 능력을 가진 사람이 수학과 통계학 지식을 이용해서 도메인의 문제를 해결하는 사람. * 유니콘이라고도 함! 비즈니스 분석 및 기획자, 데이터 IT 직원, 데이터 과학자(중간 역할) => 팀 프로젝트. 🌟협업 🌟 어떤 비즈니..
-
머신러닝🤖𝗔𝗜 2020. 8. 14. 17:03
머신러닝 : 컴퓨터가 데이터로부터 스스로 학습을 할 수 있도록 프로그래밍하는 과학적인 활동. *과학적인 활동 : 가설 -> 검증 -> 검증... 계속 검증. 이 과정에서 데이터 사용하게 됨. 빅데이터 분석. 통계 분석. 머신러닝. -> 각각의 과정에서 얻고자하는 것이 다름. 빅데이터 분석 (그로스해킹, 마케팅) 큰 데이터를 통해서 어떠한 현상을 발견하게 되고, 상관관계를 파악하고 의사결정을 진행하게 된다. 통계분석 모형을 통해 이해하고, 해석. 모형으로 나오는 통계치, 수치, 가정이 중요하게 되고, 모형이 정확한지 확인할 필요가 생긴다. 머신러닝 많은 데이터가 있다는 가정에서 학습을 통해서 모형을 만들게 되고, 모형의 정확도와 성능 판단. 예측과 패턴 분석. ex. 스팸 분석.. 전통적인 접근 방법 1...
-
데이터 과학이란? 데이터 과학이 이슈가 된 이유🤖𝗔𝗜 2020. 8. 14. 16:55
데이터 과학 : 컴퓨터를 활용해서 데이터를 분석하고 현실의 문제를 해결하는 작업 예전에서는 경영자 직관 및 감으로 의사결정했으나, 요즘은 데이터 중심으로 선택 & 결정하게 됨. 머신러닝, 인공지능은 오래 전부터 연구된 분야이나, 최근 들어서 빛을 발휘하고 있다. 일자리를 위협할 수 있을지. 위협하지 않을지. 새롭게 어떤 일을 할 수 있을지 생각해봐야 한다. 데이터 과학의 활용 사례 PayPal과 같은 핀테크 사업에서 사기 탐지 기능을 추가함. Fraud Detection. 데이터 과학은 융합형 인재를 원한다. 많은 도메인에 대한 이해가 필요하기 때문에, 여러 학문이 섞이게 된다. Data Science는 통계학, 머신러닝, AI, Data mining 등 여러가지와 얽혀 있다. 데이터 과학의 목표 1. ..
-
Kaggle 타이타닉 데이터로 생존자 규칙 찾기.🤖𝗔𝗜/🤖광주 인공지능사관학교 2020. 8. 14. 16:37
survived : 생존=1, 죽음=0 pclass : 좌석 클래스 . 1등석=1, 2등석=2, 3등석=3 sibsp : 함께 탑승한 형제 또는 배우자 수 parch : 함께 탑승한 부모 또는 자녀 수 ticket : 티켓 번호 cabin : 선실 번호 embarked : 탑승장소 S=Southhampton, C=Cherbourg, Q=Queenstown *NaN : 결측치 전통적인 머신러닝 과정을 도입해서 공부해보기 위해서 생존자를 찾는 규칙을 만들고, 작성한 규칙을 이용해서 생존자를 판별하고, 규칙의 정확도를 분석해볼 예정이다 ! ex. 3등석이고, 성별이 남자면 죽는다.. 1등석 여자이면 살아남는다... -> 이렇게 규칙을 세웠는데... 3등석 남자이면 대부분 죽었지만, 살아남은 사람도 있었다,,!..
-
시간복잡도와 공간복잡도🧠𝗔𝗹𝗴𝗼𝗿𝗶𝘁𝗵𝗺 2020. 8. 14. 11:55
시간복잡도 : 알고리즘에 사용되는 총 연산 횟수. ( 실행 시간 아님!!! ) *연산 : + , -, / , *, =, ==, ... 함수 return 문에서 연산횟수 1이라고 생각. 코드의 효율과 알고리즘을 판단하는데 사용된다. Big-O 시간 복잡도 : 시간복잡도 함수의 가장 높은 차수. 계수 X. 시간복잡에 미치는 영향이 매우 미미하기 때문이다. aN + b = O(N) aNlogN + b = O(NlogN) aN^2 + bN + c = O(N^2) -> N의 크기가 커질수록 점점 복잡도의 차이가 커진다. 계산법칙 1 : For/While loop이 한 번 중첩될 때마다 O(N) 계산법칙 2 : 자료구조(ex. 배열) 사용, 다른 함수 호출에는 각각의 O(N) 파악. * set은 O(1). 배열.s..