🤖𝗔𝗜/🤖광주 인공지능사관학교
-
2020.9.24 광주 인공지능사관학교 무박 2일 해커톤 후기🤖𝗔𝗜/🤖광주 인공지능사관학교 2020. 9. 25. 18:33
9월 24일 14:00 PM부터 9월 25일 06:00 AM 까지 광주인공지능사관학교 온라인해커톤을 진행했다! 무박으로 코딩 행사 대회에 처음 참여하는 거였고 심지어 온라인은 더더더욱 처음이었다. 밤을 잘 새지 못하는 평소 내 모습을 보면서 약간 걱정도 되었고 ,, 정해진 시간 안에 기획, 디자인, 개발, 발표 자료제작까지 해야한다니.. 재밌을 것 같으면서도 두근두근..! 😮 우리 팀은 해커톤 주제가 '언택트 시대에 맞는 데이터를 활용한 웹서비스 제작'이라고 사전에 미리 공지되었기 때문에, 대략적인 기획과 디자인에 대해서 이야기를 미리 준비해두었다. 🧡 기획배경 🧡 우리 팀의 주제는 " 시를 랩으로, AI와 함께하는 최고의 음유시인 래퍼 경연대회 플랫폼 " 인공지능 웹서비스다! 기획하게 된 계기는 코로나..
-
Kaggle 타이타닉 데이터로 생존자 규칙 찾기.🤖𝗔𝗜/🤖광주 인공지능사관학교 2020. 8. 14. 16:37
survived : 생존=1, 죽음=0 pclass : 좌석 클래스 . 1등석=1, 2등석=2, 3등석=3 sibsp : 함께 탑승한 형제 또는 배우자 수 parch : 함께 탑승한 부모 또는 자녀 수 ticket : 티켓 번호 cabin : 선실 번호 embarked : 탑승장소 S=Southhampton, C=Cherbourg, Q=Queenstown *NaN : 결측치 전통적인 머신러닝 과정을 도입해서 공부해보기 위해서 생존자를 찾는 규칙을 만들고, 작성한 규칙을 이용해서 생존자를 판별하고, 규칙의 정확도를 분석해볼 예정이다 ! ex. 3등석이고, 성별이 남자면 죽는다.. 1등석 여자이면 살아남는다... -> 이렇게 규칙을 세웠는데... 3등석 남자이면 대부분 죽었지만, 살아남은 사람도 있었다,,!..
-
[머신러닝] Boosting, GradientBoosting, 분류 알고리즘 정리🤖𝗔𝗜/🤖광주 인공지능사관학교 2020. 8. 12. 16:59
Boosting : 여러 개의 분류기가 순차적으로 학습을 수행하되, 앞에서 학습한 분류기가 예측이 틀린 데이터에 대해서 올바르게 예측할 수 있도록 다음 분류기에게 가중치(weight)를 부여하면서 학습과 예측을 진행. 분류기에 약한 학습기를 사용 약한 학습기 : 예측 성능이 상대적으로 떨어지는 학습 알고리즘, 결정 트리가 좋은 예 GradientBoosting 주요 매개 변수 ( 하이퍼 파라미터 ) AdaBoost ( Adaptive Boost ) 잘못 분류한 샘플에 가중치를 높여서 다음 모델을 훈련 시킴. XGBoost (extreme gradient boosting) - GBM을 개선하여 속도를 높인 것 ( 병렬 수행 및 다양한 기능으로 ) - 일반적인 GBM에 비해 수행 시간이 빠른 것이지 다른 머..
-
[자연어 처리] 기계 번역 Seq2Seq🤖𝗔𝗜/🤖광주 인공지능사관학교 2020. 8. 11. 15:33
Seq2Seq : 입력된 시퀀스로부터 다른 도메인의 시퀀스를 출력하는 분야에서 사용되는 모델 봇(Chatbot)과 기계 번역(Machine Translation), 내용 요약(Text Summarization), STT(Speech to Text) 등에서 쓰인다. 구성 : 인코더와 디코더로 구성된다. 인코더 : 입력 문장의 모든 단어들을 순차적으로 입력받은 뒤에, 마지막에 이 모든 단어 정보들을 압축해서 하나의 벡터로 만든다. => 컨텍스트 벡터 -> 디코더로 전송한다. 즉, 한글 문장 받아서 LSTM 마지막 시점의 은닉/셀 상태 리턴하도록. 디코더 : 컨텍스트 벡터를 받아서 번역된 단어를 한 개씩 순차적으로 출력한다. 인코더와 디코더는 RNN 형태이다. 성능 문제로 인해 LSTM 셀로 구성. 인코더 :..
-
MobileNET에 대한 고찰.🤖𝗔𝗜/🤖광주 인공지능사관학교 2020. 8. 11. 12:52
데이콘 DACON, 캐글 Kaggle : 딥러닝, 머신러닝 대회에서 정확도가 높은 코드가 공개되기 때문에 봐보면 좋다. 전이 학습 1000개의 범주가 아니기 때문에, 우리의 문제에 맞게 레이어 재구축을 해야 한다. 학습용 데이터가 없어도 충분히 문제 해결이 가능하다. 우리가 가진 데이터를 가중치를 최적화할 수 있게끔 추가적으로 학습시켜야 한다.(훈련시켜야 한다) MobileNET에 대한 고찰. 이미지를 채널 3개로 분리해서 모두 연산을 해야 하지?? - Depth-wise Separable Convolution 연산하는 속도가 증가하기 때문이다! 학습에 필요한 파라미터 수를 획기적으로 줄인다. ( 연산의 효율성을 높임으로써 경량화한다 ) 먼저 Depthwise Convolution 하고 -> Pointw..
-
알고리즘🤖𝗔𝗜/🤖광주 인공지능사관학교 2020. 7. 16. 20:10
num_list = list(map(int, input().split())) a, b, r = map(int, input().split()) 수가 고정적이면 해당 수만큼 복잡도 가진다. 수가 가변적이면 n만큼 복잡도 가진다. 5가지중 4개정도는 시간복잡도 O(nlogn) ㅋㅋㅋㅋㅋ 어지간하면 인덱스 : 컬럼 조회에 대한 인덱스 인덱스는 데이터베이스 분야에 있어서 테이블에 대한 동작의 속도를 높여주는 자료 구조를 일컫는다 공간복잡도 : 필요한 메모리. 시간복잡도에 비해 상대적으로 중요도 떨어짐
-
pivot table과 groupby🤖𝗔𝗜/🤖광주 인공지능사관학교 2020. 7. 16. 11:36
pivot table은 groupby와 유사하지만 더 낫다. 비교해서 확인할 것. pivot table만 가능한 것 이있다. 교차하는 셀에는 통계요약을 넣는다. ? 집계함수를 따로따로 두는 것..? groupby는 행에 label을 붙인다..? Pivot table 피벗 테이블(pivot table)은 커다란 표(예: 데이터베이스, 스프레드시트, 비즈니스 인텔리전스 프로그램 등)의 데이터를 요약하는 통계표이다. 이 요약에는 합계, 평균, 기타 통계가 포함될 수 있으며 피벗 테이블이 이들을 함께 의미있는 방식으로 묶어준다. 피벗 테이블은 데이터 처리의 한 기법이다. 유용한 정보에 집중할 수 있도록 하기 위해 통계를 정렬 또는 재정렬(피벗)한다. - 출처 : 위키피디아 데이터 열 중에서 두 개의 열을 각각 ..
-
노트북 사양, 1650Ti, 윈도우에 CUDA 10.0 설치, cuDNN설치.🤖𝗔𝗜/🤖광주 인공지능사관학교 2020. 7. 15. 21:58
NVIDIA GEFORCE GTX 1650 Ti Compute capability (version) : 7.5 드라이버 버전 : 442.23 CUDA 코어 : 1024 intel CORE i7 운영체제 : Windows 10 Pro, 64-bit | Compute capability 찾기 (CUDA 설치 전) CUDA를 설치 하기 전에 CUDA에는 여러가지 버전이 있고, 내 그래픽카드가 가지고 있는 Compute Capability와 관련이 있기 때문에, 나의 그래픽카드 성능을 확인해야 한다. 그리고 CUDA 버전을 선택해야 한다. https://www.wikiwand.com/en/CUDA#/GPUs_supported 흑흑.... 1650 Ti는 없는데... 여기일 듯 싶어서 ,,, 나의 노트북 성능은 ..