일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | 3 | 4 | 5 | ||
6 | 7 | 8 | 9 | 10 | 11 | 12 |
13 | 14 | 15 | 16 | 17 | 18 | 19 |
20 | 21 | 22 | 23 | 24 | 25 | 26 |
27 | 28 | 29 | 30 | 31 |
- 코딩
- 코딩테스트
- map
- 데이터전처리
- Queue
- 상어중학교
- python
- 에이블스쿨
- 프로그래머스
- 모델링
- 백준
- BFS
- 미니프로젝트
- 크롤링
- 코테연습
- 알고리즘
- C++
- 머신러닝
- 코테공부
- 코테준비
- 파이썬
- 개인정보수집유효기간
- 코테
- Ai
- 21609
- 취준
- 음수와 size 비교
- 스터디
- kt에이블스쿨
- dfs
- Today
- Total
목록데이터전처리 (2)
얼레벌레
1~2일차 4차 개인 미니프로젝트 3~4일차 4차 팀 미니프로젝트 "스팸문자분류" 프로젝트 전 주에 nlp(자연어처리)를 배우고 나서, 한 주간 미니 프로젝트로 스팸 문자를 분류하는 프로젝트를 진행했다. 스팸인지 아닌지 분류하는 문제였고, 텍스트 데이터를 vectorize 해서 학습시켜야 했다. 개별 & 팀 미니 프로젝트 1, 2일차는 혼자서 데이터 분석, 전처리, 모델링, 성능 분석의 과정을 거치며 문제를 해결했다. 나는 전처리로 크게 NaN 값 제거, label을 수치형으로 변환을 했고, train, test split 후 vectorization을 진행했다. (n-gram, sequence 둘 다 시도) 모델로는 GaussianNB, LSTM, Conv1D 를 사용했는데, NLP 에서 BERT 모델..
3주차 내용정리 8월 8일-9일: 데이터 전처리 9월 10일-12일: 데이터 분석 및 의미찾기 다른 블로그들 보면 교육 프로그램을 주차별로 정리하시던데, 난 주차별로 말고 1일치씩 정리해야지~! 라고 다짐을 했는데..ㅎ 한 3주차에 접어드니까 드는 생각은 시간이 너무너무너무 할애가 돼서 부담스럽다는 것이다;; (주객전도가 되어버림) 그래서 그냥 나도 주차별로 정리해야겠다 ㅋㅋ ML 프로세스 비즈니스에 대한 이해 데이터 자체에 대한 이해 => 8월 10-12일 데이터 전처리 => 8월 8-9일 모델링 학습과 평가 적용 데이터 전처리 중요한 Crispy-DM 표 x, y 분할 ( x를 feature, y를 target) feature engineering: 우리가 가지고있는 데이터, 도메인지식을 통해 현재 ..