-
2020.07.27 진행단계진행단계 2020. 7. 27. 20:54
1. 음절 단위 임베딩
- 2275개의 음절을 count vector기법을 활용하여 벡터화하고 SVD변환을 통해 벡터의 차원을 줄인다.
- 벡터의 차원이 작으면 음절 간의 유사도가 상당히 높게 나온다.
- 어차피 음절 간의 유사도를 사용하지는 않을 예정이지만 유사도가 높게 나오는 쌍이 꽤 있다는 점이 걸린다...
- 추후 cross-validation model selection을 통해 최적의 차원을 구해야할 것 같다.
'진행단계' 카테고리의 다른 글
2020.08.06 진행단계 (0) 2020.08.06 2020.07.20 진행단계 (2) 2020.07.20 2020.07.15 진행단계 (13) 2020.07.15