분류 전체보기 5

머신러닝 평가지표 정리

머신러닝에서 등장하는 평가지표는 여러 개가 있고, ML 직무 면접에서도 자주 물어보는 질문 중 하나이다. 하지만 물어볼 때마다 AUC ROC Curve 나 precision, recall 에 대해서 까먹는 경우가 많아 이번에 정리하고 넘어가보려고 한다. 머신러닝에서 사용하는 평가지표는 크게 분류(Classification)문제인지 회귀(Regression) 문제인지에 따라 구분될 수 있다.    1. 분류(classification) 평가지표분류에서 사용되는 평가지표를 정확하게 이해하기 위해서 선행되어야 하는 개념이 있다. 바로, 혼동 행렬이라고 불리는 confusion matrix이다. 이름 때문인지는 몰라도 나에게 상당한 혼동을 주고 있는 행렬이다. 혼동행렬은 주로 참 또는 거짓을 분류해내는 문제에서..

머신러닝 2024.07.28

Hierarchical TiCa Speaker Encoder 정리

논문 제목: Hierarchical Timbre-Cadence Speaker Encoder for Zero-shot Speech Synthesis (2023) 링크논문 저자: JounYeop Lee, Jae-Sung Bae, Seongkyu Mun, Jihwan Lee, Ji-Hyun Lee, Hoon-Young Cho, Chanwoo Kim   개요이전 글에 이어서 personalized TTS를 가능하게 만들어주는 zero-shot TTS 모델에 대한 논문이다. 논문의 주요 아이디어는 화자 임베딩 (Speaker embedding)의 정보를 다시 2개의 정보로 나누는 것이며, 각각 timbre와 cadence라는 정보이다. 연구팀은 음성에서 timbre 임베딩과 cadence 임베딩을 추출/사용하여 ..

Latent Filling 정리

논문 제목: Latent Filling: Latent space data augmentation for zero-shot speech synthesis (2024) 링크논문 저자: Jae-Sung Bae, Joun Yeop Lee, Ji-Hyun Lee, Seongkyu Mun, Taehwa Kang, Hoon-Young Cho, Chanwoo Kim   개요논문의 본문으로 들어가기 앞서 zero-shot learning에 대한 이해가 필요하다. Zero-shot learning은 처음 보는 데이터 라벨 또는 입력 분포에 대해 정확한 분류가 가능하도록 학습하는 기법을 말한다. 다시 말해, 새로운 입력 값과 정답 라벨에 대해서 잘 예측해야 하는 문제이다. 그러한 모델을 학습시키기 위해서는 보통 상당히 많은..

Mels-TTS 정리

논문 제목: MELS-TTS: Multi-emotion Multi-lingual Multi-speaker Text-To-Speech system via disentangled style tokens (2024) 링크논문 저자: Heegin Choi, Jae-Sung Bae, Joun Yeop Lee, Seongkyu Mun, Jihwan Lee, Hoon-Young Cho, Chanwoo Kim   개요개인적으로 느껴지기에 음성합성 (speech synthesis, TTS)은 실제 상용 소프트웨어나 서비스에 많이 접목되어 있을 만큼 그 수준이 어느 정도 사람과 같아졌다고 느껴진다. 그러나 아직 공부를 진행하는 학부생이지만, 감정을 전달하는 능력이나 비언어적 요소들을 정말로 사람처럼 표현할 수 있는지에 대..

ResNet 정리

논문 제목: Deep Residual Learning for Image Recognition (2015) 링크저자: Kaiming He, Xiangyu Zhang, Shaoqing Ren, Jian Sun   개요ResNet으로 잘 알려진 해당 논문은 2015년 이미지 분류 대회인 ILSVRC에서 우승한 모델이다. ResNet은 이전 연도까지 딥러닝 레이어를 많이 쌓을수록 문제가 발생하는 것을 정확하게 해결하여 총 152개의 레이어를 쌓는 데 성공하였다. 그렇다면 어떻게 Microsoft 연구팀은 어떻게 문제를 해결하여 레이어를 많이 쌓아도 학습이 잘되는 모델을 만들었는지 정리해 보았다.    Residual Learning의 등장배경2015년 당시 이미지를 분류하는 모델들은 딥러닝 레이어를 많이 쌓을수..

딥러닝/기초 2024.06.06