감정분석(Emotion Analysis)
1. 학습 자료
가. 감성분석
- https://www.youtube.com/watch?v=7GUoDHxN5NM : Colab으로 코딩하면서 설명해주심
- https://www.youtube.com/watch?v=Ablii-dTmoc : PPT 강의자료
2. 선행연구
가. 리뷰 논문
나. 감정 사전 구축 논문
다. 감정 어휘사전 통합 논문
3. 한국어 감정 사전
가. 한글 오픈데이터 플랫폼 : http://openhangul.com/
나. 서울대학교 감성 사전 : http://nlp.snu.ac.kr/kosac/
다. 군산대학교 한국어 감성사전 : http://dilab.kunsan.ac.kr/knusl.html
4. 한국어 감정 데이터셋
가. AI 허브 : https://aihub.or.kr/aihubdata/data/list.do?currMenu=115&topMenu=100
나. 국립국어원 > 언어정보나눔터 : https://kli.korean.go.kr/corpus/request/corpusRegist.do
- 2가지 말뭉치가 존재하는데, 감성 라벨링된 데이터셋
다. 2023년 국립국어원 인공지능 언어 능력 평가: 감정 분석 데이터셋(NIKL2023)
- 감정 분석 데이터셋 : https://kli.korean.go.kr/benchmark/taskOrdtm/taskDownload.do?taskOrdtmId=103&clCd=ING_TASK&subMenuId=sub02 (현재, 다운로드 불가)
- 관련 깃허브 : https://github.com/oneonlee/KR-Emotional-Analysis , https://github.com/teddysum/Korean_EA_2023
라. KEmoFact 데이터셋
마. 한국 드라마 데이터셋
5. 한국어 Transformer 계열 모델
- KcELECTRA : https://github.com/Beomi/KcELECTRA
- XAF-SS(cross-Attention-based Fusion of Speaker and Scene context) : Korean Drama Scene Transcript Dataset for Emotion Recognition in Conversations
6. 감정분석 기법 분류
가. 사전 기반
- 사전 기반 접근법, 말뭉치 기반 접근법
나. 기계학습 기반
- Naïve Bayes, 지원 벡터 머신(SVM), 결정 트리
다. 딥러닝 기반
- 신경망, CNN, LSTM, BiLSTM
라. 전이학습 기반
- 사전 훈련된 모델을 관련 도메인에 재사용
마. 하이브리드 기반
- 기계학습+딥러닝 등
7. 모델 평가 지표
가. 혼동 행렬(Confusion Matrix)
나. 평가 지표
- 정확도 : (TP + TN) / (TP + TN + FP + FN)
- 정밀도 : TP / (TP + FP)
- 재현율 : TP / (TP + FN)
- F1 점수 : (2 Precision Recall) / (Precision + Recall) = (2 TP) / ((2 TP) + FP + FN)
- 기타 : 자카드 점수, 민감도, 특이도, 카파 계수, 피어슨 상관 계수 등
8. 감정분석 모델 구현
가. 딥러닝 기반
- VAE(Variational AutoEncoder) : 구글 Colab에서 VAE(Variational AutoEncoder) 모델 구현
- KoBERT
. [Python, KoBERT] 7가지 감정의 다중감성분류모델 구현하기
. 한국어 감성 분석 - HMAA(Hierarchical Masking and Aspect-aware Attention)
. KLUEBERT 기반
. 2024 Aspect-Based Sentiment Analysis in Korean Based on Hierarchical Masking and Aspect-aware Attention - KE-T5
. 2021 Ke-t5-based text emotion classification in korean conversations
Subscribe
Login
0 Comments
Oldest