영문 소설 '빨강머리 앤 (Anne of Green Gables)' 을 가지고 주인공 Ann을 중심으로 관계도를 만들어 보았다.
소설 텍스트는 '프로젝트 구텐베르크' 에서 가져왔다.
https://www.gutenberg.org/ebooks/45
사이트로 들어가면 다운받을 수 있는 종류가 많은데 나는 첫번째 Read online(web)으로 들어갔다.
챕터별로 영문 텍스트를 복사 해서 Visual Studio(VS)에 붙여넣기를 했다.
붙여넣기 하기 전에 VS에서 File -> New File -> ANNE OF GREEN GABLES.json 을 만들어주었다.
(파일 저장은 jupyter notebook의 python 파일이 저장되는 곳에 저장했다.)
그러고 나서 밑에 사진처럼 딕셔너리 형식으로 "cast"와 "chapters" 를 만들었다.
참고로 "cast"는 내가 주인공을 찾아 적어 넣었다.
그 다음 코드를 작성하였다.
빨강머리 앤의 주인공 'Anne'을 기준으로 관계도가 그려진 것을 확인할 수 있다.
'데이터 분석 > 자연어 처리' 카테고리의 다른 글
2.8 코사인 유사도(Cosine Similarity) (2) | 2023.02.03 |
---|---|
2.7 TF-IDF (Term Frequency-Inverse Document Frequency) (0) | 2023.01.25 |
2.6 문서 단어 행렬(Document-Term Matrix, DTM) (1) | 2023.01.19 |
2.5 Bag of Words(BoW) (0) | 2023.01.16 |
2.4 품사 태깅(PoS Tagging) (0) | 2023.01.10 |