Publications by Shin Lee

ATA W6-3

06.04.2021

R pratice for Text (Pre-)Processing Package "stringr’ Let me remind you of the functions in the package stringr covered last time. Function Description Similar Base Functions str_length() number of characters nchar() str_split() split up a string into pieces strsplit() str_c() string concatenation paste() str_squish() removes any redundan...

3547 sym R (128041 sym/87 pcs) 1 img 2 tbl

ATA First Major Assignment

12.04.2021

First Major Assignment In this first major assignment to be graded, you may want to consult with the whole lecture contents in Week 7. For this assignment, you are required to 1) delete duplicated tweets and tokenize text retrieved from 10,000 randomly sampled tweets about Covid-19 vaccines in cv_tweets_ata, 2) create three tables to show the top...

2417 sym R (521 sym/2 pcs)

ITM: Week7

15.04.2021

기계학습(머신러닝)이란? “데이터 혹은 과거의 경험을 이용해서 명시적으로 정의되지 않은 패턴을 컴퓨터로 학습하여 새로운 데이터에 대한 예측을 내리는데 사용되는 방법” 기계학습 과정? 데이터 수집 및 준비 특성 추출 알고리즘 및 모델 선택 학습 결과 평...

4066 sym R (38613 sym/89 pcs) 4 img

ITM: Week14

02.06.2021

R을 이용한 토픽모델링 코로나 백신 관련 기사의 토픽 분석 빅카인즈 중앙지 기사 중 “코로나”와 “백신” 키워드 포함 기사 16000여건 분석 코퍼스 준비 및 기본적인 전처리 library(tidyverse) ## -- Attaching packages --------------------------------------- tidyverse 1.3.0 -- ## v ggpl...

1008 sym R (13610 sym/65 pcs) 3 img

ATA W15

29.05.2021

Learning Objectives Describe a theoretical foundation of topic modeling methods Understand word co-occurrences as a way of analyzing topics Analyzing Topics Texts can be analyzed in terms of topics. This means we can analyze text in terms of what it is that it is written about in the first place. For example, consider how the topics covered in ...

13781 sym R (8973 sym/40 pcs) 4 img 1 tbl

ATA-W13

26.05.2021

Today’s lectures are based on the Chapter 4 of our textbook, “Text Mining with R: A Tidy Approach” by Julia Silge and David Robinson. Information retrieval by identifying word co-occurrences Last week we treated words as individual units of language, and considered their counts a way of revealing the important issues in tweets about COVID-...

9888 sym R (15460 sym/32 pcs) 3 img

ITM: Week12

19.05.2021

감정분석 감정분석은 컴퓨터를 이용하여 사람들의 감정이 표현된 텍스트를 분석하는 연구방법을 말합니다. 여기에서 감정은 사실 보다는 주관적인 인상에 바탕을 둔 의견, 감정, 또는 태도를 포함하는 느낌의 상태를 의미합니다. 감정분석은 사람들의 의견과 행�...

4233 sym R (32114 sym/107 pcs) 10 img

DM_BD_W11

17.05.2021

감정분석 II 감정사전을 사용한 감정분석 <출처: 김영우, “Do it! 쉽게 배우는 R 텍스트 마이닝”, 2021, 이지스퍼블리싱> 사전기반 감정분석이란 텍스트의 감정 형태는 사용된 표현(어휘, 어구, 문형, 축약어, 이모티콘)들의 합이라는 전제하에 감정사전을 이용하는 �...

3375 sym R (25176 sym/81 pcs) 5 img

DM_BD_W10

10.05.2021

감정분석 감정분석은 컴퓨터를 이용하여 사람들의 감정이 표현된 텍스트를 분석하는 연구방법을 말합니다. 여기에서 감정은 사실 보다는 주관적인 인상에 바탕을 둔 의견, 감정, 또는 태도를 포함하는 느낌의 상태를 의미합니다. 감정 분석은 사람들의 의견과 행�...

3818 sym R (13229 sym/53 pcs) 5 img

ATA: W11

07.05.2021

Ch10. Word and text relatedness Learning Objectives Understand the goals and applications of the task of word relatedness Learn about corpus-based measures of word relatedness Word Relatedness Semantic relatedness involves identification and quantification of the strength of relationships in meaning that exist between textual units such as wor...

12437 sym R (24151 sym/83 pcs) 7 img