Publications by Shin Lee
ATA W6-3
R pratice for Text (Pre-)Processing Package "stringr’ Let me remind you of the functions in the package stringr covered last time. Function Description Similar Base Functions str_length() number of characters nchar() str_split() split up a string into pieces strsplit() str_c() string concatenation paste() str_squish() removes any redundan...
3547 sym R (128041 sym/87 pcs) 1 img 2 tbl
ATA First Major Assignment
First Major Assignment In this first major assignment to be graded, you may want to consult with the whole lecture contents in Week 7. For this assignment, you are required to 1) delete duplicated tweets and tokenize text retrieved from 10,000 randomly sampled tweets about Covid-19 vaccines in cv_tweets_ata, 2) create three tables to show the top...
2417 sym R (521 sym/2 pcs)
ITM: Week7
기계학습(머신러닝)이란? “데이터 혹은 과거의 경험을 이용해서 명시적으로 정의되지 않은 패턴을 컴퓨터로 학습하여 새로운 데이터에 대한 예측을 내리는데 사용되는 방법” 기계학습 과정? 데이터 수집 및 준비 특성 추출 알고리즘 및 모델 선택 학습 결과 평...
4066 sym R (38613 sym/89 pcs) 4 img
ITM: Week14
R을 이용한 토픽모델링 코로나 백신 관련 기사의 토픽 분석 빅카인즈 중앙지 기사 중 “코로나”와 “백신” 키워드 포함 기사 16000여건 분석 코퍼스 준비 및 기본적인 전처리 library(tidyverse) ## -- Attaching packages --------------------------------------- tidyverse 1.3.0 -- ## v ggpl...
1008 sym R (13610 sym/65 pcs) 3 img
ATA W15
Learning Objectives Describe a theoretical foundation of topic modeling methods Understand word co-occurrences as a way of analyzing topics Analyzing Topics Texts can be analyzed in terms of topics. This means we can analyze text in terms of what it is that it is written about in the first place. For example, consider how the topics covered in ...
13781 sym R (8973 sym/40 pcs) 4 img 1 tbl
ATA-W13
Today’s lectures are based on the Chapter 4 of our textbook, “Text Mining with R: A Tidy Approach” by Julia Silge and David Robinson. Information retrieval by identifying word co-occurrences Last week we treated words as individual units of language, and considered their counts a way of revealing the important issues in tweets about COVID-...
9888 sym R (15460 sym/32 pcs) 3 img
ITM: Week12
감정분석 감정분석은 컴퓨터를 이용하여 사람들의 감정이 표현된 텍스트를 분석하는 연구방법을 말합니다. 여기에서 감정은 사실 보다는 주관적인 인상에 바탕을 둔 의견, 감정, 또는 태도를 포함하는 느낌의 상태를 의미합니다. 감정분석은 사람들의 의견과 행�...
4233 sym R (32114 sym/107 pcs) 10 img
DM_BD_W11
감정분석 II 감정사전을 사용한 감정분석 <출처: 김영우, “Do it! 쉽게 배우는 R 텍스트 마이닝”, 2021, 이지스퍼블리싱> 사전기반 감정분석이란 텍스트의 감정 형태는 사용된 표현(어휘, 어구, 문형, 축약어, 이모티콘)들의 합이라는 전제하에 감정사전을 이용하는 �...
3375 sym R (25176 sym/81 pcs) 5 img
DM_BD_W10
감정분석 감정분석은 컴퓨터를 이용하여 사람들의 감정이 표현된 텍스트를 분석하는 연구방법을 말합니다. 여기에서 감정은 사실 보다는 주관적인 인상에 바탕을 둔 의견, 감정, 또는 태도를 포함하는 느낌의 상태를 의미합니다. 감정 분석은 사람들의 의견과 행�...
3818 sym R (13229 sym/53 pcs) 5 img
ATA: W11
Ch10. Word and text relatedness Learning Objectives Understand the goals and applications of the task of word relatedness Learn about corpus-based measures of word relatedness Word Relatedness Semantic relatedness involves identification and quantification of the strength of relationships in meaning that exist between textual units such as wor...
12437 sym R (24151 sym/83 pcs) 7 img