Publications by 讀書會第7組:唐思琪(組長)、盧伯維、曾建嘉、蔡柏毅、賴俞雯、沈育嬋、陳信瑋

【辛普森家庭】影集文字分析_LDA分析

11.05.2020

【辛普森家庭】影集文字分析_LDA分析 資料介紹 資料前處理 讀取套件及資料 tokenization 轉成dtm格式 LDA分析 主題-文字分析 文件-主題分析 LDAvis 結論 讀書會第7組:唐思琪(組長)、盧伯維、曾建嘉、蔡柏毅、賴俞雯、沈育嬋、陳信瑋 2020-05-11 資料介紹 Data Source...

1255 sym R (6489 sym/23 pcs) 4 img

2020美國總統選舉民主黨初選探索分析

28.04.2020

1. 動機和分析目的 美國總統大選將至,最受矚目的莫過於各州初選及辯論會的激戰。 這次的分析主要是針對民主黨的8位候選人,藉由Reddit和Twitter上的文章發表、評論等,觀察網路上的話題趨勢、對不同候選人的討論熱度以及大眾的情緒變化。我們好奇分析後的�...

4123 sym R (24297 sym/60 pcs) 10 img

【辛普森家庭】影集文字分析

30.03.2020

文字分析_Simspons 資料介紹 文本探索 讀取資料 文字前處理 統計字頻 文字雲分析 整季(第31季)總體文字雲 區分正、負面情緒的文字雲(採用Bing字典) 特別集數(第10集)的文字雲 情緒分析 四個情緒字典介紹 NRC字典 Afinn字典 Bing字典 Loughran字典 四字典各集比較分析...

2075 sym R (12870 sym/41 pcs) 16 img

情緒分析(Sentiment Analysis)_辛普森家庭

30.03.2020

TextMining_Simspons 唐思琪 2020-03-31 1 Data介紹 Data Source: 辛普森一家 字幕庫 第31季第1集~第16集(共16集) 2 文本探索 2.1 讀取資料 pacman::p_load(tidytext, dplyr, ggplot2, magrittr, plotly, readr, stringr, wordcloud2, wordcloud, reshape2) simps <- read_file("./simps/all.txt") stpw <- read_file("./simps/stpw.txt") ...

784 sym R (4072 sym/16 pcs) 1 img

PCA分析

27.03.2020

PCA分析 唐思琪 2020-03-31 PCA Shiny App PCA Shiny App 介面 O&M和environmental survey方向完全相反,代表兩個變數負相關 cabel和environmental survey呈現直角,代表互相獨立 兩段式趨勢分析 期數可以自訂,這裡只做了兩段,可以看出兩期間移動的軌跡 1 PCA分析 一種尺度縮減的�...

1340 sym R (4754 sym/35 pcs) 20 img

中文文字分析_辛普森家庭

24.03.2020

TextMining_Simspons 唐思琪 2020-03-31 1 Data介紹 Data Source: 辛普森一家 字幕庫 第31季第12集~第16集(共5集) 中英皆有(此例用的是中文繁體字幕) 1.1 斷詞系統 Jieba(結巴) 1.2 情緒字典 中文: LIWC(本例使用) 2 文本探索 2.1 系統參數設定 Sys.setlocale(category = "LC_ALL", locale = "zh_TW....

590 sym R (6273 sym/25 pcs) 2 img

Panel Data Model

25.02.2020

計量經濟R語言-第三周:Panel_Data_Model 唐思琪 2020-02-26 Content 1. 資料結構 2. 模型介紹 3. 模型選擇 4. 模型解釋 1. What is panel data? Structure in data: Individual & Time Prepare Data library(plm) mydata<- read.csv("panel_wage.csv") attach(mydata) # 代表接下來都用同樣的df,呼叫變數時前面不...

1999 sym R (1302 sym/15 pcs) 4 img 2 tbl

商業智慧日教材

12.01.2020

前置準備 1. 下載Dplyr套件 tidyverse套件,包含了dplyr、ggplot2,與stringr等數據處理常用包 library(tidyverse) # 一次進行下載與載入套件 ## ── Attaching packages ─────────────────────────────────────────────────�...

1052 sym R (13021 sym/46 pcs) 2 img 2 tbl

Leaflet套件介紹與範例

20.03.2020

Leaflet介紹 唐思琪 2020-04-10 Reference: Leaflet Github 1 Leaflet功能介紹 Tiles: 選擇想要的世界地圖當底圖 Marker: 在地圖標上記號 設定經緯度 popup: 點擊Marker()觸發彈出視窗 以html格式呈現 label: 感應游標後顯示標籤 icon: Font Awesome Bootstrap Glyphicons Ion icons leaflet() %>% # 製�...

380 sym R (4725 sym/15 pcs) 1 img

格林童話文字分析

19.05.2020

格林童話文字分析 讀取資料 情緒分析 NRC字典 Afinn字典 Bing字典 Loughran字典 四字典各集比較分析 LDA分析 主題-文字分析 文件-主題分析 讀書會第7組:唐思琪(組長)、盧伯維、曾建嘉、蔡柏毅、賴俞雯、沈育嬋、陳信瑋 2020-05-19 讀取資料 pacman::p_load(tidytext,readr...

785 sym R (14066 sym/69 pcs) 16 img