Publications by Galih Dwika Putra R
Titanic's Passanger Survivability Prediction
Load library library(tidyverse) ## Warning: package 'tidyverse' was built under R version 4.1.3 ## -- Attaching packages --------------------------------------- tidyverse 1.3.2 -- ## v ggplot2 3.3.5 v purrr 0.3.4 ## v tibble 3.1.8 v dplyr 1.0.9 ## v tidyr 1.1.4 v stringr 1.4.0 ## v readr 2.1.2 v forcats 0.5.1 ## Warni...
26588 sym R (168037 sym/802 pcs) 49 img
Note on Retail Data Project
Pendahuluan Pernah berbelanja ke supermarket atau swalayan? pernah memperhatikan layout sebuah app e commerce? Pernah melihat bagaimana beberapa perusahaan dan pebisnis menjual beberapa jenis barang berbeda dalam satu paket/ bundling? Jika iya, kalian sedang menyaksikan salah satu bentuk penerapan dari hasil Market Basket Analysis. Mode analisa M...
7557 sym R (15350 sym/53 pcs) 2 img
Data Science Project in Finance : Credit Risk Analysis
Pendahuluan Credit risk adalah bentuk resiko kegagalan bayar oleh debitur yang ditanggung oleh creditur. Resiko ini bisa berdampak pada : * Penurunan income dari bunga * Gangguan modal kerja yang tidak kembali * Meningkatnya biaya yang berasal dari collection Untuk memperkecil resiko tersebut, sebuah praktik yang wajar di seluruh perusahaan keuan...
36829 sym R (9272 sym/51 pcs) 1 img
Model_2
Model Building Dari bagian sebelumnya, mendapat ilham tentang model dan model building. Prinsip dasar dari membangun sebuah model melibat serangkaian proses tidak berurutan dan kontinuu terkait : * Eksplorasi — > Menemukan pattern * Pemilihan family model (berdasarkan kebutuhan dan kondisi riil data) * Model fitting * Repeat Satu hal yang perlu...
8743 sym R (16857 sym/74 pcs) 19 img
Document
Modelling dalam statistik dan matematika adalah proses belajar yang panjang dan sangat mungkin membingungkan. Selama ini, kita mengenal modelling sebagai upaya sistematis untuk menjabarkan hubungan matematis-statistik antar satu dengan beberapa variabel, dan menghasilkan suatu output tertentu (biasanya berupa prediksi atau sinyal tertentu). Banya...
12609 sym R (35492 sym/68 pcs) 16 img
Program2_iteration
Iteration Pada bagian ‘programming’, kita belajar bahwa salah satu prinsip dalam programming adalah ‘jangan mengopy paste kode kita sendiri’. Untuk menerapkan prinsip tersebut, kita diajakan cara untuk menggunakan fungsi yang memampukan kita untuk mengulang serangkaian perhitungan dan flow kode secara otomatis. Cara lain adalah dengan tek...
6746 sym R (19210 sym/94 pcs)
Program1
Program Pipe prerequisites library(magrittr) “%>%” adalah sebuah operator yang telah sering kita pakai sebelumnya. Operator ini memiliki nama “foward pipe operator”, sebuah mekanisme untuk membuat rantai komando fungsi dari kiri ke kanan, sehingga kita tidak perlu membuat objek-objek intermediate. “%>%” atau pipe, seperti namanya, me...
14396 sym R (7133 sym/142 pcs) 2 img
Wrangle4 - Factor & Datetime
Factor Factor adalah salah satu tipe struktur data dalam R bersama dengan vector, list, matriks, dan dataframe. Factor adalah jenis struktur data satu dimensi yang khusus digunakan untuk menampung data tipe kategorikal. Kebiasaan ku hingga saat ini adalah langsung mengubah data tipe character menjadi factor karena kemudahan untuk manipulasinya. U...
10304 sym R (18203 sym/182 pcs) 14 img
Wrangle 3 Stringr
Manipulasi string dengan Reguler Expression (RegEx) Prerequisites library(tidyverse) ## Warning: package 'tidyverse' was built under R version 4.1.2 ## -- Attaching packages --------------------------------------- tidyverse 1.3.1 -- ## v ggplot2 3.3.5 v purrr 0.3.4 ## v tibble 3.1.4 v dplyr 1.0.7 ## v tidyr 1.1.4 v stringr 1....
13823 sym R (25392 sym/116 pcs)
EDA Learning
Pada titik ini, kita akan mulai pengaplikasian simultan dari visualisasi dan manipulasi data dalam bentuk proses analisa data berna Exploration Data Analysis, atau yang lebih sering disingkat EDA. EDA adalah sebuah proses repetitif yang berusaha mencari gambaran dan pemahaman lebih jauh soal data yg kita hadapi, proses ini melibatkan tiga proses ...
12361 sym R (12373 sym/85 pcs) 21 img