Publications by Liam

指标体系方法

03.03.2024

Applied Demographic Data Analysis 指标体系 搭建一套完整的数据指标体系 1. 什么是指标体系? 2. 指标体系的作用 3. 如何建立指标体系 4. 指标体系的注意事项 不同行业的指标体系如何搭建 1. 数据指标体系的重要性 2. 数据指标体系的构成 3. 搭建数据指标体系的一般流�...

13937 sym

指标体系框架

03.03.2024

1. 概念篇 : 数据指标体系基础概念 什么是数据指标体系 数据指标: 是用数据对事物进行描述的工具. 数据指标需要清晰的定义 数据指标的分类 连续指标可以继续拆分: 数据指标 VS 数据维度 和 标签 识别指标和维度 多个维度和指标来综合定义一个标签, 而这个�...

3974 sym 51 img

加密货币研究

25.02.2024

加密货币研究 米霖 2024 准备和设置 本文档的每一部分都可以在任何计算机上通过云笔记本或本地运行。 在云上运行R 如果你的电脑上目前还没有安装 R 和 RStudio, 你可以浏览器中运行代码: https://gesis.mybinder.org/binder/v2/gh/ries9112/high-level-reprex-jupyter/0a291fe130f30281009aecb61bf...

22524 sym R (94383 sym/165 pcs) 17 img 4 tbl

倾向性评分

11.10.2023

倾向性评分最大的优势是将多个混杂因素的影响用一个综合的值来表示,即倾向性评分值(Propensity Score, PS),从而降低协变量的维度,因此该方法尤其适用于协变量较多的情况。 倾向得分(Propensity Score)的数学原理是基于条件概率和概率密度函数的统计原理。倾�...

1928 sym R (5679 sym/17 pcs) 1 img 4 tbl

AutoEDA

07.10.2023

AutoEDA R 中有一些包可以帮助我们自动的进行探索性数据分析 1. dataMaid library(dataMaid) library(gapminder) # Create report makeDataReport(gapminder, output = "html", replace = TRUE) 2. DataExplorer library(DataExplorer) create_report(gapminder) data() 3. SmartEDA library(SmartEDA) ExpReport(gapminder,op_file='smartEDA.html'...

89 sym R (227 sym/3 pcs)

Block Chain in R

26.09.2023

Blocks 区块链是一连串的块 , 块(Block) 是存储数据的容器 an identification number 身份标识号吗 a timestamp of block creation 块的创建时间戳 data 相关数据 a reference to the previous block (parent block) in the chain 对前一个块的引用 block <- list(number = 3, timestamp = Sys.time() , ...

2310 sym R (11794 sym/39 pcs) 1 img

matplotlib tutorial

17.09.2023

1 Plot Workflow prepare data Crete plot plot customize plot save plot show plot import matplotlib.pyplot as plt x = [1,2,3,4] y = [11,23,44,66] # step 1 fig = plt.figure() # step 2 ax = fig.add_subplot(111) # step3 # fig,ax = plt.subplots() ax.plot(x,y,color = "red") # step 3,4 ax.scatter([2,4,6],[6,11,17],color="blue",marker='^') ax.set_x...

464 sym Python (1555 sym/15 pcs) 3 img

tutorial of sklearn

17.09.2023

1 An example # reticulate::py_install(packages = "scikit-learn") 不是 sklearn from sklearn import neighbors, datasets, preprocessing from sklearn.model_selection import train_test_split from sklearn.metrics import accuracy_score iris = datasets.load_iris() X,y = iris.data,iris.target X_train,X_test,y_train,y_test = train_test_split(X,y,rando...

732 sym Python (4887 sym/33 pcs)

Turorial of numpy

17.09.2023

numpy 提供了一组高效处理数组的工具. 这个图有点误导性. 当数组是二维的时候, axis0 表示行, axis 表示列. 当数组是三维的时候, axis0 表示的则是不同的二维数组, axis1表示行, axis2 表示列 1 创建array 数组 import numpy as np a = np.array([1,2,3]) # 1 D array a ## array([1, 2, 3]) b = np...

1007 sym Python (6662 sym/130 pcs) 1 img

tutorial of pandas

17.09.2023

1 Creating Data Frame import pandas as pd df1 = pd.DataFrame({"a":[1,2,3],"b":[4,5,6],"c":[7,8,9]}) df1 # Specify values for each columns ## a b c ## 0 1 4 7 ## 1 2 5 8 ## 2 3 6 9 df2 = pd.DataFrame([[1,2,3,4],[4,5,6,7],[7,8,9,10],[10,11,12,13]],columns=["a","b","c","d"],index=["A","B","C","D"]) df2 # Specify values for each rows ...

541 sym Python (5074 sym/74 pcs) 1 img