Li Zhe

PhD Student

Fudan University

About Me

Welcome! I am currently a PhD Student in School of Data Science at Fudan University, under the supervision of Prof. Xuening Zhu. My research interests include econometrics, distributed statistical modelling & inference, network data modelling.

Interests

Distributed Learning
Network Data Modelling
Econometrics

Education

MSc in Statistics, 2023

Fudan University
BSc in Physics, 2020

Fudan University

Publications

Quickly discover relevant content by filtering publications.

Yimeng Ren, Zhe Li, Xuening Zhu, Yuan Gao, Hansheng Wang (2024). Distributed Estimation and Inference for Spatial Autoregression Model with Large Scale Networks. Journal of Econometrics, accepted.

Shihao Wu, Zhe Li, Xuening Zhu (2023). A Distributed Community Detection Algorithm for Large Scale Networks Under Stochastic Block Models. Computational Statistics & Data Analysis, online.

PDF Cite Code Slides

Recent Slides

Disentangle Mixture Distributions and Instrumental Variable Inequalities

Chapter 22 in “A First Course in Causal Inference”.

Zhe Li

Jan 1, 2024 causal-inference

On factor models with random missing： EM estimation, inference, and cross validation

Notes on “On factor models with random missing： EM estimation, inference, and cross validation”.

Zhe Li

Nov 27, 2023 factor-model

Using the Propensity Score in Regressions for Causal Effects

Chapter 14 in “A First Course in Causal Inference”.

Zhe Li

Oct 29, 2023 causal-inference

Recent Posts

R并行方法简述

Table of Contents 1、简介 2、parallel包 2.1 mclapply 2.2 parLapply 3、foreach包与doParallel包 4、future包 5 、furrr包 6、RcppParallel包 7 、GPU 加速 8 、性能比较 9 、结论 1、简介 R语言提供了多种并行计算的方法，可以显著提高计算密集型任务的执行速度。本文章只简单介绍几种常用的并行计算方法，并提供示例代码，最后对比几种方法。 2、parallel包 parallel包是R中最基本和广泛使用的并行计算包。它是R基础安装的一部分，无需额外安装。 2.1 mclapply mclapply 函数适用于类 Unix 系统（Mac 、Linux等），使用 fork 机制创建子进程。

Zhe Li

Last updated on Sep 20, 2023 4 min read Classical Statistics

R并行方法简述

KAN: Kolmogorov–Arnold Networks

Table of Contents 0、MLP 一、Kolmogorov–Arnold Networks 1. Kolmogorov-Arnold Representation theorem 2. KAN Architecture 3. KAN’s Approximation Abilities and Scaling Laws 4. For Interpretability: Simplifying KANs and Making them interactive 二、KAN 的一些问题参考文献 0、MLP 感知机最早由Rosenblatt于1957年提出，由于其简单的结构而得到快速的发展，下图是一个MLP的示意图我们可以把上面这个 MLP 表示为： $$ f_{\mathrm{MLP}}(\mathbf{x})=\mathbf{W}_4 \boldsymbol{\sigma}\left(\mathbf{W}_3 \boldsymbol{\sigma}\left(\mathbf{W}_2 \boldsymbol{\sigma}\left(\mathbf{W}_1 \mathbf{x}+\mathbf{b}_1\right)+\mathbf{b}_2\right)+\mathbf{b}_3\right)+\mathbf{b}_4, $$ 可以看出，在 MLP 中，激活函数$\boldsymbol{\sigma}(\cdot)$是作用在节点（node）上的，而边（edge）的连接没有附带任何信息，唯一的作用就是把两层中的所有节点连接起来。

Zhe Li

May 12, 2024 3 min read Neural Network

KAN: Kolmogorov–Arnold Networks

扩散模型（Diffusion Model）

主要针对扩散模型的一些经典文章写一些个人理解，博采众长，参考了很多博客、文章，详细信息见参考文献 Table of Contents 0、文生图片模型 1、几种生成模型的对比 2、扩散模型（DDPM） 3 、基于分数的生成模型（Score-based generative models）参考文献 0、文生图片模型 DALL·E 3 扩散模型的大火始于2020年所提出的DDPM（“Denoising Diffusion Probabilistic Models”）。当前最先进的两个文本生成图像——OpenAI的DALL·E 3和Google的Imagen 2，都是基于扩散模型来完成的。 1、几种生成模型的对比 GAN（生成对抗网络）：GAN是由两部分组成，一个生成器和一个判别器。生成器的目标是创建足够真实的数据，以至于判别器不能区分生成的数据和真实数据。判别器的目标是正确区分真实数据和生成器生成的假数据。这两部分在训练过程中相互竞争，推动彼此的进步，因此称为对抗网络。GAN在图像生成方面尤其出色。 VAE（变分自编码器）：VAE采用不同的方法来生成数据。它通过编码器将数据映射到一个分布上，并从这个分布中采样来构造一个解码器用于数据重建。它是一种通过概率方法生成新数据的模型，通常用于生成遵循特定统计分布的图片。 Flow-based Models（基于流的模型）：这类模型使用可逆变换来学习数据的分布，这意味着它们可以精确地计算生成数据的概率。它们可以生成高质量的数据，并且给定新数据，也可以确定其概率。这种特性在密度估计和无损压缩方面特别有用。 Diffusion Models（扩散模型）：Diffusion Models 的灵感来自non-equilibrium thermodynamics （非平衡热力学）。理论首先定义扩散步骤的马尔可夫链，以缓慢地将随机噪声添加到数据中，然后学习逆向扩散过程以从噪声中构造所需的数据样本。与 VAE 或流模型不同，扩散模型是通过固定过程学习，并且隐空间具有比较高的维度。

Zhe Li

Apr 5, 2024 9 min read Deep Learning

扩散模型（Diffusion Model）

B样条（B-Splines)

Table of Contents 一、Lagrange插值法二、（Bezier）贝塞尔曲线与B-Splines 1、（Bezier）贝塞尔曲线 2、B-Splines 三、样条估计四、拟合样条对深度学习中的双下降（Double Decent）现象的解释一、Lagrange插值法已知若干点，如何得到光滑曲线？是否可以通过在原有数据点上进行点的填充生成曲线？首先，可以考虑两个点的插值：考虑$P_0$和$P_1$之间的任意一点$P_x$，可表示为： $$P_x=P_0+\left(P_1-P_0\right) t=(1-t) P_0+t P_1$$ 其中$t={(P_0 P_x)}/{(P_0 P_1)}$。直观上，我们可以把$P_0$和$P_1$视为控制点，$(1-t)$和$t$视作基函数。【思考：两点如何推广到多个点？】如果知道三个点: $P_0, P_1, P_2$, 如何确定一条曲线 ? 想法: 将$P_0, P_1$ 进行连接，然后将$P_1, P_2$ 进行连接,。但是这样的一个曲线并不光滑注意到，直线可以由2个点确定，而二次曲线由三个点即可确定，推广到一般情况， $n-1$ 阶曲线可以由$n$个点确定这本质上就是Lagrange插值法的思想 (必须经过所有点) 一般来说，如果我们有 $n$ 个点 $\left(x_1, y_1\right), \ldots,\left(x_n, y_n\right)$ ，各 $x_i$ 互不相同。对于 1 到 $\mathrm{n}$ 之间的每个 $k$, 定义 $n-1$ 次多项式 $$ L_k(x)=\frac{\left(x-x_1\right) \ldots\left(x-x_{k-1}\right)\left(x-x_{k+1}\right) \ldots\left(x-x_n\right)}{\left(x_k-x_1\right) \ldots\left(x_k-x_{k-1}\right)\left(x_k-x_{k+1}\right) \ldots\left(x_k-x_n\right)} $$ $L_k(x)$ 具有有趣的性质: $L_k\left(x_k\right)=1, L_k\left(x_j\right)=0, j \neq k$.

Zhe Li

Mar 5, 2024 4 min read Classical Statistics

B样条（B-Splines)

混合高斯模型的代码实现

Table of Contents 一、生成混合高斯数据 1、原理 2、Python实现 3、R实现二、EM算法 1、原理 2、Python实现 3、R实现 4、第三方工具库三、真实数据 1、Python实现 2、R实现四、后记一、生成混合高斯数据 1、原理利用混合高斯模型的公式： $$ P(y \mid \theta)=\sum_{k=1}^{K} \alpha_{k} \phi\left(y \mid \theta_{k}\right) $$ 只需要给定：

Zhe Li

Nov 2, 2023 5 min read Classical Statistics

Contact

zheli20@fudan.edu.cn