# 常见相似函数的区别

# 检验 test 相关

# z.test

  • :BSDA / TeachingDemos
  • 用途:均值或比例的 z 检验,用于大样本或已知总体标准差的情况。
  • 语法z.test(x, y=NULL, mu=0, sigma.x, sigma.y=NULL, alternative="two.sided", conf.level=0.95)
  • 主要参数
    • x, y :样本向量(单样本或双样本)
    • mu :原假设均值(默认 0)
    • sigma.x, sigma.y :已知总体标准差(必填)
    • alternative :"two.sided"、"less"、"greater"
    • conf.level :置信水平(默认 0.95)

# t.test

  • :stats(基础内置)
  • 用途:均值的 t 检验,用于小样本或未知总体标准差的情况。
  • 语法t.test(x, y=NULL, mu=0, paired=FALSE, var.equal=FALSE, alternative="two.sided", conf.level=0.95)
  • 主要参数
    • x, y :样本向量(单样本或双样本)
    • mu :原假设均值(默认 0)
    • paired :是否配对检验(默认 FALSE)
    • var.equal :是否假设方差相等(默认 FALSE,采用 Welch 校正)
    • alternativeconf.level :同 z.test

# prop.test

  • :stats(基础内置)
  • 用途:比例的卡方检验,检验观测频数与理论频数是否符合。
  • 语法prop.test(x, n, p=NULL, alternative="two.sided", conf.level=0.95, correct=TRUE)
  • 主要参数
    • x :成功次数(向量支持多组)
    • n :试验总次数
    • p :原假设比例(默认 NULL 表示 0.5)
    • correct :是否应用连续性修正(默认 TRUE)
    • alternativeconf.level :同上

# var.test

  • :stats(基础内置)
  • 用途:方差比的 F 检验,用于检验两个样本的方差是否相等。
  • 语法var.test(x, y, ratio=1, alternative="two.sided", conf.level=0.95)
  • 主要参数
    • x, y :两个样本向量
    • ratio :原假设的方差比(默认 1,即方差相等)
    • alternativeconf.level :同上

# sigma.test

  • :TeachingDemos
  • 用途:标准差 / 方差的卡方检验,检验单个样本的总体标准差是否等于指定值。
  • 语法sigma.test(x, sigma, alternative="two.sided", conf.level=0.95)
  • 主要参数
    • x :样本向量
    • sigma :原假设的标准差
    • alternativeconf.level :同上

# shapiro.test

  • :stats(基础内置)
  • 用途:Shapiro-Wilk 正态性检验,检验样本是否来自正态分布。
  • 语法shapiro.test(x)
  • 主要参数
    • x :样本向量(长度 3~5000)
  • 返回:W 统计量与 p 值,p > 0.05 表示符合正态分布

# levene.test

  • :car
  • 用途:Levene 方差齐性检验,检验多组样本的方差是否相等。
  • 语法leveneTest(y ~ group, data, center=median)
  • 主要参数
    • y ~ group :公式形式(y 为数值,group 为分组因子)
    • center :"median"(默认)或 "mean"
    • data :数据框

# 项目使用的包和函数

按包分组,先概述包用途,再列函数的主要作用与核心参数。

# base /stats(基础内置)

  • 主要用途:语言内核、基础数据结构、IO、统计基础。
  • read.csv(path, header=TRUE, sep=",", stringsAsFactors=FALSE) : 读表格文本。
  • write.csv(x, file) , write.table(x, file) , sink(file) : 写出 / 重定向。
  • 向量 / 序列: c(...) , seq(from, to, by, length.out) , rep(x, times, each)
  • 随机与分布: rnorm(n, mean, sd) , pnorm(x, mean, sd) , qnorm(p, mean, sd) , pt/qt
  • 索引 / 汇总: which , which.max , which.min , mean , median , sum , var , sd , min , max , range , quantile , summary , head , tail
  • 排序: sort , order , rank , rev
  • 结构: matrix(data, nrow, ncol, byrow, dimnames) , cbind , rbind , array(dim=...)
  • 数据框: data.frame(...) , as.data.frame(obj) , colnames<- , row.names<- , subset(x, condition, select) , cut(x, breaks, labels, ordered) , factor(x, levels, ordered)
  • apply 系列: apply(X, MARGIN, FUN) , lapply(X, FUN) , sapply(X, FUN)
  • 回归 / ANOVA: lm(formula, data) , aov(formula, data) , summary , confint , predict(model, newdata, interval) , anova(model) , plot(model)TukeyHSD(aov_model)
  • 统计检验: shapiro.test(x) , ks.test(x, "pnorm", mean, sd)

# agricolae

  • 用途:农学统计,事后比较。
  • HSD.test(aov_model, trt, alpha=0.05, group=TRUE, console=TRUE) : Tukey HSD 分组。

# BSDA / TeachingDemos

  • 用途:基础统计与教学函数。
  • z.test(x, mu=0, sigma.x, alternative, conf.level) : 均值 / 比例 z 检验与区间。
  • z.test(xbar, mu, stdev, n, alternative, conf.level) (TeachingDemos 形式)。

# car

  • 用途:回归诊断与方差齐性检验。
  • leveneTest(y ~ group, data, center=median) : 方差齐性。
  • ncvTest(model) : 异方差检验。
  • durbinWatsonTest(model) : 自相关检验。
  • vif(model) : 方差膨胀因子。

# DescTools

  • 用途:描述统计与效应量。
  • Mode(x) : 众数。
  • EtaSq(model, type=1/2) : 方差分析效应量 η²。
  • BarText(heights, b, horiz=FALSE, ...) : 条形图标注。

# e1071

  • 用途:统计扩展。
  • skewness(x, type) , kurtosis(x, type) : 偏度、峰度。

# ggiraphExtra

  • 用途:交互 / 雷达图。
  • ggRadar(data, rescale=FALSE, aes(group=...), alpha=0, size=2) : 雷达图。

# ggExtra

  • 用途:ggplot 边际图。
  • ggMarginal(p, type="boxplot"/"density") : 添加边际分布。

# gginference

  • 用途:基于 ggplot 的统计可视化。
  • ggaov(aov_model, colreject, colstat) : ANOVA 可视化。

# ggplot2

  • 用途:语法层次化绘图。
  • ggplot(data, aes(...)) + geom_line/point/boxplot 等; facet_grid 分面。

# ggpubr

  • 用途:简化 ggplot 统计标注。
  • stat_anova_test(method="one_way", label="as_detailed_italic") : 在图上标注 ANOVA 结果。

# gplots

  • 用途:绘图增强。
  • plotmeans(formula, data, p=0.95, mean.labels=TRUE, ci.label=TRUE, n.label=TRUE) : 均值与 CI 绘图。

# HH

  • 用途:交互作用可视化。
  • interaction2wt(formula, data) : 双因素交互图。

# investr

  • 用途:回归辅助。
  • plotFit(model, interval="confidence"/"prediction", level) : 绘制回归线及带。

# lm.beta

  • 用途:标准化回归系数。
  • lm.beta(model) : 计算标准化系数。

# psych

  • 用途:心理与统计工具。
  • describe(x) : 描述性统计表。
  • corr.test(mat, method="pearson") : 相关系数与检验。

# RColorBrewer

  • 用途:调色板。
  • brewer.pal(n, name) : 获取离散色板。

# readxl

  • 用途:读取 Excel 文件。
  • read_excel(path, sheet=1, col_names=TRUE) : 选择工作表与表头。

# reshape2

  • 用途:数据宽长转换。
  • melt(data, id.vars, variable.name, value.name) : 宽转长。

# sjPlot

  • 用途:回归结果可视化。
  • plot_model(model, type="est"/"std"/"diag", show.values=TRUE, show.p=TRUE) : 系数 / 诊断图。

# stringr

  • 用途:字符串处理。
  • str_extract(_all)(x, pattern) : 提取匹配。
  • str_count(x, pattern) , str_length(x) : 计数与长度。
  • str_replace(_all)(x, pattern, replacement) : 替换。
更新于

请我喝[茶]~( ̄▽ ̄)~*

梦前辈 微信支付

微信支付

梦前辈 支付宝

支付宝