如何根据同一行的ID利用R语言对值进行求和
需求:将属于同一分组的对应的值进行求和或者求平均值
#设置工作目录
> getwd()
[1] "C:/Users/86150/Documents"
> setwd("C:/Users/86150/Desktop/AA2024/RUF")
> list.files()
#读取文件
>install.packages("readxl")
>library("readxl")
> df <- read_excel("202002_RUF_Seed.xlsx")
> head(df)
# A tibble: 6 × 2
group seed
<chr> <chr>
1 R1 5.33
2 R10 1.8
3 R10 0.45
4 R10 5.68
5 R10 1.48
6 R105 0,.06
##利用函数aggregate进行分组求和
> merge_data <- aggregate(.~group,data=df,sum())
出现报错:
Error in FUN(X[[i]], ...) : invalid 'type' (character) of argument
You need to remove the color column from the x argument, since it is not being used in aggregation, but is actually the by argument.
aggregate(csv[-1], csv["color"], sum)
# color val2 val3
# 1 blue 6 13
# 2 green 7 3
# 3 red 11 9
换一种方法还是不行:
library(dplyr)
df %>% group_by(group) %>% summarise_each(funs(sum))
使用命令 class(df$seed)
:检测发现SUM求和的那一列为字符串类型
[1] "character"
解决方法:
发现是因为seed列为字符型,而sum函数要求数值型,因此只需要将seed转为数值型即可:
figa1 <- df %>% mutate(
seed = as.numeric(as.character(
seed))) %>% group_by(group) %>% summarize(total = sum(
seed))
mutate(
seed = as.numeric(as.character(
seed)))
指的是把count转为数值型
将结果输出:保存为excel的可读形式
#加载“xlsx”
library(xlsx)
library(writexl)
install.packages("openxlsx") #如果没有这个包就安装
library(openxlsx)
write.xlsx(figa1, "C:/Users/86150/Desktop/AA2024/RUF", append = TRUE)
write_xlsx(figa1, "C:/Users/86150/Desktop/AA2024/RUF")
##这个测试成功了
install.packages("openxlsx") #如果没有这个包就安装
library(openxlsx)
write.xlsx(figa1, file = file.path("C:/Users/86150/Desktop/AA2024/RUF", "202002ruf_seed.xlsx"))
结果如图:total列显示为每个编号的总的种子总量(备注:因为一个材料编号一般种了三个重复)
注意事项:在将数据(a.xlsx)导入r语言之前需对数据进行检测,包括sum列的数字格式类型是否为字符串,以及sum值输入时是否存在错误(例如将“.”写成“,”;是否存在中文即非纯数字)
参考文献来源:
R语言中怎么将数据框导出成xlsx文件并规定存放目录_r语言数据导出成xlsx-CSDN博客
R 报错: x invalid 'type' (character) of argument - 橙子牛奶糖 - 博客园 (cnblogs.com)
原文地址:https://blog.csdn.net/hgz2020/article/details/140561748
免责声明:本站文章内容转载自网络资源,如本站内容侵犯了原著者的合法权益,可联系本站删除。更多内容请关注自学内容网(zxcms.com)!