R语言实战——一些批量对地理数据进行操作的方法

🕗 发布于 2024-11-05 14:17 r语言 开发语言

各位朋友在进行数据处理时，当有多张栅格影像时，如果我们都要进行同一操作时，一张一张做很繁琐，用ArcGIS模型构建器是一种比较好的方法。当然，今天小编新学了R语言上面进行批量裁剪，一起来学习一下吧！

一、批量裁剪

当我们有一张栅格数据时，需要按照特定的空间范围进行矢量数据裁剪时，应该怎么办？

话不多说，直接上代码：

裁剪
library(terra)
# 定义栅格文件和矢量数据路径
raster_file <- "H:/TEMData/Result/mean_output.tif"  # 栅格文件路径
vector_file <- "H:/shpfile"  # 矢量数据路径
output_file <- "H:/TEMData/Result/cropped_output.tif"    # 输出文件路径

# 读取栅格数据
raster_data <- rast(raster_file)

# 读取矢量数据
vector_data <- vect(vector_file)

# 设置栅格数据的坐标系（如果需要）
if (is.na(crs(raster_data))) {
  crs(raster_data) <- crs(vector_data)
}

# 使用 crop 和 mask 函数进行裁剪
masked_data <- crop(raster_data, vector_data) %>% 
  mask(., vector_data)

# 写入裁剪后的数据到输出文件
writeRaster(masked_data, output_file, overwrite = TRUE)

cat("Cropped raster saved to:", output_file, "\n")

# 可选：显示裁剪后的栅格
plot(masked_data, main = "Cropped Raster", col = terrain.colors(20))

上面是单张栅格影像的处理，那如果我有20张，有50张呢？那我们来写个循环吧。

library(terra)
library(magrittr)  # 加载管道操作符

# 批量读取tif
folder <- "F:/shiyan1/"
# 输出文件夹路径，保存裁剪后的数据
output_folder <- "F:/result1/"

# 创建输出文件夹
if (!dir.exists(output_folder)) { 
  dir.create(output_folder)
}

# 获取所有TIF文件
tiff_files <- list.files(path = folder, pattern = "\\.tif$", full.names = TRUE)

# 读取 Shapefile 数据
shp_data <- vect("F:/hlbe")

# 循环处理每个TIF文件
for (tiff_file in tiff_files) { 
  # 从文件名中提取文件名（不包括路径和扩展名） 
  output_name <- tools::file_path_sans_ext(basename(tiff_file)) 
  
  # 读取 GeoTIFF 数据
  raster_data <- rast(tiff_file) 
  
  # 使用 mask 函数进行按照 Shapefile 进行的遮罩
  masked_data <- crop(raster_data, shp_data) %>% 
    mask(., shp_data) 
  
  # 构建输出文件路径
  output_path <- file.path(output_folder, paste0(output_name, ".tif")) 
  
  # 写入裁剪后的数据到输出文件 
  writeRaster(masked_data, output_path, overwrite = TRUE) 
  
  cat("File", tiff_file, "processed and saved to", output_path, "\n")
}

# 加载显示裁剪后的数据
output_rasters <- list.files(path = output_folder, pattern = "\\.tif$", full.names = TRUE)
if (length(output_rasters) > 0) {
  plot(rast(output_rasters))
} else {
  cat("No raster files found in the output folder.\n")
}

上面写了一个for循环，用mask函数进行掩膜处理，这样子就可以实现批量裁剪啦。

不过大家要注意，在进行代码梳理的时候，一定要注意，矢量空间范围和栅格数据的坐标系要统一，不然可能因为空间范围不同，没有重叠，或者坐标系冲突，从而产生错误结果。代码可以直接用，要改的地方就是文件夹的读取和导出，大家要复制自己所在数据地址哈！

二、定义坐标系

既然上面讲到了坐标系要统一，那么我们想到，怎么样对一张栅格影像进行坐标系定义呢？

我们上代码：

library(terra)

# 定义输入文件夹和输出文件夹
folder <- "F:/shiyan1/"
output_folder <- "F:/result1/"

# 创建输出文件夹
if (!dir.exists(output_folder)) {
  dir.create(output_folder)
}

# 获取所有TIF文件
tiff_files <- list.files(path = folder, pattern = "\\.tif$", full.names = TRUE)

# 循环处理每个TIF文件
for (tiff_file in tiff_files) {
  # 读取 GeoTIFF 数据
  raster_data <- rast(tiff_file)
  
  # 设置坐标系为 WGS 1984
  crs(raster_data) <- "EPSG:4326"
  
  # 构建输出文件路径
  output_path <- file.path(output_folder, basename(tiff_file))
  
  # 写入设置坐标系后的数据到输出文件 
  writeRaster(raster_data, output_path, overwrite = TRUE) 
  
  cat("File", tiff_file, "processed and saved with WGS 1984 coordinate system to", output_path, "\n")
}

这里我们将栅格数据定义为WGS1984坐标系，大家找到要定义的坐标系的EPSG代码，改一改就行啦。

三、批量转换数据格式

在进行数据处理时，tif格式的数据是常用的数据格式，我们从一些网站下面下载的数据可能是GRID格式或者其他格式，小编在处理多年风速数据的时候就遇到了这个问题，如果你需要将多张其他格式的数据转换成tif格式，应该怎么做？

我们上代码：

# 加载必要的包
library(terra)

# 设置输入和输出文件夹
input_folder <- "H:/VData/"  # 输入 ADF 文件夹路径
output_folder <- "H:/tem/output/"  # 输出 TIFF 文件夹路径

# 创建输出文件夹（如果不存在）
if (!dir.exists(output_folder)) {
  dir.create(output_folder)
}

# 获取所有 ADF 文件夹
adf_dirs <- list.dirs(path = input_folder, full.names = TRUE, recursive = FALSE)

# 循环处理每个 ADF 文件夹
for (adf_dir in adf_dirs) {
  # 检查是否存在 ADF 文件
  adf_files <- list.files(adf_dir, pattern = "\\.adf$", full.names = TRUE)
  if (length(adf_files) > 0) {
    # 读取 ADF 数据
    raster_data <- rast(adf_dir)
    
    # 从文件夹名中提取输出 TIFF 文件名
    output_name <- tools::file_path_sans_ext(basename(adf_dir))  # 不包括后缀
    output_file <- file.path(output_folder, paste0(output_name, ".tif"))
    
    # 将 ADF 数据保存为 TIFF 格式
    writeRaster(raster_data, output_file, overwrite = TRUE)  # 不需要指定 format
    
    cat("Converted:", adf_dir, "to", output_file, "\n")
  } else {
    cat("No ADF files found in:", adf_dir, "\n")
  }
}

通过上述代码，我们可以实现对数据的格式转换，中间我们用if函数检查了一下我们的文件夹里面是否存在我们需要转换的数据格式文件，如果没有会报出，这时我们需要对文件夹重新整理。小编在处理的时候，一开始有info文件夹在里头，R语言读不了，后面吧info文件删除之后，就能够开始读取了。

四、栅格计算

当我们有连续20年的数据，如果需要进行均值计算时，怎么办？

library(terra)

# 定义输入文件夹
input_folder <- "H:/TEMData/Data"

# 获取所有 TIF 文件
tiff_files <- list.files(path = input_folder, pattern = "\\.tif$", full.names = TRUE)

# 读取第一个栅格数据以获取参考范围和分辨率
reference_raster <- rast(tiff_files[1])

# 创建一个空的列表来存储对齐后的栅格数据
aligned_rasters <- list(reference_raster)

# 循环处理其他栅格文件
for (tiff_file in tiff_files[-1]) {
  # 读取栅格数据
  raster_data <- rast(tiff_file)
  
  # 对齐栅格数据到参考栅格的范围和分辨率
  aligned_raster <- project(raster_data, reference_raster)
  
  # 添加对齐后的栅格到列表
  aligned_rasters <- c(aligned_rasters, list(aligned_raster))
}

# 将对齐后的栅格合并为一个栅格堆栈
raster_stack <- rast(aligned_rasters)

# 计算均值
mean_raster <- app(raster_stack, fun = mean, na.rm = TRUE)

# 构建输出文件路径
output_path <- "H:/TEMData/Result/mean_output.tif"

# 写入均值栅格数据到输出文件
writeRaster(mean_raster, output_path, overwrite = TRUE)

# 显示均值栅格
plot(mean_raster, main = "Mean Raster", col = terrain.colors(20))

cat("Mean raster saved to:", output_path, "\n")

这里是结果：

如果是要进行求和呢？

我们以逐月日照数据为例，来看看怎么实现？

library(terra)

# 设置输入文件夹路径
input_folder <- "H:/ssd/2013"
output_file <- "H:/ssd/result/annual_sum_raster.tif"

# 获取所有 TIF 文件
raster_files <- list.files(path = input_folder, pattern = "\\.tif$", full.names = TRUE)

if (length(raster_files) == 0) {
  stop("No TIF files found in the specified folder.")
}

annual_sum_raster <- NULL

# 循环处理每个栅格影像
for (raster_file in raster_files) {
  current_raster <- rast(raster_file)
  
  if (is.null(annual_sum_raster)) {
    annual_sum_raster <- current_raster
  } else {
    annual_sum_raster <- annual_sum_raster + current_raster
  }
  
  gc()  # 垃圾回收
}

writeRaster(annual_sum_raster, output_file, overwrite = TRUE)
cat("Annual sum raster saved to:", output_file, "\n")
plot(annual_sum_raster, main = "Annual Sum Raster")

需要注意的是年度合成数据因为计算量比较大，如果你的栅格有多张，可能算不出来，我们就需要设计一个垃圾回收的机制，来减少不必要的内存消耗，这里是月日照数据合成年总和数据的结果：

好了，今天我们的学习就到这里结束了，希望对大家有帮助！

我们是梧桐GIS，致力于分享数据处理的优质教程，谢谢大家关注！

原文地址：https://blog.csdn.net/Promising_GEO/article/details/143501599

免责声明：本站文章内容转载自网络资源，如本站内容侵犯了原著者的合法权益，可联系本站删除。更多内容请关注自学内容网（zxcms.com）！

上一篇：【系统架构设计师】2022年真题论文: 论区块链技术及应用（包括解题思路和素材）
下一篇：C语言猜数字小游戏

linux-下载抖音作品
在linux中批量下载抖音作品。
阅读更多2024-11-06
基于Zynq FPGA对雷龙SD NAND的测试
进入测试程序前，首先会对SD卡初始化并初始化建立FATFS文件系统，随后进入测试SD卡测试程序，在测试程序中，会写入一定大小的文件，然后对写入文件的时间进行测量，得到写入时间；本来打算拿这些样片去试试
阅读更多2024-11-06
【综合案例】使用React编写B站评论案例
在文本框中输入要评论的文本，然后点击【发布】按钮，即可将评论添加到下方的评论列表当中进行展示；和普通JS变量不同的是，状态变量一旦发生变化组件的视图UI。classnames是一个简单的JS库，可以非
阅读更多2024-11-06
关于使用python pptx生成或“复制”PPT页面的问题
这里还要提一嘴PowerPoint，这里主要是不太熟悉这个，里面好多东西都不懂，加之我最开拿到的模板是不完善的，需要调整，然后出现了我当时认为奇葩的问题：有的母版可以删除，有的不可以，并且PPT页面删
阅读更多2024-11-06
Redis常见面试题（二）
Redis常见面试题（二）
阅读更多2024-11-06
基于 Python 的 Django 框架开发的电影推荐系统
Python、Django、Layui、requests、MySQL/SQLite3、数据分析、协同过滤算法、ECharts。
阅读更多2024-11-06
动态库实现lua网络请求GET, POST, 下载文件
编写lua动态库实现网络请求
阅读更多2024-11-06
【数据结构与算法】第8课—数据结构之二叉树(堆)
树是一种非线性的数据结构，它是由n(n>=0)个有限节点组成一个具有层次关系的集合，一般是树根朝上，树叶朝下树有一个特殊的节点，叫做根节点，根节点没有前驱节点树的根节点下面又有很多子节点，但是这
阅读更多2024-11-06
【论文复现】KAN卷积：医学图像分割新前沿
在医学领域，图像分割是一项至关重要的任务。它不仅能够帮助医生更准确地诊断疾病，还能在手术规划、治疗评估以及医学研究等多个方面发挥巨大作用。随着人工智能和深度学习技术的飞速发展，医学图像分割技术也迎来了
阅读更多2024-11-06
群控系统服务端开发模式-应用开发-本地上传工厂及阿里云上传工厂开发
群控系统服务端开发模式-应用开发-本地上传工厂及阿里云上传工厂开发
阅读更多2024-11-06

R语言实战——一些批量对地理数据进行操作的方法

相关文章