百度360必应搜狗淘宝本站头条
当前位置:网站首页 > IT知识 > 正文

Shell如何检查一个目录是否为空?

liuian 2024-11-28 00:43 18 浏览


如何检查一个目录是否为空?如何检查是否存在任何 *.mpg 文件,或者计算有多少个这样的文件?

在 Bash 中,你可以通过使用 nullglob 和 dotglob 选项(这会改变 globbing 的行为),以及一个 array,安全而简便地计算文件数量:

# Bash
shopt -s nullglob dotglob
files=(*)
(( ${#files[*]} )) || echo 目录为空
shopt -u nullglob dotglob

当然,你可以使用任何你喜欢的 glob,而不仅仅是 。比如,.mpg 或者 /my/music/*.mpg 都可以正常工作。

请注意,你需要对目录拥有读取权限,否则它将始终显示为空。

一些人不喜欢 nullglob,因为没有匹配的 glob 会完全消失,这会让像 ls 这样的程序感到困惑。如果将 ls *.zip 错误地输入为 ls *.zpi,可能会导致显示所有文件(对于这种情况,考虑设置 failglob)。在子 shell 中设置 nullglob 可以避免意外地改变其余部分的 shell 设置,但代价是额外的 fork()。如果你想避免设置和取消设置 shell 选项,你可以将所有内容放入一个子 shell:

# Bash
if (shopt -s nullglob dotglob; f=(*); ((! ${#f[@]}))); then
    echo "当前目录为空。"
fi

这种方法的另一个缺点(除了额外的 fork())是,当子 shell 退出时,数组会丢失。如果你计划稍后使用这些文件名,那么它们必须再次检索。

这两个示例都会扩展 glob 并将结果文件名存储到一个数组中,然后检查数组中元素的数量是否为 0。如果你实际上想要查看有多少个文件,只需打印数组的大小,而不是检查它是否为 0:

# Bash
shopt -s nullglob dotglob
files=(*)
echo "当前目录包含 ${#files[@]} 个文件。"

如果你不介意在数组中放入一个不存在的文件名(而不是一个空数组),你也可以避免使用 nullglob:

# Bash
shopt -s dotglob
files=(*)
if [[ -e ${files[0]} || -L ${files[0]} ]]; then
    echo "当前目录不为空。它包含以下文件:"
    printf '%s\n' "${files[@]}"
fi

如果目录中没有文件,则没有 nullglob,这个 glob 将被添加为数组中的唯一元素。由于 * 是一个有效的文件名,我们无法简单地检查数组是否包含一个字面上的 *。因此,我们检查数组中的内容是否作为文件存在。需要注意的是,-L 测试是必需的,因为 -e 如果第一个文件是一个 dangling symlink,将失败。

如果您不关心有多少匹配的文件,并且不想将结果存储在数组中,您可以使用Bash的compgen命令。不幸的是,由于一个bug,您需要使用一个技巧让其识别dotglob:

# Bash
if (shopt -s dotglob; : *; compgen -G '*' >/dev/null); then
    echo "当前目录不为空。"
else
    echo "当前目录为空。"
fi

或者您可以使用扩展的glob:

# Bash
# 可以通过为整个脚本启用extglob来避免子shell。
# 这样做是安全的。
if (shopt -s extglob; compgen -G '@(*|.[!.]*|..?*)' >/dev/null); then
    echo "当前目录不为空。"
else
    echo "当前目录为空。"
fi

您还可以使用failglob:

# Bash
if (shopt -s dotglob failglob; : ./*) 2>/dev/null; then
    echo "当前目录不为空。"
else
    echo "当前目录为空。"
fi

但是,请注意,如果您使用failglob,则需要子shell;下面的代码无法运行,因为failglob会引发一个shell错误,导致Bash停止运行当前命令(包括if命令,任何外部复合命令以及运行此代码的整个函数,如果它是函数的一部分),因此这仅适用于true的情况,else分支永远不会运行:

# 错误的代码!
shopt -s dotglob failglob
if { : ./*; } 2>/dev/null; then
    echo "当前目录不为空。"
else
    echo "当前目录为空。"
fi

如果您真的想避免使用子shell并且想要全局设置failglob,您可以使用命令eval来“捕获”shell错误,或者您可以编写一个间接展开glob的函数:

shopt -s dotglob failglob
if command eval ': ./*' 2>/dev/null; then
    echo "当前目录不为空。"
else
    echo "当前目录为空。"
fi
# 或者
shopt -s dotglob failglob
any_match () { local IFS=; { : "$@"; } 2>/dev/null; }
if any_match './*'; then
    echo "当前目录不为空。"
else
    echo "当前目录为空。"
fi

如果您的脚本需要在各种非Bash shell实现中运行,您可以尝试使用外部程序如Python、Perl或find;或者您可以尝试以下方法。请注意“magic 3 globs”^[1],因为POSIX没有dotglob选项。

# POSIX
# 这会破坏位置参数,所以确保您不需要它们。
set -- * .[!.]* ..?*
for f in "$@"; do
  if test -e "$f" || test -L "$f"; then
    echo "目录不为空"
    break
  fi
done

在这个阶段,位置参数已经加载了目录的内容,并且可以用于处理。

如果你只想计算文件数量:

# POSIX
n=0
for f in * .[!.]* ..?*; do
  if test -e "$f" || test -L "$f"; then n=$((n+1)); fi
done
printf "共有 %d 个文件。\n" "$n"

在 Bourne shell 中,情况更糟糕,因为没有 test -e 或 test -L?:

# Bourne
# (当然,系统必须有 printf(1)。)
if test "`printf '%s %s %s' .* *`" = '. .. *' && test ! -f '*'
then
    echo "目录为空"
fi

当然,如果 *? 存在于普通文件以外的其他内容(如目录或 FIFO),这种方法会失败。缺少 -e? 测试真的很痛苦。

这里还有另一种使用 find? 的解决方案:

# POSIX
# 打印每个文件的一个 `.` 并计算打印的字符数。
# 这个解决方案将递归。如果不想递归,请参见下面的内容。
n=$(find . -type f -exec printf %.0s. {} + | wc -m)
printf "共有 %d 个文件。\n" "$n"

如果你不希望递归,那么你需要告诉 find? 不要递归进入目录。这变得非常棘手和丑陋。GNU find? 有一个 -maxdepth? 选项来实现此功能。对于标准的 POSIX find?,你只能使用 -prune?。这留给读者作为练习。

永远不要尝试解析 ls? 的输出。即使是 ls -A? 的解决方案也可能会出错(例如,在 HP-UX 上,如果你是 root 用户,ls -A? 与非 root 用户的行为正好相反--不,我不能编造出这么愚蠢的东西)。

实际上,你可能希望完全避免直接的 *问题。通常人们想知道一个目录是否为空是因为他们想在其中的文件中进行一些操作等。要看到更大的问题。例如,这些基于 find? 的例子可能是一个合适的解决方案:

# Bourne / POSIX
find "$somedir" -type f -exec echo 发现意外的文件 {} \;
find "$somedir" -prune -empty -exec printf '%s 是空的。\n' {} \;  # GNU/BSD
find "$somedir" -type d -empty -exec cp /my/configfile {} \;   # GNU/BSD

最常见的情况是只需要像这样:

# Bourne / POSIX
for f in ./*.mpg; do
    test -f "$f" || continue
    mympgviewer "$f"
done

换句话说,提问者可能认为需要显式的空目录测试来避免出现错误消息,比如 mympgviewer: ./*.mpg: No such file or directory?,当实际上并不需要这样的测试。

对于类似 nullglob 的特性的支持是不一致的。在 ksh93 中,可以通过在模式前加上 ~(N)? 来实现每个模式的基础:

# ksh93
for f in ~(N)*; do
    ....
done

如果您觉得文章内容对你有一点帮助可以关注我,我在头条平台会持续分享更多实用的shell技巧和最佳实践,如果想系统的快速学习shell的各种高阶用法和生产环境避坑指南可以看看《shell脚本编程最佳实践》专栏,专栏里有更多的实用小技巧和脚本代码分享。

相关推荐

GANs为何引爆机器学习?这篇基于TensorFlow的实例教程为你解惑!

「机器人圈导览」:生成对抗网络无疑是机器学习领域近三年来最火爆的研究领域,相关论文层出不求,各种领域的应用层出不穷。那么,GAN到底如何实践?本文编译自Medium,该文作者以一朵玫瑰花为例,详细阐...

高丽大学等机构联合发布StarGAN:可自定义表情和面部特征

原文来源:arXiv、GitHub作者:YunjeyChoi、MinjeChoi、MunyoungKim、Jung-WooHa、SungKim、JaegulChoo「雷克世界」编译:嗯~...

TensorFlow和PyTorch相继发布最新版,有何变化

原文来源:GitHub「机器人圈」编译:嗯~阿童木呀、多啦A亮Tensorflow主要特征和改进在Tensorflow库中添加封装评估量。所添加的评估量列表如下:1.深度神经网络分类器(DNNCl...

「2022 年」崔庆才 Python3 爬虫教程 - 深度学习识别滑动验证码缺口

上一节我们使用OpenCV识别了图形验证码躯壳欧。这时候就有朋友可能会说了,现在深度学习不是对图像识别很准吗?那深度学习可以用在识别滑动验证码缺口位置吗?当然也是可以的,本节我们就来了解下使用深度...

20K star!搞定 LLM 微调的开源利器

LLM(大语言模型)微调一直都是老大难问题,不仅因为微调需要大量的计算资源,而且微调的方法也很多,要去尝试每种方法的效果,需要安装大量的第三方库和依赖,甚至要接入一些框架,可能在还没开始微调就已经因为...

大模型DeepSeek本地部署后如何进行自定义调整?

1.理解模型架构a)查看深度求索官方文档或提供的源代码文件,了解模型的结构、输入输出格式以及支持的功能。模型是否为预训练权重?如果是,可以在预训练的基础上进行微调(Fine-tuning)。是否需要...

因配置不当,约5000个AI模型与数据集在公网暴露

除了可访问机器学习模型外,暴露的数据还可能包括训练数据集、超参数,甚至是用于构建模型的原始数据。前情回顾·人工智能安全动态向ChatGPT植入恶意“长期记忆”,持续窃取用户输入数据多模态大语言模型的致...

基于pytorch的深度学习人员重识别

基于pytorch的深度学习人员重识别Torchreid是一个库。基于pytorch的深度学习人员重识别。特点:支持多GPU训练支持图像的人员重识别与视频的人员重识别端到端的训练与评估简单的re...

DeepSeek本地部署:轻松训练你的AI模型

引言:为什么选择本地部署?在AI技术飞速发展的今天,越来越多的企业和个人希望将AI技术应用于实际场景中。然而,对于一些对数据隐私和计算资源有特殊需求的用户来说,云端部署可能并不是最佳选择。此时,本地部...

谷歌今天又开源了,这次是Sketch-RNN

前不久,谷歌公布了一项最新技术,可以教机器画画。今天,谷歌开源了代码。在我们研究其代码之前,首先先按要求设置Magenta环境。(https://github.com/tensorflow/magen...

Tensorflow 使用预训练模型训练的完整流程

前面已经介绍了深度学习框架Tensorflow的图像的标注和训练数据的准备工作,本文介绍一下使用预训练模型完成训练并导出训练的模型。1.选择预训练模型1.1下载预训练模型首先需要在Tensorf...

30天大模型调优学习计划(30分钟训练大模型)

30天大模型调优学习计划,结合Unsloth和Lora进行大模型微调,掌握大模型基础知识和调优方法,熟练应用。第1周:基础入门目标:了解大模型基础并熟悉Unsloth等工具的基本使用。Day1:大模...

python爬取喜马拉雅音频,json参数解析

一.抓包分析json,获取加密方式1.抓包获取音频界面f12打开抓包工具,播放一个(非vip)视频,点击“媒体”单击打开可以复制URL,发现就是我们要的音频。复制“CKwRIJEEXn-cABa0Tg...

五、JSONPath使用(Python)(json数据python)

1.安装方法pipinstalljsonpath2.jsonpath与Xpath下面表格是jsonpath语法与Xpath的完整概述和比较。Xpathjsonpath概述/$根节点.@当前节点...

Python网络爬虫的时候json=就是让你少写个json.dumps()

大家好,我是皮皮。一、前言前几天在Python白银交流群【空翼】问了一个Python网络爬虫的问题,提问截图如下:登录请求地址是这个:二、实现过程这里【甯同学】给了一个提示,如下所示:估计很多小伙伴和...