어떤 경로의 모든 하위 폴더와 파일을 탐색하고 싶을 때가 있습니다. 만약 어떤 이름의 파일을 찾는다거나, 내부 파일을 정리해서 화면에 보여준다던지 그런 이유로요.
os.walk()
와 os.listdir()
함수를 이용하여 파일을 탐색할 수 있습니다. 예제와 함께 알아보겠습니다.
1. os.listdir()을 이용한 방법
먼저 우리가 탐색할 경로의 파일 구조는 다음과 같습니다.
test$ tree
.
├── file1.txt
├── folder1
│ └── file2.txt
├── folder2
│ ├── file3.txt
│ └── file4.txt
└── folder3
├── file5.txt
├── file6.txt
└── folder4
├── text2.txt
├── text3.txt
└── text.txt
os.listdir()
는 인자로 전달된 dir의 모든 파일을 출력해 줍니다.
다음은 os.listdir()에 root dir인 ./test/
를 인자로 전달하여 모든 파일들을 출력해주는 예제입니다.
import os
def print_files_in_dir(root_dir, prefix):
files = os.listdir(root_dir)
for file in files:
path = os.path.join(root_dir, file)
print(prefix + path)
if __name__ == "__main__":
root_dir = "./test/"
print_files_in_dir(root_dir, "")
Output:
./test/folder1
./test/file1.txt
./test/folder3
./test/folder2
os.listdir()
는 인자 내부에 있는 파일만 출력해주고, 그 파일이 폴더라면 그 내부의 파일들은 출력해주지 않습니다.
이런 것을 처리하고 싶다면, 재귀(recursive)로 처리해주면 됩니다.
다음은 재귀로 모든 하위 파일들을 출력해주는 예제입니다.
import os
def print_files_in_dir(root_dir, prefix):
files = os.listdir(root_dir)
for file in files:
path = os.path.join(root_dir, file)
print(prefix + path)
if os.path.isdir(path):
print_files_in_dir(path, prefix + " ")
if __name__ == "__main__":
root_dir = "./test/"
print_files_in_dir(root_dir, "")
Output:
./test/folder1
./test/folder1/file2.txt
./test/file1.txt
./test/folder3
./test/folder3/file5.txt
./test/folder3/folder4
./test/folder3/folder4/text3.txt
./test/folder3/folder4/text2.txt
./test/folder3/folder4/text.txt
./test/folder3/file6.txt
./test/folder2
./test/folder2/file3.txt
./test/folder2/file4.txt
2. os.walk()를 이용한 방법
위와 유사한 구현 내용을 os.walk()
로 처리할 수 있습니다.
os.walk()
는 하위의 폴더들을 for문으로 탐색할 수 있게 해줍니다.
인자로 전달된 path에 대해서 다음 3개의 값이 있는 tuple을 넘겨줍니다.
- root : dir과 files가 있는 path
- dirs : root 아래에 있는 폴더들
- files : root 아래에 있는 파일들
예제는 다음과 같습니다.
모든 하위 폴더들에 대해서 for문이 실행되며, root는 그 폴더의 path가 됩니다. dirs와 files는 root 바로 밑에 있는 폴더와 파일들에 대한 리스트입니다.
import os
if __name__ == "__main__":
root_dir = "./test/"
for (root, dirs, files) in os.walk(root_dir):
print("# root : " + root)
if len(dirs) > 0:
for dir_name in dirs:
print("dir: " + dir_name)
if len(files) > 0:
for file_name in files:
print("file: " + file_name)
Output:
# root : ./test/
dir: folder1
dir: folder3
dir: folder2
file: file1.txt
# root : ./test/folder1
file: file2.txt
# root : ./test/folder3
dir: folder4
file: file5.txt
file: file6.txt
# root : ./test/folder3/folder4
file: text3.txt
file: text2.txt
file: text.txt
# root : ./test/folder2
file: file3.txt
file: file4.txt
기본적으로 top-down 순서로 출력됩니다. 최하위 폴더에서 상위 폴더를 출력하는 bottom-up으로 탐색하고 싶다면 다음과 같이 topdown=False를 인자를 전달하면 됩니다.
os.walk(root_dir, topdown=False)
3. 참고
Related Posts
- Python - Yaml 파일 파싱하는 방법
- Python - 파일 내용 삭제
- Python - for문에서 리스트 순회 중 요소 값 제거
- Python - 두 리스트에서 공통 요소 값 찾기
- Python - 문자열 앞(뒤)에 0으로 채우기
- Python - 공백으로 문자열 분리
- Python - 중첩 리스트 평탄화(1차원 리스트 변환)
- Python - 16진수 문자열을 Int로 변환
- Python - 두 날짜, 시간 비교
- Python f-string으로 변수 이름, 값 쉽게 출력 (변수명 = )
- Python - nonlocal과 global 사용 방법
- Python 바다코끼리 연산자 := 알아보기
- Python - pip와 requirements.txt로 패키지 관리
- Python - 딕셔너리 보기 좋게 출력 (pprint)
- Python - Requests 사용 방법 (GET/POST/PUT/PATCH/DELETE)
- Python - 온라인 컴파일러 사이트 추천
- Python - os.walk()를 사용하여 디렉토리, 파일 탐색
- Python - 문자열 비교 방법
- Python - Text 파일 읽고 쓰는 방법 (read, write, append)
- Python - 리스트에서 첫번째, 마지막 요소 가져오는 방법
- Python - 두개의 리스트 하나로 합치기
- Python - 리스트의 마지막 요소 제거
- Python - 리스트의 첫번째 요소 제거
- Python 소수점 버림, 4가지 방법
- Python 코드 안에서 버전 확인 방법
- Python 소수점 반올림, round() 예제
- Python - 리스트 평균 구하기, 3가지 방법
- Python - bytes를 String으로 변환하는 방법
- Python - String을 bytes로 변환하는 방법
- Python 버전 확인 방법 (터미널, cmd 명령어)
- Python - 람다(Lambda) 함수 사용 방법
- Python - dict 정렬 (Key, Value로 sorting)
- Python - range() 사용 방법 및 예제
- Python - 리스트를 문자열로 변환
- Python - 문자를 숫자로 변환 (String to Integer, Float)