파이썬에서 문자열의 특수문자만 제거하거나, 숫자만 제거, 또는 숫자만 남기고 다른 문자를 제거하는 방법을 소개합니다.
1. 문자열에서 특수문자 제거
re.sub(pattern, replacement, string)
은 string에서 정규표현식의 pattern과 일치하는 내용을 replacement로 변경합니다.
만약 빈 문자열(""
)로 변경하면 패턴에 해당하는 문제만 제거하게 됩니다.
아래 예제는 문자열에서 특수문자만 제거합니다. 정확히는 한글, 영어, 숫자, 공백(스페이스)를 제외한 다른 문자를 모두 제거합니다.
예제에서 사용되는 정규표현식의 의미는 아래와 같습니다. 표현식 앞에 ^
를 붙이면 not의 의미로, 그 정규표현식에 해당되지 않는 것을 찾습니다.
\uAC00-\uD7A30
: 모든 한글 음절(가-힣)a-z
: 영어 소문자A-Z
: 영어 대문자0-9
: 숫자\s
: 띄어쓰기
import re
str = "AA**BB#@$CC 가나다-123"
new_str = re.sub(r"[^\uAC00-\uD7A30-9a-zA-Z\s]", "", str)
print(new_str)
Output:
AABBCC 가나다123
2. 문자열에서 숫자만 남기기
숫자를 제외한 문자들을 패턴으로 만들면 [^0-9]
가 됩니다. 0-9
는 0에서 9사이의 숫자를 의미하고 ^
는 not이므로, 숫자가 아닌 문자열을 찾는 패턴이 됩니다.
import re
string = "AA**BB#@$CC 가나다-123"
new_str = re.sub(r"[^0-9]", "", string)
print(new_str)
Output:
123
3. 문자열에서 숫자만 제거
[0-9]
패턴을 찾고 빈 문자열로 변경하면, 숫자만 제거하게 됩니다.
import re
string = "AA**BB#@$CC 가나다-123"
new_str = re.sub(r"[0-9]", "", string)
print(new_str)
Output:
AA**BB#@$CC 가나다-
4. 문자열에서 알파벳만 남기기
[^a-zA-Z]
패턴은 알파벳을 제외한 문자들입니다. 이 패턴에 해당하는 문자를 빈 문자열로 변환하면 알파벳만 남게 됩니다.
import re
string = "AA**BB#@$CC 가나다-123"
new_str = re.sub(r"[^a-zA-Z]", "", string)
print(new_str)
Output:
AABBCC
Loading script...
Related Posts
- Python - Yaml 파일 파싱하는 방법
- Python - 파일 내용 삭제
- Python - for문에서 리스트 순회 중 요소 값 제거
- Python - 두 리스트에서 공통 요소 값 찾기
- Python - 문자열 앞(뒤)에 0으로 채우기
- Python - 공백으로 문자열 분리
- Python - 중첩 리스트 평탄화(1차원 리스트 변환)
- Python - 16진수 문자열을 Int로 변환
- Python - 두 날짜, 시간 비교
- Python f-string으로 변수 이름, 값 쉽게 출력 (변수명 = )
- Python - nonlocal과 global 사용 방법
- Python 바다코끼리 연산자 := 알아보기
- Python - pip와 requirements.txt로 패키지 관리
- Python - 딕셔너리 보기 좋게 출력 (pprint)
- Python - Requests 사용 방법 (GET/POST/PUT/PATCH/DELETE)
- Python - 온라인 컴파일러 사이트 추천
- Python - os.walk()를 사용하여 디렉토리, 파일 탐색
- Python - 문자열 비교 방법
- Python - Text 파일 읽고 쓰는 방법 (read, write, append)
- Python - 리스트에서 첫번째, 마지막 요소 가져오는 방법
- Python - 두개의 리스트 하나로 합치기
- Python - 리스트의 마지막 요소 제거
- Python - 리스트의 첫번째 요소 제거
- Python 소수점 버림, 4가지 방법
- Python 코드 안에서 버전 확인 방법
- Python 소수점 반올림, round() 예제
- Python - 리스트 평균 구하기, 3가지 방법
- Python - bytes를 String으로 변환하는 방법
- Python - String을 bytes로 변환하는 방법
- Python 버전 확인 방법 (터미널, cmd 명령어)
- Python - 람다(Lambda) 함수 사용 방법
- Python - dict 정렬 (Key, Value로 sorting)
- Python - range() 사용 방법 및 예제
- Python - 리스트를 문자열로 변환
- Python - 문자를 숫자로 변환 (String to Integer, Float)