문자열에서 특정 단어를 추출할 때가 있습니다.
이 때 다음 방법들을 이용하면 문자열을 분리하여 특정 문자열을 추출할 수 있습니다.
split()을 이용한 방법
split()을 사용하여 특정 문자를 기준으로 문자열을 분리할 수 있습니다.
Syntax는 다음과 같습니다.
string.split(separator, maxsplit)
- separator: 문자열을 나눌 때 사용할 문자입니다. 기본 값은 whitespace입니다.
- maxsplit: 문자열을 나눌 횟수를 지정합니다. 기본 값은 -1이며, 제한 없이 모두 나눈다는 의미입니다.
다음과 같은 문자열이 주어졌을 때, split()은 whitespace를 기준으로 문자열을 나눕니다.
text = 'Hello world, python'
strings = text.split()
print(strings)
Output:
['Hello', 'world,', 'python']
split(',')
은 ,
를 기준으로 문자열을 나눕니다.
text = 'Hello world, python'
strings = text.split(',')
print(strings)
Output:
['Hello world', ' python']
다음과 같이 :
로 나눌 수도 있습니다.
text = 'Hello:world:python'
strings = text.split(':')
print(strings)
Output:
['Hello', 'world', 'python']
이렇게 단어 단위로 분리된 리스트에서 원하는 문자열을 사용할 수 있습니다.
regex(정규표현식)을 사용한 방법
regex(정규표현식)으로 특정 문자열을 찾을 수 있습니다. re.findall()
함수에 정규표현식과 문자열을 인자로 전달하면, regex와 일치하는 문자열 리스트가 리턴됩니다.
이 방법은 정규표현식을 알고 있어야 사용할 수 있습니다.
findall()
의 Syntax는 다음과 같습니다.
findall(regex, string)
다음과 같이 regex에 r'\w+'
를 인자로 전달하면 whitespace 기준으로 문자열을 분리합니다. (\w
는 non-word를 의미하며 알파벳, 숫자 등의 문자를 의미합니다.)
import re
text = 'Hello world, python'
strings = re.findall(r'\w+', text)
print(strings)
Output:
['Hello', 'world', 'python']
아래 예제에서 :
으로 구분된 단어들은 r'(\w+):?'
으로 구분할 수 있습니다. 단어 중에 :
가 마지막에 포함되거나 포함되지 않은 모든 단어를 찾습니다.
import re
text = 'Hello:world:python'
strings = re.findall(r'(\w+):?', text)
print(strings)
Output:
['Hello', 'world', 'python']
Loading script...
Related Posts
- Python - Yaml 파일 파싱하는 방법
- Python - 파일 내용 삭제
- Python - for문에서 리스트 순회 중 요소 값 제거
- Python - 두 리스트에서 공통 요소 값 찾기
- Python - 문자열 앞(뒤)에 0으로 채우기
- Python - 공백으로 문자열 분리
- Python - 중첩 리스트 평탄화(1차원 리스트 변환)
- Python - 16진수 문자열을 Int로 변환
- Python - 두 날짜, 시간 비교
- Python f-string으로 변수 이름, 값 쉽게 출력 (변수명 = )
- Python - nonlocal과 global 사용 방법
- Python 바다코끼리 연산자 := 알아보기
- Python - pip와 requirements.txt로 패키지 관리
- Python - 딕셔너리 보기 좋게 출력 (pprint)
- Python - Requests 사용 방법 (GET/POST/PUT/PATCH/DELETE)
- Python - 온라인 컴파일러 사이트 추천
- Python - os.walk()를 사용하여 디렉토리, 파일 탐색
- Python - 문자열 비교 방법
- Python - Text 파일 읽고 쓰는 방법 (read, write, append)
- Python - 리스트에서 첫번째, 마지막 요소 가져오는 방법
- Python - 두개의 리스트 하나로 합치기
- Python - 리스트의 마지막 요소 제거
- Python - 리스트의 첫번째 요소 제거
- Python 소수점 버림, 4가지 방법
- Python 코드 안에서 버전 확인 방법
- Python 소수점 반올림, round() 예제
- Python - 리스트 평균 구하기, 3가지 방법
- Python - bytes를 String으로 변환하는 방법
- Python - String을 bytes로 변환하는 방법
- Python 버전 확인 방법 (터미널, cmd 명령어)
- Python - 람다(Lambda) 함수 사용 방법
- Python - dict 정렬 (Key, Value로 sorting)
- Python - range() 사용 방법 및 예제
- Python - 리스트를 문자열로 변환
- Python - 문자를 숫자로 변환 (String to Integer, Float)