Python - 문자열 단어 개수 가져오기

문자열에서 단어 수를 가져오는 방법을 소개합니다.

1. split()을 이용한 방법

string.split()은 문자열을 공백으로 분리하고 분리된 문자열을 리스트로 리턴합니다. 리턴된 리스트의 길이가 단어의 개수가 됩니다.

str = "Hello, world. This is an example."

result = str.split()
word_cnt = len(result)

print(result)
print(word_cnt)

Output:

['Hello,', 'world.', 'This', 'is', 'an', 'example.']
6

2. 정규표현식을 이용한 방법

re.findall(pattern, string)은 string에서 pattern과 일치하는 문자열을 찾아서 리스트로 리턴합니다.

re.findall(r'\w+', str)를 이용하여 단어의 개수를 가져올 수 있습니다.

  • \w 패턴은 word를 의미하며 알파벳, 숫자, _ 중의 한 문자를 의미
  • \w+에서 +는 앞의 패턴이 1회 이상 반복되는 문자들을 의미, 즉, \w+는 1개 이상의 word들을 의미
import re

str = "Hello, world. This is an example."

result = re.findall(r'\w+', str)
word_cnt = len(result)

print(result)
print(word_cnt)

Output:

['Hello', 'world', 'This', 'is', 'an', 'example']
6
Loading script...
codechachaCopyright ©2019 codechacha