필사필요코드

불용어 제거 코드

백준파이썬개발자:프로젝트골드 2024. 3. 30. 13:28
반응형
import nltk
nltk.download('all')
from nltk.corpus import stopwords
from nltk.tokenize import word_tokenize


stop_words = set(stopwords.words('english'))

word_tokens = word_tokenize(exple)

result = []
for token in word_tokens:
    if token not in stop_words:
        result.append(token)

print(len(word_tokens))
print("불용어 제거")
#print(result)
반응형