정규표현식 re 모듈

2023. 11. 25. 22:27파이썬/문법

#re 와 replace를 활용해 특정 문자열 빼고 추출하기
import re

# Your input string
input_string = "Some 한국어 characters here"

# Remove Korean characters
#output_string = re.sub('[가-힣]', '', input_string)
output=input_string.replace('[가-힣]','')
print(output_string)

 

"Some 한국어 characters here" 문자열이 존재한다. 

 

영어 문자 사이에 '한국어'라는 한글이 껴있는데 삭제하는 방법이 없을까?

 

해결을 위해 re모듈을 사용한다. 

 

re.sub() : 정규 표현식의 sub메소드는 정규식을 이용해 문자열을 치환하는 방법

re.sub(pattern, replace, text)

 

*정규표현식 : regular expression의 축약으로 regex 등으로 불린다. 

=>어떤 텍스트 내에서 '특정한 형태나 규칙을 가진 문자열'을 찾기 위해 그 형태나 규칙을 나타내는 패턴을 정의하는 식

 

re.sub('[가-힣]', '', input_string) : [가-힣] 까지 ' ' (공백) 으로 만들기

 

input_string.replace('[가-힣]','')  #replace를 사용해도 동일한 결과 도출됨

 

 

<출처>

https://co-no.tistory.com/111

 

정규표현식(Regex)의 개념과 기초 문법

정규표현식이란? : Regular Expression을 줄여서 Regex, Regexp 등으로 불린다. Computer Science의 정규 언어(Regular Language)로부터 유래한 것으로, 특정한 규칙을 가진 문자열의 집합을 표현하기 위해 쓰이는 *

co-no.tistory.com

 

https://jjuha-dev.tistory.com/entry/Python-%EC%A0%95%EA%B7%9C%ED%91%9C%ED%98%84%EC%8B%9D-resub%EC%9D%84-%EC%9D%B4%EC%9A%A9%ED%95%9C-%EB%AC%B8%EC%9E%90%EC%97%B4-%EC%B9%98%ED%99%98%ED%95%98%EA%B8%B0

 

[Python] 정규표현식 re.sub을 이용한 문자열 치환하기

정규표현식 re.sub() 파이썬에서 정규 표현식을 활용할 땐 re 모듈을 사용한다. 이 중 sub 메소드는 정규식을 이용해 문자열을 치환하는 방법이다. 형식은 다음과 같다. re.sub(pattern, replace, text) : text

jjuha-dev.tistory.com

 

'파이썬 > 문법' 카테고리의 다른 글

정규 표현식 정리 [• . ^ $ * + ? { } [ ] \ | ( ) ]  (0) 2023.11.30
numpy - vstack과 hstack 함수  (0) 2023.11.13
(파이썬)class 개념 이해  (0) 2023.09.17