2023. 11. 25. 22:27ㆍ파이썬/문법
#re 와 replace를 활용해 특정 문자열 빼고 추출하기
import re
# Your input string
input_string = "Some 한국어 characters here"
# Remove Korean characters
#output_string = re.sub('[가-힣]', '', input_string)
output=input_string.replace('[가-힣]','')
print(output_string)
"Some 한국어 characters here" 문자열이 존재한다.
영어 문자 사이에 '한국어'라는 한글이 껴있는데 삭제하는 방법이 없을까?
해결을 위해 re모듈을 사용한다.
re.sub() : 정규 표현식의 sub메소드는 정규식을 이용해 문자열을 치환하는 방법
re.sub(pattern, replace, text)
*정규표현식 : regular expression의 축약으로 regex 등으로 불린다.
=>어떤 텍스트 내에서 '특정한 형태나 규칙을 가진 문자열'을 찾기 위해 그 형태나 규칙을 나타내는 패턴을 정의하는 식
re.sub('[가-힣]', '', input_string) : [가-힣] 까지 ' ' (공백) 으로 만들기
input_string.replace('[가-힣]','') #replace를 사용해도 동일한 결과 도출됨
<출처>
정규표현식(Regex)의 개념과 기초 문법
정규표현식이란? : Regular Expression을 줄여서 Regex, Regexp 등으로 불린다. Computer Science의 정규 언어(Regular Language)로부터 유래한 것으로, 특정한 규칙을 가진 문자열의 집합을 표현하기 위해 쓰이는 *
co-no.tistory.com
[Python] 정규표현식 re.sub을 이용한 문자열 치환하기
정규표현식 re.sub() 파이썬에서 정규 표현식을 활용할 땐 re 모듈을 사용한다. 이 중 sub 메소드는 정규식을 이용해 문자열을 치환하는 방법이다. 형식은 다음과 같다. re.sub(pattern, replace, text) : text
jjuha-dev.tistory.com
'파이썬 > 문법' 카테고리의 다른 글
정규 표현식 정리 [• . ^ $ * + ? { } [ ] \ | ( ) ] (0) | 2023.11.30 |
---|---|
numpy - vstack과 hstack 함수 (0) | 2023.11.13 |
(파이썬)class 개념 이해 (0) | 2023.09.17 |