정규식

2024. 3. 11. 12:07파이썬/웹스크래핑

import re
# abcd, book, desk
# ca?e
# care, cafe, case, cave 
#case, ca~~ 너무 힘든 과정

p=re.compile('ca.e') 
#. (ca.e): 하나의 문자를 의미  # care, cafe | caffe x 
#^(^de) : 문자열의 시작 -> desk , destination | fade x
# $ (se$) : 문자열의 끝 > case, base , |fcae x

def print_match(m):
    
    if m:
        print('m.group():',m.group()) #일치하는 문자열 반환
        print('m.string():',m.string) #입력받은 문자열
        print('m.start():', m.start()) #일치하는 문자열의 시작 index
        print('m.end():', m.end()) # ''끝 index
        print('m.span():', m.span())
        

    else: 
        print('매칭되지 않음')
    #매칭하기
    
m=p.match('careless') #match : 주어진 문자열의 처음부터 일치하는지 확인 
print_match(m)
print(m.group())

 

m.group(): care
m.string(): careless
m.start(): 0
m.end(): 4
m.span(): (0, 4)
care

 

m=p.search('good care') #search : 주어진 문자열 중에 일치하는게 있는지 확인
print_match(m)
care
In [30]:
 
m=p.search('good care') #search : 주어진 문자열 중에 일치하는게 있는지 확인
print_match(m)
['care', 'care', 'cafe']
In [ ]:
 

 

# 1. re.compile('원하는 형태')
# 2. m=p.match('비교할 문자열')  주어진 문자열이 처음부터 일치하는지 확인
# 3. m=p.search('비교할 문자열') : 주어진 문자열 중에 일치하는게 있는지 확인
# 4. lis = p.findall('비교할 문자열') : 일치하는 모든 것을'리스트'형태로 반환

#. (ca.e): 하나의 문자를 의미  # care, cafe | caffe x 
#^(^de) : 문자열의 시작 -> desk , destination | fade x
# $ (se$) : 문자열의 끝 > case, base , |fcae x

'파이썬 > 웹스크래핑' 카테고리의 다른 글

user agent  (0) 2024.03.11
[웹스크래핑]requests  (0) 2024.03.11
XPath  (0) 2024.03.11
html 기초 구조  (0) 2024.03.11
웹스크래핑  (2) 2023.10.01