정규식
2024. 3. 11. 12:07ㆍ파이썬/웹스크래핑
import re
# abcd, book, desk
# ca?e
# care, cafe, case, cave
#case, ca~~ 너무 힘든 과정
p=re.compile('ca.e')
#. (ca.e): 하나의 문자를 의미 # care, cafe | caffe x
#^(^de) : 문자열의 시작 -> desk , destination | fade x
# $ (se$) : 문자열의 끝 > case, base , |fcae x
def print_match(m):
if m:
print('m.group():',m.group()) #일치하는 문자열 반환
print('m.string():',m.string) #입력받은 문자열
print('m.start():', m.start()) #일치하는 문자열의 시작 index
print('m.end():', m.end()) # ''끝 index
print('m.span():', m.span())
else:
print('매칭되지 않음')
#매칭하기
m=p.match('careless') #match : 주어진 문자열의 처음부터 일치하는지 확인
print_match(m)
print(m.group())
m.group(): care
m.string(): careless
m.start(): 0
m.end(): 4
m.span(): (0, 4)
care
m=p.search('good care') #search : 주어진 문자열 중에 일치하는게 있는지 확인
print_match(m)
care
In [30]:
m=p.search('good care') #search : 주어진 문자열 중에 일치하는게 있는지 확인
print_match(m)
['care', 'care', 'cafe']
In [ ]:
# 1. re.compile('원하는 형태')
# 2. m=p.match('비교할 문자열') 주어진 문자열이 처음부터 일치하는지 확인
# 3. m=p.search('비교할 문자열') : 주어진 문자열 중에 일치하는게 있는지 확인
# 4. lis = p.findall('비교할 문자열') : 일치하는 모든 것을'리스트'형태로 반환
#. (ca.e): 하나의 문자를 의미 # care, cafe | caffe x
#^(^de) : 문자열의 시작 -> desk , destination | fade x
# $ (se$) : 문자열의 끝 > case, base , |fcae x
'파이썬 > 웹스크래핑' 카테고리의 다른 글
user agent (0) | 2024.03.11 |
---|---|
[웹스크래핑]requests (0) | 2024.03.11 |
XPath (0) | 2024.03.11 |
html 기초 구조 (0) | 2024.03.11 |
웹스크래핑 (2) | 2023.10.01 |