반응형
파이썬 split()은 특정 문자를 기준으로 문자열을 나눈 뒤, 리스트 형태로 반환하는 함수입니다. 길이가 긴 문자열에 콤마와 같은 특정한 패턴이 있을 경우 유용하게 쓸 수 있습니다.
문자열 나누기 함수, split()
데이터를 다루다 보면 문자열이 원하는대로 쪼개져있지 않고 합쳐져 있는 경우가 있습니다. 특정한 길이만큼 자를 수도 있지만 패턴이 존재한다면 split 함수를 사용하여 리스트로 만들 수 있습니다.
- 문자열.split()
- 문자열.split('구분자')
- 문자열.split('구분자', 분할 횟수)
- 문자열.split(seq='구분자', maxsplit=분할 횟수)
문자열.split()
문자열.split()은 split 함수에 아무런 파라미터를 넣지않고 실행하면 띄어쓰기 혹은 개행문자에 맞춰 문자열을 나눠줍니다.
str = 'a b c d e f g'
# 파라미터 없이 split()
res = str.split()
print(res)
띄어쓰기로 구분하여 각 문자를 나누고, 리스트로 반환해준 결과입니다.
문자열.split('구분자')
문자열.split('구분자') 는 파라미터로 구분자를 넣어주면 구분자를 기준으로 문자열을 나눠줍니다.
str = 'a,b,c,d,e,f,g'
# split에 구분자 파라미터 사용
res = str.split(',')
print(res)
구분자인 콤마로 문자열을 나눈 결과입니다.
문자열.split('구분자', 분할 횟수)
문자열.split('구분자', 분할 횟수)는 구분자에 따라 앞에서 부터 분할 횟수만큼만 나누고, 나머지는 나누지 않고 리스트의 마지막 항목으로 채워 반환합니다.
str = 'a,b,c,d,e,f,g'
# split에 구분자 파라미터 사용
res = str.split(',' , 3)
print(res)
구분자 ','를 기준으로 3개만 나눈 후, 리스트를 반환한 결과입니다.
문자열.split(sep='구분자', maxsplit=분할 횟수)
sep 과 maxsplit은 파라미터 명이며, 바로 위 코드와 동일한 역할을 합니다.
str = 'a,b,c,d,e,f,g'
# split에 구분자 파라미터 사용
res = str.split(sep=',' , maxsplit=3)
print(res)
결과는 아래와 같습니다.
마무리
데이터를 처리할 때 문자열이 뭉쳐올 때가 있습니다. 그럴 때 적절히 split 함수를 활용하면 원하는 형태로 리스트로 반환하여 사용할 수 있습니다. 저는 매번 까먹네요 ..ㅠ
오늘도 행복한 코딩생활 되시기 바라겠습니다.
감사합니다.
'개발 > python' 카테고리의 다른 글
NumPy와 Pandas: Python 데이터 분석의 두 기둥 (0) | 2024.06.29 |
---|---|
python 공백 및 문자 제거, strip, lstrip, rstrp 사용 방법 (0) | 2023.01.20 |
python 문자열 시작과 끝 문자 찾기, 접두사 startswith, 접미사 endswith (0) | 2023.01.18 |
python 올림 내림 반올림 함수, ceil(), floor(), round() 정리 (2) | 2022.04.23 |
python 기존 파일에 내용 추가 방법, 열기 모드를 'a' 로 하기 (4) | 2022.04.14 |
댓글