Good to Go

가벼운 시도의 반복이 새로운 가능성을 만들어주길

자기계발(경영)

python data type _문자열(String)

on and on 2022. 4. 17. 22:18
  • 문자열 데이터란, 문자(character)의 나열을 의미한다. e.g. "Hello world"

      string ; Character Sequence

  • 파이썬에 다룰 수 있는 문자열의 크기도 제한이 없다.
  • 파이썬에선 '와 " 두 가지의 기호를 통해 문자열을 나타낸다. 즉 ' 부터 ' 까지 또는 " 부터 " 까지 하나의 문자열이다. e.g. 'Hello', "World"
  • 컴퓨터는 문자(character)를 encoding하여 숫자로 표현한다. 알려진 예로 ASCII, utf-8 (universal code), cp949(한국어)가 있다.

      컴퓨터는 문자를 숫자로 인식한다. e.g. ASCII 코드로 변환하면 A->65, a->97

  • 현재 전세계적으로 웹에서 사용되는 국제 표준은 UTF-8(Universal code character set Transformation Format - 8-bit)이다.

(OPTIONAL) UTF-8에선 a는 1바이트로, '가'는 3바이트로 인식한다. 이를 가변 인코딩 방식이라고 하며, 영어보다 한글이 더 많은 데이터를 필요로 한다.

 

 

 

빈칸까지 포함할 때 """ 코딩

EOL (End of line)을 알려주기 위해 / 중간에 엔터치고 싶을때

 

quotation 이 있어도 라인을 ""로 확실히 잡아주면 문제가 되지 않는다. 

 

 


특수 문자 표현 (escape code) 익히기

 

백스래쉬 대신 \로 표현 가능

백슬래쉬n = 엔터

백슬래쉬t = 탭

 

 

 


문자열 연산하기

 

len 함수

 

 


문자열 Formatting : 3가지 방법

 

"사과는 4개 있다."

 

1. print format

print("%s는 %d개 있다." % ("사과", 4))

%s  string

%d  십진수 정수

 

2. str. format

print("{ }는 { }개 있다. " .format("사과", 4))

{ } { } . " . format

 

3. f-string (**)

apple = "사과", count = 4

print ( f" {apple}는{count}개 있다. " ) 

 

 

 


문자열 관련 함수들

 

 

 

h    i 가 될 경우는 공백이 지워지지 않는다. 문자 앞과 맨 마지막 문자 뒤의 공백만 없애주는 용도

 

 

 

s.replace("Life", "This pencil")

= "This pencil is too short"