파이썬에서 pandas dataframe으로 자료를 전처리하고 텍스트 파일/CSV 파일로 내보내기를 할때 한글이 있으면 encoding = 'euc-kr'로 인코딩을 해줘야 한다.

 

 보통 'head -10 filename.txt' 이렇게 해주는데, Jupyterlab에서 해당 텍스트를 읽으려면 인코딩 때문에 깨져 나온다.

 

 이럴때 쓸 수 있는 방법이 바로 encoding해서 읽어내는 방법니다.

 

 !iconv -f EUR-KR -t UTF-8 filename.txt | head -3

 

 이렇게 해주면 한글도 정상적으로 잘 보인다.

반응형

+ Recent posts