파이썬으로 데이터를 핸들링하면서 가장 고민했던 부분을 해결해 주었던 정말 아름다운 글이다.
이렇게 되는 것을 몰라서 한참을 고민했는데 실제 이 정도만 되어도 왠만한 자료들은 Pandas로만으로도 충분히 만들 수 있다. 물론 중간에 코드를 결합하거나 하는 복잡한 것을 한 방에 처리해주는 SQL은 안되지만 말이지. 어찌 되었거나 SQL을 못쓴다고 해도 이런 대체물이 있으니까 다행이라고 해야 할까?
R dplyr 배우기 싫어서 sqldf로 모두 떡칠해서 썼던 것이 얼마전인데, 참 사람 일은 모를 일이다.
반응형
'Python, PySpark' 카테고리의 다른 글
Pseudo SAS Retain in Python (0) | 2021.06.18 |
---|---|
Python Pandas column name 일괄 변경 (0) | 2021.06.07 |
Python 주요 라이브러리 (0) | 2021.05.13 |
Python에서 하둡으로 자료 보내기 (0) | 2021.05.13 |
날짜 테이블에 있는 값을 dicitionary()에 저장 (0) | 2021.05.07 |