1. 기존의
2.scikitlearn n_jobs를 이용하는 방법
https://scikit-learn.org/stable/modules/generated/sklearn.metrics.pairwise.pairwise_kernels.html
sklearn.metrics.pairwise.pairwise_kernels
scikit-learn.org
3. numpy product를 이용하는 방법
How to run a large matrix for cosine similarity in Python?
I want to calculate cosine similarity between articles. And I am running into the problem that my implementation approach would take a long time for the size of the data that I am going to run. from
stackoverflow.com
반응형
'Python, PySpark' 카테고리의 다른 글
파이썬 한권으로 끝내기 - 234페이지 (credit_final.csv) (0) | 2023.05.28 |
---|---|
rownumber() over () in python pandas (0) | 2023.05.01 |
파이썬 엑셀(MS) 타임스탬프 변환하기 (0) | 2023.03.25 |
nltk 다운로드 환경이 아닐때 활용 (0) | 2023.03.08 |
파이썬 여러 DataFrame Merge (0) | 2022.08.30 |