티스토리
[파이썬초보] PANDAS pd.merge() 데이터 열 합치기
1. pd.merge()
Python의 Pandas 라이브러리에서 pd.merge() 함수는 공통 열을 기준으로 두 개 이상의 DataFrame을 결합하는 데 사용됩니다. 열을 기준으로 DataFrame을 병합하는 방법에 대한 예시를 제공합니다
이 예시에서 df1과 df2라는 두 개의 DataFrame이 있습니다. 두 DataFrame은 'ID'라는 공통 열을 갖고 있습니다. 이 공통 열을 기준으로 DataFrame을 병합하기 위해 pd.merge() 함수를 사용하고 on 매개변수를 'ID'로 지정합니다.
결과로 나오는 DataFrame merged_df에는 'ID' 값이 일치하는 df1과 df2의 행이 포함됩니다. 'ID' 열은 DataFrame 병합의 키로 사용됩니다. 병합된 DataFrame은 두 DataFrame의 모든 열을 포함합니다.
출력 결과는 다음과 같습니다.
2. 결론
기본적으로 pd.merge()는 내부 조인을 수행하여 두 DataFrame 사이의 공통된 행만 포함합니다. 두 DataFrame의 모든 행을 포함하려면 how 매개변수를 'outer'로 설정하여 외부 조인을 수행할 수 있습니다.
또한, on 매개변수에 열 이름의 리스트를 전달하여 여러 열을 기준으로 DataFrame을 병합할 수도 있습니다. 예를 들어 on=['column1', 'column2']와 같이 사용할 수 있습니다.
pd.merge() 함수는 왼쪽 조인, 오른쪽 조인 및 여러 열에 대한 병합과 같은 다양한 유형의 병합을 처리하는 옵션을 제공합니다.
마무리
- pd.merge() 함수와 해당 매개변수에 대한 자세한 내용은 Pandas 문서를 참조하시기 바랍니다.
궁금한 사항은 댓글을 통해서 남겨 주시면 답변을 드리고 있으며,
조금이라도 도움이 되셨다면 채널이 성장하는 데 큰 도움이 되어 주시길 바랍니다.
감사합니다.
'PYTHON 파이썬 > 데이터 분석(Data Analytics)' 카테고리의 다른 글
[pandas/matplotlib] 판매, 합산 , 품목(항목) 구성 비율 누적 막대 그래프 (0) | 2024.01.21 |
---|---|
[파이썬/Pandas] 날짜 열과 시간열 병합 Case (0) | 2023.12.25 |
dateutil 모듈로 시계열 datetime 구현하기 (0) | 2023.06.19 |
파이썬으로 데이터 분석하기: 실전 가이드 (2) | 2023.06.17 |