import pandas as pd
# csv 파일 읽기
df = pd.read_csv('credit.csv')
print(df)
# 특정 변수의 데이터 보기
# print(df[변수명])
# 각종 통계량 보기
print(df['나이'].mean())
print(df['학력'].mode())
print(df['사용금액'].max())
print(df['사용금액'].min())
print(df[['사용금액','사용횟수']].describe())
# 한 변수를 그룹화해서 기준 삼아 통계량 비교 (숫자 변수만 구하도록)
print(df.groupby('성별').mean(numeric_only=True))
# '성별'을 기준으로 그룹화하고 '나이'의 평균을 계산
result = df.groupby('성별')['나이'].mean()
print(result)
# 상관관계 계산
corr = df[['사용금액','사용횟수']].corr()
print(corr)
# 필터로 데이터 거르기
print(df.query(" 성별 == 'M' and 기혼 == 'Married' "))
# 리스트 or 딕셔너리를 dataframe으로 변환
나이 = [10, 20, 30] # 나이가 한 변수로 들어감
키 = [170, 180, 190]
몸무게 = [55, 60, 65]
raw_data = {'나이': 나이,
'키': 키,
'몸무게': 몸무게}
data = pd.DataFrame(raw_data)
print(data)
# 소득(문자열 데이터)에 따른 각 변수의 평균 보기
print(df.groupby('소득').mean(numeric_only=True))
'Python' 카테고리의 다른 글
| yfinance 주가 데이터 가져오기 (2) | 2024.02.04 |
|---|---|
| pandas_2, 정규식 (3) | 2024.02.04 |
| 파이썬 메일 전송 (1) | 2024.02.03 |
| 크롤링 방지 우회 (2) | 2024.02.03 |
| 38커뮤니케이션 (신규상장종목_상세페이지) 크롤링 (0) | 2024.02.01 |