pandas_1

ianman99 ㅣ 2024. 2. 4. 17:09

import pandas as pd

# csv 파일 읽기
df = pd.read_csv('credit.csv')
print(df)

# 특정 변수의 데이터 보기
# print(df[변수명])

# 각종 통계량 보기
print(df['나이'].mean())
print(df['학력'].mode())
print(df['사용금액'].max())
print(df['사용금액'].min())
print(df[['사용금액','사용횟수']].describe())

# 한 변수를 그룹화해서 기준 삼아 통계량 비교 (숫자 변수만 구하도록)
print(df.groupby('성별').mean(numeric_only=True))

# '성별'을 기준으로 그룹화하고 '나이'의 평균을 계산
result = df.groupby('성별')['나이'].mean()

print(result)

# 상관관계 계산
corr = df[['사용금액','사용횟수']].corr()
print(corr)

# 필터로 데이터 거르기
print(df.query(" 성별 == 'M' and 기혼 == 'Married' "))

# 리스트 or 딕셔너리를 dataframe으로 변환
나이 = [10, 20, 30] # 나이가 한 변수로 들어감
= [170, 180, 190]
몸무게 = [55, 60, 65]

raw_data = {'나이': 나이,
            '키': ,
            '몸무게': 몸무게}

data = pd.DataFrame(raw_data)
print(data)

# 소득(문자열 데이터)에 따른 각 변수의 평균 보기
print(df.groupby('소득').mean(numeric_only=True))






'Python' 카테고리의 다른 글

yfinance 주가 데이터 가져오기  (2) 2024.02.04
pandas_2, 정규식  (3) 2024.02.04
파이썬 메일 전송  (1) 2024.02.03
크롤링 방지 우회  (2) 2024.02.03
38커뮤니케이션 (신규상장종목_상세페이지) 크롤링  (0) 2024.02.01