pandas_1

Python

pandas_1

ianman99 ㅣ 2024. 2. 4. 17:09

import pandas as pd

# csv 파일 읽기

df = pd.read_csv('credit.csv')

print(df)

# 특정 변수의 데이터 보기

# print(df[변수명])

# 각종 통계량 보기

print(df['나이'].mean())

print(df['학력'].mode())

print(df['사용금액'].max())

print(df['사용금액'].min())

print(df[['사용금액','사용횟수']].describe())

# 한 변수를 그룹화해서 기준 삼아 통계량 비교 (숫자 변수만 구하도록)

print(df.groupby('성별').mean(numeric_only=True))

# '성별'을 기준으로 그룹화하고 '나이'의 평균을 계산

result = df.groupby('성별')['나이'].mean()

print(result)

# 상관관계 계산

corr = df[['사용금액','사용횟수']].corr()

print(corr)

# 필터로 데이터 거르기

print(df.query(" 성별 == 'M' and 기혼 == 'Married' "))

# 리스트 or 딕셔너리를 dataframe으로 변환

나이 = [10, 20, 30] # 나이가 한 변수로 들어감

키 = [170, 180, 190]

몸무게 = [55, 60, 65]

raw_data = {'나이': 나이,

'키': 키,

'몸무게': 몸무게}

data = pd.DataFrame(raw_data)

print(data)

# 소득(문자열 데이터)에 따른 각 변수의 평균 보기

print(df.groupby('소득').mean(numeric_only=True))

저작자표시 (새창열림)

'Python' 카테고리의 다른 글

yfinance 주가 데이터 가져오기 (2)	2024.02.04
pandas_2, 정규식 (3)	2024.02.04
파이썬 메일 전송 (1)	2024.02.03
크롤링 방지 우회 (2)	2024.02.03
38커뮤니케이션 (신규상장종목_상세페이지) 크롤링 (0)	2024.02.01

Python 다른글

티스토리툴바