Hello creators ๐
[2-1&2] Pandas ๊ธฐ์ด (feat. ์คํ๋ฅดํ์ฝ๋ฉํด๋ฝ_๋ฐ์ดํฐ๋ถ์์์ ) ๋ณธ๋ฌธ
[WEB & AI] (feat. ์ทจ์ค)/Python
[2-1&2] Pandas ๊ธฐ์ด (feat. ์คํ๋ฅดํ์ฝ๋ฉํด๋ฝ_๋ฐ์ดํฐ๋ถ์์์ )
๋ถ์๋งค๋_HA 2022. 12. 13. 23:41728x90
๋ฐ์ํ
Colab URL ์ฃผ์
Colab URL |
https://bit.ly/3Ph9e9p |
๋ฐ์ํ
Pandas ๋ฅผ ์ฐ๋ ์ด์ (ํ์์ฑ, ์ค์ต)
- pandas ๋ฅผ ์ฐ๋ฉด ๋ญ ํ ์ ์์ด?
- 1๏ธโฃ ์ด๋ ๊ฒ ๋ณต์กํ ๋ฐ์ดํฐ๋ฅผ ํ ํํ๋ก ๋ณด์ฌ์ค
- 2๏ธโฃ ๋ฐ์ดํฐ ํฌ๊ธฐ ์๊ด์์ด ‘์ด ์ถ๊ฐ’, ‘ํน์ ํ๋ง ๋ณธ๋ค.’ ๋ ๋ฑ์ ์์ ์์ฌ๋ก ๊ฐ๋ฅ
Pandas๋ก ์ด๋ค ์ค์ต์ ํ ๊ฑฐ์ผ?
- y-finace ๋ฅผ ํตํด ํด์ธ์ฃผ์ ๋ถ์์ ํด๋ณผ ๊ฒ ์.
- ๋ถ์ ์์
- 1๋ ํ ์ฃผ์ ๊ฐ๊ฒฉ์ ์ด๋ป๊ฒ ๋ ๊น?
- ํ์ฌ ๊ฐ๊ฒฉ๊ณผ ์ฐจ์ด๊ฐ ํฐ ์ฃผ์์ ๋ญ๊น?
- ์์น์ฌ๋ ฅ์ด ํฐ ์น๊ตฌ๋ค์ ๋ญ๊น?
- ๋ถ์ ์์
https://finance.yahoo.com/quote/AAPL?p=AAPL&.tsrc=fin-srch&guccounter=1
pandas ๋ผ์ด๋ธ๋ฌ๋ฆฌ ์ค์น
!pip install pandas numpy # pandas ๋ผ์ด๋ธ๋ฌ๋ฆฌ ์ค์น
# pands ๋ numpy ๋ ๋ค๋ฅธ๊ฑด๊ฐ? ๊ด๊ณ๊ฐ ์ด๋ป๊ฒ ๋์ง? / ์... ์ด์ง ๋ณต์กํ๊ฑฐ ๊ฐ์๋ฐโโ
import pandas as pd # '๋ณ์นญ' ๋ถ์ฌ์ฃผ๊ธฐ
import numpy as np
๊ธฐ๋ณธ ๋ฐ์ดํฐ ํ๋ ์ ๋ง๋ค๊ธฐ
# ๊ธฐ๋ณธ ๋ฐ์ดํฐ ํ๋ ์ ๋ง๋ค๊ธฐ
# 1๏ธโฃ ์๋ฃํ์ 'dictionary' ๋ฅผ ๋ง๋ค์ด์ค
# 2๏ธโฃ key ์ 'column ์ ์ ๋ชฉ?' / value ์ 'list' ๋ฅผ ๋ฃ์ด์ค
# key ๋ feature, ๊ฐ ๋ ๊ฒ
# value ๋ ๊ทธ๊ฒ์ '๊ธฐ๋ก๊ฐ' ์ด ๋ ๊ฒ
data = {
'name' : ['์ํฌ', '์ฒ ์', '๋ํฌ', '์์'],
'age' : [15,20,30,35]
}
df = pd.DataFrame(data) # pandas ์ค DataFrame ํจ์๋ฅผ ์ฌ์ฉํ๊ณ > ์์์ ๋ง๋ dictionalry ๋ฅผ input ์ผ๋ก ํด์ > row์ column, ํ๊ณผ ์ด, spread sheet ๋ง๋ค๊ธฐ
# ๋ง๋ ๊ฑธ df ์ ๋ฃ๊ธฐ
df # ์ ๋์๋์ง ํ์ธ
๋ฐ์ดํฐ ํ๋ ์์ ํ์ค ๋ ์ถ๊ฐํ๋ ค๋ฉด
# df ์ ๋ฐ์ ํ์ค! ์ถ๊ฐํ๊ธฐ
doc = {
'name' : '์ธ์ข
',
'age' : 23
}
df = df.append(doc, ignore_index=True) # doc ์ ๋ ๊ฑธ df ์ ์ถ๊ฐํ ๊ฒ ์.
# โญ ignore_index=True ๊ผญ ํ์ / ๊ทธ๋ฅ, 0~4 ๋ก ๋ถ๊ฒ ๋ค ๋ ์๋ฏธ
df
df ์ ์๋ก์ด column ์ถ๊ฐํ๊ธฐ
# df ์ ์๋ก์ด column ์ถ๊ฐํ๊ธฐ
df ['city'] = ['์์ธ', '์์ธ', '์ ์ฃผ', '์ธ์ฐ', '์ธ๋ฆ๋'] # โ
๊ธฐ์กด data frame์ 'row ๊ฐ์' ์ ๋ง๊ฒ 'value'๋ฃ์ด์ผ > coulumn ์ถ๊ฐ๊ฐ ๊ฐ๋ฅ
df
df ์ค 'ํน์ column' ๋ง ๋ฝ์๋ณด๊ธฐ โญโญ
# df ์ค 'ํน์ column' ๋ง ๋ฝ์๋ณด๊ธฐ
df [['city', 'name']] # โ
๋๊ดํธ '2๋ฒ' ์ฐ๋๊ฒ ํฌ์ธํธ
age ๊ฐ 20๋ณด๋ค ์์์ ๋ค ๋ง ๋์ค๊ฒ ํ๊ธฐ_part1_์ฌ๋ฌ์ค ์ฐ๊ธฐ
# age ๊ฐ 20๋ณด๋ค ์์์ ๋ค ๋ง ๋์ค๊ฒ ํ๊ธฐ_part1_์ฌ๋ฌ์ค ์ฐ๊ธฐ
cond = df['age'] < 20 # df ๋ผ๋ spread sheet ์ค 'age' ์ด์ ๊ฐ์ ธ์์, 20๋ณด๋ค ์์ผ๋ฉด > cond ๋ณ์์ ๋ฃ์ด
df[cond] # df ์ค์์ 'cond' ๋ณ์์๋ง ํด๋นํ๋๊ฑธ ๋ณด์ฌ์ค๊ฑฐ์ผ
728x90
๋ฐ์ํ
'[WEB & AI] (feat. ์ทจ์ค) > Python' ์นดํ ๊ณ ๋ฆฌ์ ๋ค๋ฅธ ๊ธ
Comments