Hello creators ๐
[1-6] os ๋ผ์ด๋ธ๋ฌ๋ฆฌ ํ์ฉํด์ ํ์ด์ฌ ํ์ผ ๋ค์ด๋ก๋, ์ด๋ฆ ๋ฐ๊พธ๊ธฐ (feat. ์คํ๋ฅดํ์ฝ๋ฉํด๋ฝ ๋ฐ์ดํฐ ๋ถ์ ์์ ) ๋ณธ๋ฌธ
[WEB & AI] (feat. ์ทจ์ค)/Python
[1-6] os ๋ผ์ด๋ธ๋ฌ๋ฆฌ ํ์ฉํด์ ํ์ด์ฌ ํ์ผ ๋ค์ด๋ก๋, ์ด๋ฆ ๋ฐ๊พธ๊ธฐ (feat. ์คํ๋ฅดํ์ฝ๋ฉํด๋ฝ ๋ฐ์ดํฐ ๋ถ์ ์์ )
๋ถ์๋งค๋_HA 2022. 12. 10. 15:18728x90
๋ฐ์ํ
Colab URL ์ฃผ์
Colab URL | https://bit.ly/3Ph9e9p |
๋ด์ค๋ก ๋ฐ๊ณ ์ถ์ ๊ธฐ์ ๋ค์ ๋ฆฌ์คํธ์ ํด์ > news ํด๋์, ์์ ํ์ผ๋ก ํ๋ ํ๋ ๋ฃ์ด์ฃผ๊ธฐ
# ๋ด์ค๋ก ๋ฐ๊ณ ์ถ์ ๊ธฐ์
๋ค์ ๋ฆฌ์คํธ์
ํด์, > news ํด๋์, ์์
ํ์ผ๋ก ํ๋ ํ๋ ๋ฃ์ด์ฃผ๊ธฐ
keywords = ['์ผ์ฑ์ ์','LG์๋์ง์๋ฃจ์
','SKํ์ด๋์ค','NAVER','์ผ์ฑ๋ฐ์ด์ค๋ก์ง์ค','์ผ์ฑ์ ์์ฐ','์นด์นด์ค','์ผ์ฑSDI','ํ๋์ฐจ','LGํํ','๊ธฐ์','POSCOํ๋ฉ์ค','KB๊ธ์ต','์นด์นด์ค๋ฑ
ํฌ','์
ํธ๋ฆฌ์จ','์ ํ์ง์ฃผ','์ผ์ฑ๋ฌผ์ฐ','ํ๋๋ชจ๋น์ค','SK์ด๋
ธ๋ฒ ์ด์
','LG์ ์','์นด์นด์คํ์ด','SK','ํ๊ตญ์ ๋ ฅ','ํฌ๋ํํค','ํ๋๊ธ์ต์ง์ฃผ','LG์ํ๊ฑด๊ฐ','HMM','์ผ์ฑ์๋ช
','ํ์ด๋ธ','๋์ฐ์ค๊ณต์
','SKํ
๋ ์ฝค','์ผ์ฑ์ ๊ธฐ','SK๋ฐ์ด์ค์ฌ์ด์ธ์ค','LG','S-Oil','๊ณ ๋ ค์์ฐ','KT&G','์ฐ๋ฆฌ๊ธ์ต์ง์ฃผ','๋ํํญ๊ณต','์ผ์ฑ์์ค๋์์ค','ํ๋์ค๊ณต์
','์์จ์ํํธ','์ผ์ฑํ์ฌ','์๋ชจ๋ ํผ์ํฝ','KT','ํฌ์ค์ฝ์ผ๋ฏธ์นผ','๋ท๋ง๋ธ','SK์์ด์ดํ
ํฌ๋๋ก์ง','LG์ด๋
ธํ
','๊ธฐ์
์ํ']
# ํจ์๋ฅผ ๋๋ฆฌ๊ณ ์ถ์ ๊ธฐ์
๋ค (๊ฒ์ํด์, ๋ด์ค๋ก ๋ฝ๊ณ ์ถ์ ๊ฒ๋ค) ์ ๋ฃ์
for keyword in keywords: # ์์ ๋ฉ์ด๋ฆฌ์์ ํ๋์ฉ ๊บผ๋ด์์ ๋ด์
print(keyword) # ์ง๊ธ ์ด๋๊น์ง ํ๊ณ ์๋์ง, '์ง์ฒ๋' ๋ฅผ ํ์
ํ๊ธฐ ์ํด์
get_news(keyword) # ์ด๊ฑธ ํจ์์ ๋ฃ์ > ๊ทธ ๊ฒฐ๊ณผ, '๋ ์ง_ ์์
ํ์ผ' ์ด๋ฆ์ด ๋ด๊น
ํด๋๋ฅผ '์์ถํด์' ๋ค์ด ๋ฐ๊ธฐ
# ํด๋๋ฅผ '์์ถํด์' ๋ค์ด ๋ฐ๊ธฐ
keywords = ['์ผ์ฑ์ ์','LG์๋์ง์๋ฃจ์
','SKํ์ด๋์ค','NAVER','์ผ์ฑ๋ฐ์ด์ค๋ก์ง์ค','์ผ์ฑ์ ์์ฐ','์นด์นด์ค','์ผ์ฑSDI','ํ๋์ฐจ','LGํํ','๊ธฐ์','POSCOํ๋ฉ์ค','KB๊ธ์ต','์นด์นด์ค๋ฑ
ํฌ','์
ํธ๋ฆฌ์จ','์ ํ์ง์ฃผ','์ผ์ฑ๋ฌผ์ฐ','ํ๋๋ชจ๋น์ค','SK์ด๋
ธ๋ฒ ์ด์
','LG์ ์','์นด์นด์คํ์ด','SK','ํ๊ตญ์ ๋ ฅ','ํฌ๋ํํค','ํ๋๊ธ์ต์ง์ฃผ','LG์ํ๊ฑด๊ฐ','HMM','์ผ์ฑ์๋ช
','ํ์ด๋ธ','๋์ฐ์ค๊ณต์
','SKํ
๋ ์ฝค','์ผ์ฑ์ ๊ธฐ','SK๋ฐ์ด์ค์ฌ์ด์ธ์ค','LG','S-Oil','๊ณ ๋ ค์์ฐ','KT&G','์ฐ๋ฆฌ๊ธ์ต์ง์ฃผ','๋ํํญ๊ณต','์ผ์ฑ์์ค๋์์ค','ํ๋์ค๊ณต์
','์์จ์ํํธ','์ผ์ฑํ์ฌ','์๋ชจ๋ ํผ์ํฝ','KT','ํฌ์ค์ฝ์ผ๋ฏธ์นผ','๋ท๋ง๋ธ','SK์์ด์ดํ
ํฌ๋๋ก์ง','LG์ด๋
ธํ
','๊ธฐ์
์ํ']
# ํจ์๋ฅผ ๋๋ฆฌ๊ณ ์ถ์ ๊ธฐ์
๋ค (๊ฒ์ํด์, ๋ด์ค๋ก ๋ฝ๊ณ ์ถ์ ๊ฒ๋ค) ์ ๋ฃ์
for keyword in keywords: # ์์ ๋ฉ์ด๋ฆฌ์์ ํ๋์ฉ ๊บผ๋ด์์ ๋ด์
# print(keyword) # ์ง๊ธ ์ด๋๊น์ง ํ๊ณ ์๋์ง, '์ง์ฒ๋' ๋ฅผ ํ์
ํ๊ธฐ ์ํด์
get_news(keyword) # ์ด๊ฑธ ํจ์์ ๋ฃ์ > ๊ทธ ๊ฒฐ๊ณผ, '๋ ์ง_ ์์
ํ์ผ' ์ด๋ฆ์ด ๋ด๊น
!zip -r /content/files.zip /content/news # โ
์์ถํด์ฃผ๋ ์ฝ๋
# '/content/news' ์ ์๋ ํ์ผ์ ๋ฌถ์ด์ > /content/files.zip ํ์ผ๋ก ๋ง๋ค์ด์ค
'2022_12_09_์ผ์ฑ์ ์.xlsx' ๋ฅผ ๐ '2022_12_09_์ผ์ฑ์ ์(๋ด์ค).xlsx' ๋ก ๋ฐ๊พธ๊ธฐ_part1
# '2022_12_09_์ผ์ฑ์ ์.xlsx' ๋ฅผ ๐ '2022_12_09_์ผ์ฑ์ ์(๋ด์ค).xlsx' ๋ก ๋ฐ๊พธ๊ธฐ_part1
# cf. ์ด๋ ๊ฒ ๋๋์ง ํ
์คํธ ํด๋ณด๊ธฐ!
name = '2022_12_09_์ผ์ฑ์ ์.xlsx'
name.split('.')[0]+'(๋ด์ค).xlsx'
'2022_12_09_์ผ์ฑ์ ์.xlsx' ๋ฅผ ๐ '2022_12_09_์ผ์ฑ์ ์(๋ด์ค).xlsx' ๋ก ๋ฐ๊พธ๊ธฐ_part2
# '2022_12_09_์ผ์ฑ์ ์.xlsx' ๋ฅผ ๐ '2022_12_09_์ผ์ฑ์ ์(๋ด์ค).xlsx' ๋ก ๋ฐ๊พธ๊ธฐ_part2
import os # os ๋ฅผ ๋ณ๊ฒฝํ ์ ์๊ฒ ํ๋ ๋ผ์ด๋ธ๋ฌ๋ฆฌ ์ธ๊ฐ?โโ
path = '/content/news' # ๋ด์ค๊ฐ ์ ์ฅ๋์ด ์๋ ํด๋์ ๊ฒฝ๋ก
files = os.listdir(path) # os ๋ก ๋ค์ด๊ฐ์ ๋ญ๊ฐ๋ฅผ ํ ๊ฑฐ์ผ > ๋ํ
ํ ๋ฆฌ ๋ฆฌ์คํธ๋ฅผ ๋ณผ๊ฑฐ์ผ, ์ด๋๊ฑธ? path ๊ฒฝ๋ก์ ์๋๊ฑธ > ๊ทธ ๋๋ ํ ๋ฆฌ ๋ฆฌ์คํธ๋ฅผ files ์ ๋ด์ / ๐๐ /
# ์ด ์๊ฐ, 'path ์์ ์๋ ํ์ผ๋ค'์ด files ์ ๋ค์ด๊ฐ๋ค.
for name in files: # 'path ์์ ์๋ ํ์ผ๋ค' ์ ํ๋์ฉ ๊บผ๋ด์ > name ์ ๋ด๋๋ค.
new_name = name.split('.')[0]+'(๋ด์ค).xlsx' # ํ์ผ ์ด๋ฆ ํ๋๋ฅผ . ์ผ๋ก ์ชผ๊ฐ๊ณ > (๋ด์ค) ๋ฅผ ๋ํ๋ค.
os.rename(f'/content/news/{name}', f'/content/news/{new_name}')
# ์๋ ์ด๋ฆ์ ๋ฃ๊ณ > ๋ฐ๊ฟ ์ด๋ฆ์ ๋ฃ์ด์ฃผ๋ฉด > ํด๋น ํ์ผ ์ด๋ฆ์ ๋ฐ๊ฟ์ค๋ค. โ
โญโญ
# ์๋ full ์ด๋ฆ์ '/content/news/'2022_12_09_์ผ์ฑ์ ์.xlsx' ์ด๊ฑฐ์ ๐ ์์ ๊ฒฝ๋ก๊น์ง ์จ์ฃผ๋ ์ด์ ๋? ๐ ํ๊ณ ํ๊ณ ๋ค์ด๊ฐ์ ๋ฐ๊พธ๋ผ๋ ์๋ฏธโ
๋ฐ์ํ
ํ์ต ๋ฆฌ์์ค
๊ฐ์ URL | https://bit.ly/3W2CYsK |
Colab URL | https://bit.ly/3Ph9e9p |
์ด์ ํ์ด์ฌ ์์ ๋ ธํธ
728x90
๋ฐ์ํ
'[WEB & AI] (feat. ์ทจ์ค) > Python' ์นดํ ๊ณ ๋ฆฌ์ ๋ค๋ฅธ ๊ธ
Comments