import pandas as pd
# 해당 시트만 가져오기
excel = pd.read_excel('c:/now/seoul.xlsx', sheet_name='철도', engine='openpyxl')
type(excel) # pandas.core.frame.DataFrame
excel.head()
# 전체를 읽어온 후 필요한 부분만 key 값으로 지정하기
excel = pd.read_excel('c:/now/seoul.xlsx', sheet_name=None, engine='openpyxl')
type(excel) # dict
excel.keys() # dict_keys(['철도', '버스'])
excel['버스'].head()
# 하나의 sheet 를 Excel 파일로 저장하기
df = pd.DataFrame(data=[[1, 2, 3], [4, 5, 6]], columns=['A', 'B', 'C'])
df.to_excel('mydata.xlsx', index=False, sheet_name='샘플')
# 여러개의 sheet 를 Excel 파일로 저장하기
df = pd.DataFrame(data=[[1, 2, 3], [4, 5, 6]], columns=['A', 'B', 'C'])
df2 = pd.DataFrame(data=[['a', 'b'], ['c', 'd']], columns=['E', 'F'])
writer = pd.ExcelWriter('c:/now/manysheet.xlsx')
df.to_excel(writer, index=False, sheet_name='샘플1')
df2.to_excel(writer, index=False, sheet_name='샘플2')
writer.close()
###################################################################################################################
# CSV 읽기
df = pd.read_csv('c:/now/person.txt', encoding='utf8')
# 10 개 단위로 읽기 (큰 파일의 경우)
reader = pd.read_csv('c:/now/person.txt', encoding='utf8', chunksize=10)
for df in reader:
print(df)
# CSV 쓰기
df = pd.DataFrame(data=[[1, 2, 3], [4, 5, 6]], columns=['A', 'B', 'C'])
df.to_csv('c:/now/sample.csv', index=False, encoding='utf8')
참고: https://www.udemy.com/course/pandas-i/