ABOUT ME

-

Today
-
Yesterday
-
Total
-
  • Excel, CSV 파일 읽기/쓰기
    pandas & duckdb 2022. 8. 19. 23:26
    import pandas as pd
    
    # 해당 시트만 가져오기
    excel = pd.read_excel('c:/now/seoul.xlsx', sheet_name='철도', engine='openpyxl')
    type(excel)  # pandas.core.frame.DataFrame
    excel.head()
    
    # 전체를 읽어온 후 필요한 부분만 key 값으로 지정하기
    excel = pd.read_excel('c:/now/seoul.xlsx', sheet_name=None, engine='openpyxl')
    type(excel)  # dict
    excel.keys()  # dict_keys(['철도', '버스'])
    excel['버스'].head()
    
    # 하나의 sheet 를 Excel 파일로 저장하기
    df = pd.DataFrame(data=[[1, 2, 3], [4, 5, 6]], columns=['A', 'B', 'C'])
    df.to_excel('mydata.xlsx', index=False, sheet_name='샘플')
    
    # 여러개의 sheet 를 Excel 파일로 저장하기
    df = pd.DataFrame(data=[[1, 2, 3], [4, 5, 6]], columns=['A', 'B', 'C'])
    df2 = pd.DataFrame(data=[['a', 'b'], ['c', 'd']], columns=['E', 'F'])
    writer = pd.ExcelWriter('c:/now/manysheet.xlsx')
    df.to_excel(writer, index=False, sheet_name='샘플1')
    df2.to_excel(writer, index=False, sheet_name='샘플2')
    writer.close()
    
    ###################################################################################################################
    # CSV 읽기
    
    df = pd.read_csv('c:/now/person.txt', encoding='utf8')
    
    # 10 개 단위로 읽기 (큰 파일의 경우)
    reader = pd.read_csv('c:/now/person.txt', encoding='utf8', chunksize=10)
    for df in reader:
        print(df)
    
    # CSV 쓰기
    df = pd.DataFrame(data=[[1, 2, 3], [4, 5, 6]], columns=['A', 'B', 'C'])
    df.to_csv('c:/now/sample.csv', index=False, encoding='utf8')

     

    참고: https://www.udemy.com/course/pandas-i/

    'pandas & duckdb' 카테고리의 다른 글

    데이터 전처리, 추가, 삭제, 변환  (0) 2022.10.08
    복사와 결측치  (0) 2022.10.08
    통계  (0) 2022.10.08
    조회, 정렬, 필터  (0) 2022.08.20
    자료 구조  (0) 2022.08.08

    댓글

Designed by Tistory.