Notice
Recent Posts
Recent Comments
Link
일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | 3 | 4 | 5 | 6 | 7 |
8 | 9 | 10 | 11 | 12 | 13 | 14 |
15 | 16 | 17 | 18 | 19 | 20 | 21 |
22 | 23 | 24 | 25 | 26 | 27 | 28 |
29 | 30 | 31 |
Tags
- 대외활동
- codeup
- 기타정보
- 국가기록원
- 정보보안
- 화학물질
- UKPT
- 경기팀
- webhacking
- Los
- 국가정보원
- 12기
- 파이썬
- MITRE ATT&CK
- 웹 해킹 입문
- 화학물질불법유통온라인감시단
- Service
- 도구모음
- 불법유통
- 화학물질안전원
- UKPT level
- PHP
- 불법유통근절
- 연구모임
- 국정원
- nurisec
- HTML
- 여행
- suninatas
- 프로젝트
Archives
- Today
- Total
agencies
파이썬 엑셀 불러와서 읽을 때 (용량이 너무 커서 안 될 경우) 본문
청크를 사용하면 된다고 합니다.
import pandas as pd
# 출력 설정 변경: 모든 열 출력 및 길이 제한 없앰
pd.set_option('display.max_columns', None) # 모든 열을 출력
pd.set_option('display.max_colwidth', None) # 각 열의 내용 길이 제한 없음
# 파일을 일정 크기(chunksize)로 나누어 읽기 (여기서는 1000개의 행씩 읽음)
chunksize = 1000 # 한 번에 읽을 행 수
filename = 'MSR_data_cleaned.csv'
# 첫 번째 chunk만 로드하고 출력
chunk_iter = pd.read_csv(filename, chunksize=chunksize, low_memory=False)
# 첫 번째 chunk를 읽어서 출력 (필요에 따라 원하는 만큼 처리)
for chunk in chunk_iter:
print(chunk.head(2)) # 첫 10개 행만 출력
break # 첫 번째 chunk만 처리하고 중지
결과 이미지는 위와 같다.
추가
가독성이 떨어져서 엑셀로 저장하는 코드를 하단에 추가했습니다.
import pandas as pd
# 출력 설정 변경: 모든 열 출력 및 길이 제한 없앰
pd.set_option('display.max_columns', None) # 모든 열을 출력
pd.set_option('display.max_colwidth', None) # 각 열의 내용 길이 제한 없음
# 파일을 일정 크기(chunksize)로 나누어 읽기 (여기서는 1000개의 행씩 읽음)
chunksize = 1000 # 한 번에 읽을 행 수
filename = 'MSR_data_cleaned.csv'
# 첫 번째 chunk만 로드하고 출력
chunk_iter = pd.read_csv(filename, chunksize=chunksize, low_memory=False)
# 첫 번째 chunk를 읽어서 출력하고 엑셀 파일로 저장
for chunk in chunk_iter:
print(chunk.head(2)) # 첫 2개 행만 출력
chunk.head(2).to_excel("output_chunk.xlsx", index=False) # 엑셀 파일로 저장
break # 첫 번째 chunk만 처리하고 중지
'Ⅲ. 정보보안' 카테고리의 다른 글
DeepDFA 실행해보기 (END) 최종 - 1 - (3) | 2024.10.14 |
---|---|
DeepDFA(초안) (1) | 2024.10.12 |
Joern (Deepdfa : nodes edges cpg) 생성 (완료) (2) | 2024.10.09 |
joern으로 생성한 노드를 before 형식에 맞게 정렬 (0) | 2024.10.08 |
Joern을 이용한 CPG node edge 생성하기 (deepdfa) 1.1.1072 version (1) | 2024.10.07 |