데이터 전처리
지역의 위·경도 별 데이터 추출
import csv
import chardet
# 파일 인코딩 확인
# (지난 번에 입력했으므로 해도 그만, 안해도 그만이지만 안하는게 좋겠지요?)
def detect_encoding(file_path):
with open(file_path, 'rb') as f:
raw_data = f.read()
result = chardet.detect(raw_data)
return result['encoding']
# 위·경도 설정 (예제는 제주도 좌표)
def filter_location(df):
# 위도
latitude = (df.iloc[:, -1] >= 33.1127000) & (df.iloc[:, -1] <= 33.3350000)
# 경도
longitude = (df.iloc[:, -2] >= 126.0843000) & (df.iloc[:, -2] <= 126.5820000)
return df[latituce & longitude]
코드 설명
- 특정 행/열을 선택하는 방법
# .iloc 를 사용해 특정 열 or 행 Data 추출
df.iloc[:, -1] # 마지막 열만
# Data의 첫 번째 행만 추출하고 싶을 때
Data.iloc[0]
# Data의 두 번째 행만 추출하고 싶을 때
Data.iloc[1]
# Data의 마지막 행만 추출하고 싶을 때
Data.iloc[-1]
# Data의 여러 개의 행/열을 추출하고 싶을 때
# Data의 처음부터 5개의 행만 추출
Data.iloc[0:5]
# Data의 처음부터 2개의 열만 추출
Data.iloc[:, 0:2]
# Data의 1, 3, 5, 13행과 1 ,7, 19열만 추출
Data.iloc[[0, 2, 4, 12], [0, 6, 18]]
# Data의 처음 5개 행과 7~9 열만 추출
Data.iloc[0:5, 5:8]
728x90
'ssung_인턴일지' 카테고리의 다른 글
10일차_Image stitching (0) | 2024.07.14 |
---|---|
9일차_EDA란? (1) | 2024.07.14 |
7일차_Data Preprocessing(2) (0) | 2024.07.08 |
5, 6일차_Data Preprocessing (0) | 2024.07.07 |
4일차_Data preprocessing (0) | 2024.07.07 |