ssung_인턴일지

8일차_Data Preprocessing(3)

ssungcohol 2024. 7. 11. 21:55

데이터 전처리

지역의 위·경도 별 데이터 추출

 

import csv
import chardet

# 파일 인코딩 확인
# (지난 번에 입력했으므로 해도 그만, 안해도 그만이지만 안하는게 좋겠지요?)
def detect_encoding(file_path):
	with open(file_path, 'rb') as f:
    	raw_data = f.read()
    result = chardet.detect(raw_data)
    return result['encoding']
    
# 위·경도 설정 (예제는 제주도 좌표)
def filter_location(df):
	# 위도
    latitude = (df.iloc[:, -1] >= 33.1127000) & (df.iloc[:, -1] <= 33.3350000)
    # 경도
    longitude = (df.iloc[:, -2] >= 126.0843000) & (df.iloc[:, -2] <= 126.5820000)
    
    return df[latituce & longitude]

 

코드 설명

  • 특정 행/열을 선택하는 방법
# .iloc 를 사용해 특정 열 or 행 Data 추출
df.iloc[:, -1] # 마지막 열만

# Data의 첫 번째 행만 추출하고 싶을 때
Data.iloc[0]

# Data의 두 번째 행만 추출하고 싶을 때
Data.iloc[1]

# Data의 마지막 행만 추출하고 싶을 때
Data.iloc[-1]

# Data의 여러 개의 행/열을 추출하고 싶을 때
# Data의 처음부터 5개의 행만 추출
Data.iloc[0:5]

# Data의 처음부터 2개의 열만 추출
Data.iloc[:, 0:2]

# Data의 1, 3, 5, 13행과 1 ,7, 19열만 추출
Data.iloc[[0, 2, 4, 12], [0, 6, 18]]

# Data의 처음 5개 행과 7~9 열만 추출
Data.iloc[0:5, 5:8]
728x90

'ssung_인턴일지' 카테고리의 다른 글

10일차_Image stitching  (0) 2024.07.14
9일차_EDA란?  (1) 2024.07.14
7일차_Data Preprocessing(2)  (0) 2024.07.08
5, 6일차_Data Preprocessing  (0) 2024.07.07
4일차_Data preprocessing  (0) 2024.07.07