728x90

XGBoost 2

AWS Sagemaker 초보자를 위한 개념과 실습(5) - Feature Engineering

팁뚠이입니다. 지난 시간에는 데이터 분석에 필요한 특질 분석(Feature Engineering) 과정의 개념을 설명드리고, AWS의 저장공간 S3에 데이터를 업로드하는 과정을 실습해봤습니다. 지난 시간에도 전달드렸지만, AWS에서 특질 분석을 하는 방법은 총 3가지로 Data Wrangler, Numpy and Pandas, Sagemaker Processing 세 가지 방식입니다. 그중에서 편리한 방법은 Data Wrangler이나, 자유도가 떨어지기 때문에 일반적인 코딩을 하시는 분들은 익숙한 파이썬 Numpy와 pandas를 사용해서 하시는 게 좋습니다. 그럼 Numpy와 pandas를 사용해서 특질 분석을 수행하도록 하겠습니다. 금일 실습 내용 Amazon Sagemaker Studio note..

파이썬팁 2022.05.08

AWS Sagemaker 초보자를 위한 개념과 실습(3) - github, Machine Learning

팁뚠이 입니다. 지난 시간에 sagemaker의 기본 세팅에 대해 설명드렸습니다. 잊으신 분들은 한 번 더 보시고 오시는 걸 추천합니다. 오늘은 이어서, github에서 필요 데이터를 다운로드하고(git clone), AWS의 머신러닝 전 과정에 대해 브리핑하는 이론 내용을 다룹니다. Github에서 데이터 분석에 필요한 원본 데이터를 다운 받는다. AWS Sagemaker를 활용한 Machine Learning(머신러닝) 전체 과정에 대해 브리핑합니다. AWS Sagemaker뿐 아니라 aws는 UI 업데이트가 잦다 보니, 현재 화면과는 다소 차이가 있을 수 있음을 전달드립니다. 우선 실행 전에 지난 시간에 설정하고 생성했던, Sagemaker 노트북 화면을 띄우고 시작하겠습니다. 1. Launch T..

파이썬팁 2022.04.27
728x90