반응형
서론 데이터 분석과 머신러닝 알고리즘 적용은 현대의 다양한 분야에서 중요한 역할을 하고 있습니다. 특히 부동산 가격 예측은 지역 경제, 개인의 재산 관리, 그리고 투자 결정 등에 있어서 중요한 정보를 제공합니다. 하지만 실제로 부동산 가격을 예측하는 과정은 매우 복잡하며, 대량의 데이터와 다양한 변수들을 다루어야 합니다. 이러한 복잡성을 관리하기 위해 데이터 사이언티스트들은 데이터를 체계적으로 가공하고, 효율적으로 분석할 수 있는 다양한 기법을 사용합니다. 이전 글에서는 과거의 방법처럼 데이터의 특성을 이해하고 중요한 피처들을 선별하기 위해 직접 데이터를 시각화하고, 다양한 통계적 방법을 사용하여 핵심적인 변수를 선택하는 과정이 필요했습니다. 이 과정은 매우 시간이 많이 소요되며, 주관적인 판단이 개입될..
서론 내일배움카드는 재직자들, 실업자, 대학교 3,4학년, 취업준비생 등 다양한 상황에 놓인 사람들에게 배움의 기회를 제공합니다. 다양한 활용 방법이 있지만, 저는 데이터 사이언스를 비롯한 IT에 관심이 있어 이에 해당하는 강의를 들었습니다. 강의를 듣다보니 너무 좋아서 정보 공유를 하고 싶어 이 글을 작성하였습니다. 이 글을 통해 어떤 강의를 추천하는지, 그리고 강의를 듣기위한 정보를 공유하겠습니다. 강의 추천 저는 패스트 캠퍼스에서 진행하는 강의들을 들었습니다. 100% 온라인 교육이고, 금액을 지불해야하지만, 강의 완료 등 조건을 만족하면 전부 환급을 해주기 때문에 무료라고 볼 수 있습니다. 블렌더, ChatGPT, 파이썬, 플루터 등 다양한 툴에 대한 강의가 있습니다. 강의를 고르기 위해서는 hr..
사이킷런 홈페이지: https://scikit-learn.org/stable/ scikit-learn: machine learning in Python — scikit-learn 1.3.2 documentationModel selection Comparing, validating and choosing parameters and models. Applications: Improved accuracy via parameter tuning Algorithms: grid search, cross validation, metrics, and more...scikit-learn.org 서론 머신러닝 알고리즘은 컴퓨터가 데이터를 통해 학습하고 예측을 수행하게 해주는 방법들을 말합니다. 대표적으로 지도 학습, 비지도..
공부를 시작하게 된 계기 빅 데이터의 활용도와 효율성이 저의 업무에서도 중요성을 가지게 될 것이라는 예상을 하였습니다. 과거에는 취업과 30대를 위한 준비를 위해 공부를 해왔지만, 이제는 40대 이후의 삶을 위한 공부를 해보고자 하였습니다. 입문 과정 직장 생활과 병행하여 독학을 하는 것은 쉽지 않았습니다. 유튜브와 다른 강의들을 찾아보며 공부하였지만, 무엇을 공부해야 할지, 어디서부터 시작해야 할지 명확하게 알지 못하였습니다. 이 과정에서 제가 제조업의 데이터 사이언티스트가 되고자 한다는 목표를 세우게 되었고, 머신러닝, 딥러닝, 클러스터링, 분류, 회귀 등, 처음에는 생소했던 개념들에 대해 어느 정도 이해하게 되었습니다. 그동안의 공부의 한계점 그러나 제가 해온 공부는 조금 단편적이었습니다. 전..
서론 머신러닝(Machine Learning) Loss function 기초에 대해 알아보겠습니다. 머신러닝은 인간의 학습 과정을 컴퓨터에 적용함으로써, 컴퓨터가 스스로 학습하고 문제를 해결하는 능력을 갖추게 하는 기술입니다. 이런 학습 과정에서 중요한 역할을 하는 것 중 하나가 Loss Function, 즉 손실 함수입니다. 손실 함수는 머신러닝 모델이 예측한 결과와 실제 값 사이의 차이, 즉 오차를 측정하는 방법입니다. 이 오차는 모델이 얼마나 잘 또는 잘못 작동하고 있는지를 나타내는 지표로, 이 값을 최소화하는 것이 머신러닝의 주요 목표 중 하나입니다. 이러한 손실 함수의 중요성은 머신러닝의 핵심 절차인 '추론(Inference)' 단계에서 특히 드러납니다. 모델이 학습 데이터를 바탕으로 새로운 데..
서론 머신러닝의 핵심적인 과정 중 하나는 바로 'Training'입니다. 이는 노래를 배우는 사람이 여러 번 연습을 통해 음정을 맞추고, 복잡한 곡을 연주하는 기술을 향상시키는 과정에 비유할 수 있습니다. 머신러닝에서의 'Training'은 모델이 데이터로부터 학습하고, 그 학습 결과를 바탕으로 성능을 향상시키는 과정을 의미합니다. 머신러닝(Machine Learning) 학습(Training) 기초를 이해하기 위해 머신러닝의 핵심 개념 중 하나인 선형 회귀 모델을 예로 들면, 이는 'y=wx+b'라는 간단한 수식으로 표현됩니다. 여기서 'w'와 'b'는 각각 가중치와 편향을 의미하는 파라미터입니다. 이 파라미터들은 주어진 데이터로부터 정보를 얻어서 성능이 향상될 수 있는 방향으로 업데이트되는 것이 'T..