본문 바로가기
반응형

wonderland13

[24년 2월 4주] 생활 습관으로 본 비만 위험도 분류하기 - LevelUP 본 글은, 캐글 Multi-Class Prediction of Obesity Risk에 참여하며 작성했던 노트북을 기반으로 작성한 글입니다. 기본적인 EDA, 모델 구축, 평가에 관한 BaseLine 구축은 해당 링크에 참조되어있습니다. 본 글에서는 BaseLine 구축 후 모델의 성능을 높이는 다양한 방법들을 소개하려고 합니다. [대회] Multi-Class Prediction of Obesity Risk [참여 노트북] 어떻게 모델의 성능을 높일 수 있을까요? 1. 피쳐 엔지니어링 2. 모델 최적화 3. 이상치 제거 4. 교차검증 5. 데이터 증강 6. 오류 분석 7. XAI 피쳐 엔지니어링 모델의 성능을 높이기 위해 다양한 피쳐들을 만들고, 때론 변환하며 다양한 테스트를 시도해볼 수 있습니다. 그럴.. 2024. 3. 3.
[NLP] How to solve Sequential Labeling? from MEMM to CRF 본 글은, Conditional Random Field(CRF)를 공부하기 위해, lovit/ From Softmax Regression to Conditional Random Field for Sequential Labeling 포스트를 읽고 정리한 글임을 밝힙니다. Conditional Random Field(CRF)는 sequential labeling 문제에서 Recurrent Neural Network(RNN) 등의 deep learning 계열 알고리즘이 이용되기 이전에 널리 사용되던 알고리즘입니다. Conditional Random Field는 Softmax regression의 일종입니다. 그러나 a vector point 가 아닌, sequence 형식의 입력 변수에 대하여 같은 길이의 .. 2024. 3. 1.
[24년 2월 3주] Multi-Class Prediction of Obesity Risk - BaseLine 본 글은, 캐글 Multi-Class Prediction of Obesity Risk에 참여하며 작성했던 노트북을 기반으로 작성한 글입니다. - 대회 : Multi-Class Prediction of Obesity Risk - 참여 노트북 Introduction Goal The goal of this competition is to use various factors to predict obesity risk in individuals, which is related to cardiovascular disease. datasets Generated from a deep learning model trained on the Obesity or CVD risk dataset Obesity or CVD ris.. 2024. 2. 18.
Library 무언가를 만들 수 있는 사람이 될 수 있도록 공부합니다.트렌드를 공부합니다.무언가를 만들까 고민하는 사람이 되고 싶습니다.24년 주요 스킬ml/dl시계열 분석 Prophet, 이상치 탐지, 금융 특화 한국어 모델 파인튜닝, 띄어쓰기 모델 구축Graph속도 및 효율성 고민, 그래프 모델링EngineerBash, Docker, Airflow, k8s, Kafka, 데이터 파이프라인 설계llmGraphRag, Charater Chatbot with Hyper Clova X , LLM Agent for Recommandation, AutoRag, PrivateGPT, Vllm서비스벤치마킹    24 - 23[LandOwner] 시계열 데이터 예측 모델[Study] GraphRag - 엔티티 추출, 그래프 클러스.. 2024. 2. 12.
반응형