MZ._.GPT

  • 홈
  • 태그
  • 방명록

크롬 1

[NLP] Selenium으로 데이터 수집

1. 개요 머신러닝, 딥러닝 모델 학습을 위해 데이터를 직접 수집하여 정제하는 작업은 ML Framework에서 필수적입니다. 그러나, 모든 데이터를 하나씩 수집하고 라벨링을 진행하는 것은 많은 비용이 소모됩니다. 그렇기 때문에 뉴스 기사, 상품 정보 등 웹페이지의 데이터를 수집할 때, 사용자가 수동으로 수행할 수 있는 모든 작업을 프로그래밍 방식으로 수행하여 비용을 최소화하는 것이 필요합니다. 대표적으로 웹페이지의 데이터를 수집하는 방법은 Beautifulsoup와 Selenium이 있습니다. 이 글에서는 Selenium에 대해 다뤄보도록 하겠습니다. 2. Selenium? request와 Beautifulsoup를 사용해 데이터를 수집하는 방법은 셀레늄에 비해 실행 속도가 굉장히 빠르다는 장점이 있습..

DL/NLP 2024.03.06
이전
1
다음
더보기
프로필사진

ML, DL 이것저것 기록하는 블로그

  • 분류 전체보기
    • RAG
    • Project
    • DL
      • NLP
      • Computer Vision
      • Voice
      • LLM
    • ML
    • AI Tech
    • 개발
      • Dash
      • DB
      • Docker
      • Linux
    • Debugging
    • Environment
    • Coding test

Tag

gan, dacon, 구현, ChatGPT, 딥러닝, 논문, Dash, 대시보드, 음성, Ai, LLM, 파이썬, docker, 데이터베이스, ocr, 리눅스, 머신러닝, nlp, rag, dl,

최근글과 인기글

  • 최근글
  • 인기글

최근댓글

공지사항

페이스북 트위터 플러그인

  • Facebook
  • Twitter

Archives

Calendar

«   2025/07   »
일 월 화 수 목 금 토
1 2 3 4 5
6 7 8 9 10 11 12
13 14 15 16 17 18 19
20 21 22 23 24 25 26
27 28 29 30 31

방문자수Total

  • Today :
  • Yesterday :

Copyright © Kakao Corp. All rights reserved.

티스토리툴바