프로그래밍/IT 이것저것

크롤링(Crawling)과 스크래핑(Scraping)이란?

이자다 2023. 3. 12. 01:12
반응형

1. 크롤링과 스크래핑이란?


크롤링과 스크래핑은 웹에서 데이터를 수집하는 기술입니다. 크롤링은 인터넷 상에 공개된 페이지를 모두 방문하여 정보를 수집하는 기술이며, 스크래핑은 특정 웹 페이지에서 원하는 정보만을 추출하는 기술입니다.

 

 


2. 크롤링과 스크래핑의 사용처


크롤링과 스크래핑은 데이터 수집과 분석에 활용됩니다. 예를 들어, 경쟁사의 제품 정보를 수집하여 비교 분석하는 경우나, 소셜 미디어에서 사용자 반응을 모니터링하는 경우 등이 있습니다.

 



3. 크롤링과 스크래핑의 수행 과정 예시


크롤링과 스크래핑은 각각 다른 수행 과정을 가지고 있습니다. 크롤링은 먼저 대상 웹 페이지를 방문하여 HTML 문서를 수집하고, 수집한 HTML 문서에서 링크를 추출합니다. 이후 추출된 링크를 따라가며 HTML 문서를 수집합니다. 스크래핑은 크롤링과 마찬가지로 대상 웹 페이지에서 HTML 문서를 수집한 후, 원하는 정보를 추출합니다. 정보 추출에는 정규 표현식, 파싱 라이브러리 등을 사용합니다.

 

 


4. 크롤링과 스크래핑에 필요한 기반 지식과 커리큘럼


크롤링과 스크래핑을 다루기 위해서는 HTML, CSS, JavaScript 등의 웹 기술에 대한 이해가 필요합니다. 또한, 크롤링과 스크래핑을 수행하기 위한 Python, JavaScript, Ruby 등의 프로그래밍 언어를 학습해야 합니다. 관련된 강의나 교육 자료는 인터넷을 통해 온라인으로도 수강이 가능합니다.



반응형