아이디어

예제로 배우는 크롤링:닛신 라멘 뮤지엄 견학 캔슬 알람 보내기 (2)

25 3월 2025 • 5 min read

ScrapingBee란?

ScrapingBee에 대해서는 아래 페이지를 참조해주세요.

ScrapingBee에서 'HTML Request Builder' 메뉴를 클릭하여 신규 요청 창을 열고, 아래와 같이 설정합니다.

Main Parameters: 웹 크롤링 대상 페이지의 URL을 입력하는 부분입니다.
Wait (in ms): 웹 페이지가 로딩되기까지 기다릴 시간을 입력하는 부분입니다. 크롤링 대상 페이지에 맞춰서 설정하시면 됩니다.
Wait For (CSS Selector): 만약 크롤링 대상 페이지가 일단 페이지를 로딩한 후 JS 등을 사용하여 추가 정보를 불러오는 타입일 경우, 특정한 DOM 요소가 로드될 때까지 기다리기 위한 명령입니다. 위의 예에서는 #day-20250308이라는 ID를 가지고 있는 태그가 로드될 때까지 기다리고 있습니다. 크롤링하려는 페이지에 맞춰서 설정하시기 바랍니다. 만약 CSS 셀렉터에 대해 알고 싶으신 분은 다른 사이트를 참조해 주세요.

위의 설정으로도 크롤링이 가능합니다만, 이대로라면 해당 페이지에 존재하는 모든 데이터를 읽어 오게 되기 때문에 불필요한 데이터가 과도하게 포함될 수 있습니다.
이 경우 아래 설정을 통해 원하는 요소만 크롤링하는 것이 가능합니다.

JSON 형식으로 셀렉터를 사용하여 데이터를 추출하고 싶은 위치를 지정합니다. 데이터를 추출할 위치는 크롬 브라우저의 개발자 도구를 이용하면 간단히 확인할 수 있습니다.

위의 설정을 완료하면, ScrapingBee의 코드 생성 부분에 아래와 같은 형식의 URL이 출력됩니다. (설정 내용에 따라 세부적인 내용은 달라질 수 있습니다)

cURL 형식의 URL 중 URL 부분을 웹 브라우저에 붙여넣으면 결과값이 제대로 취득되는지 확인할 수 있습니다.

이렇게 해서 Make.com의 HTTP 모듈에 입력하기 위한 URL 준비가 끝났습니다.
다음 글에서는 이를 통해 얻어진 정보를 필터링하는 과정을 진행하도록 하겠습니다.