1. 타겟 정의
- 목적 설정: 추출하려는 인플루언서가 특정 주제나 업종(패션, 뷰티, 피트니스 등)에 속하는지 결정합니다.
- 필터링 기준:
- 팔로워 수(예: 10k ~ 100k)
- 특정 해시태그(#) 활용 여부
- 게시물의 좋아요 및 댓글 수
- 지역 기반(예: 특정 국가나 도시)
2. 인스타그램 데이터 검색
- 방법 1: 해시태그 기반 검색
- 크롬 브라우저에서 특정 해시태그로 게시물을 검색합니다.
- 검색된 결과에서 URL을 수집합니다.
- 방법 2: 특정 키워드 검색
- 키워드 기반으로 구글이나 SNS 분석 도구(예: 인스타그램 검색)를 활용하여 관련 계정을 탐색합니다.
3. 데이터 수집(Crawling)
- 주의사항: 인스타그램은 크롤링을 제한하므로, IP 차단이나 계정 잠금을 방지하려면 주의가 필요합니다.
- 크롬 디버깅 모드를 활용하여 수작업에 가까운 자동화를 설계합니다.
- selenium, BeautifulSoup 등을 활용하여 HTML을 파싱합니다.
구현 프로세스:
- URL 추출
- 크롬 디버깅 모드에서 selenium을 사용하여 페이지를 스크롤 다운하면서 게시물 URL을 수집합니다.
- URL 중복을 제거하며 저장합니다.
- 계정 정보 수집
- 게시물 URL로 계정 페이지에 접근하여 데이터를 가져옵니다.
- 주요 정보:
- 팔로워 수, 팔로잉 수
- 게시물 수
- 프로필 소개(링크 포함 여부)
- 데이터 정리
- 추출한 데이터를 Pandas 등으로 정리하여, 팔로워 수 기준으로 정렬하거나 특정 조건에 맞는 데이터를 필터링합니다.
4. 인플루언서 분석 및 선정
- 정렬 기준:
- 팔로워 수 상위/하위
- 게시물 활동량(일정 주기 이상 게시물 작성 여부)
- 댓글 반응 수(참여율 분석)
- 선정 방법:
- 데이터에서 최적화된 조건(예: 10k ~ 50k 팔로워, 평균 참여율 3% 이상)을 충족하는 인플루언서를 선정합니다.
5. DM 발송 준비
- DM 내용 작성:
- 개인화된 메시지를 작성합니다. (예: "안녕하세요, XX 브랜드에서 연락드렸습니다. 귀하의 컨텐츠를 보고 매우 인상 깊었습니다...")
- 메시지에 브랜드 소개, 협업 조건 등을 간략히 포함합니다.
- 자동 DM 발송:
- API를 통한 대량 발송은 인스타그램 정책 위반이 될 수 있으므로, 수동으로 보낼 수 있는 환경을 구축하거나, 허용된 툴을 활용합니다.
6. 기타 고려사항
- IP 분산: 여러 IP 주소를 사용하여 크롤링을 분산 처리합니다.
- 속도 제한: 크롤링이나 DM 발송 속도를 제한하여 인스타그램 로봇 감지 시스템을 피합니다.
- 데이터 저장: 수집된 데이터를 CSV, 엑셀, 또는 데이터베이스로 저장하여 관리합니다.