STUDY/etc

웹 크롤링(web crawling)과 저작권

sorrow16 2021. 7. 26. 10:21

웹 크롤링이란?

웹 크롤러(web crawler)는 조직적, 자동화된 방법으로 월드 와이드 웹을 탐색하는 컴퓨터 프로그램이다.
웹 크롤러가 하는 작업을 '웹 크롤링'(web crawling) 혹은 '스파이더링'(spidering)이라 부른다. 웹 크롤링(Crawling)은 크롤러를 이용하여 웹페이지의 내용 전부 또는 특정 내용을 대량으로 가져오는 것을 뜻한다.

저작권법상 데이터베이스와 데이터베이스 제작자의 권리

‘데이터베이스’는 소재를 체계적으로 배열 또는 구성한 ‘편집물’로, 개별적으로 그 소재에 접근하거나 그 소재를 검색할 수 있도록 한 것이다. 데이터베이스는 창작성을 요하지 않는다

1)(저작권법 제2조 제19호). ‘데이터베이스 제작자’란 데이터베이스의 제작 또는 그 소재의 갱신·검증 또는 보충에 인적 또는 물적으로 상당한 투자를 한 자를 말한다(동법 제2조 제20호)

데이터베이스 제작자는 그의 데이터베이스의 전부 또는 상당한 부분을 복제·배포·방송 또는 전송할 권리를 가진다(동법 제93조 제1항). 데이터베이스의 개별 소재는 데이터베이스의 상당한 부분으로 간주되지 아니하나, 데이터베이스의 개별 소재 또는 그 상당한 부분에 이르지 못하는 부분의 복제 등이라 하더라도 반복적이거나 특정한 목적을 위하여 체계적으로 함으로써 당해 데이터베이스의 통상적인 이용과 충돌하거나 데이터베이스 제작자의 이익을 부당하게 해치는 경우에는 당해 데이터베이스의 상당한 부분의 복제 등으로 본다(동법 제93조 제2항).

데이터베이스 제작자는 권리 침해자에 대해 침해의 정지청구, 손해배상청구 등이 가능하며(동법 제123조, 제125조), 데이터베이스 제작자의 권리를 침해한 자는 3년 이하의 징역 또는 3천만 원 이하의 벌금에 처해진다(동법 제136조 제3항 제3호).


무단 크롤링과 데이터베이스 제작자의 권리 침해 관련 판시동향

무단 크롤링과 관련한 대표적인 선례로 ‘리그베다위키(http://rigvedawiki.net) 사건이 있다.
리그베다위키(rigvedawiki)는 인터넷을 통하여 각 주제어별로 그에 관한 설명을 제공하는 온라인 백과사전의 일종으로, 이용자들이 특정한 주제어에 관한 게시물을 자유롭게 작성하여 게시하거나 이미 게시된 내용을 자유롭게 수정하는 방식으로 운영되고 있었다. 그런데 위 사건의 피고는 미러링(mirroring, 특정 인터넷 사이트에 집적된 자료 전부를 다른 인터넷 사이트로 그대로 복사하여 오는 것) 방식으로 리그베다위키 사이트의 게시물을 전부 복제한 후 ‘엔하위키 미러’라는 명칭의 인터넷 사이트를 만들어 광고 수익을 얻고 있었다.

원고는 데이터베이스 제작자의 권리 침해를 주장했는데, 1심 법원은 원고 사이트에 집적된 20만 건 이상에 이르는 게시물 대부분은 각 이용자가 작성하거나 이를 수정하여 온 것으로 보이는 점 등을 들어 원고가 데이터베이스 제작자에 해당한다고 볼 수 없다고 판시하였다(서울중앙지방법원 2015. 11. 27. 선고 2014가합44470 저작권침해금지등 사건).

위 판결은 저작권법의 문언상 소재의 갱신, 검증, 보충을 요구하고 있음에도 이를 소재의 제작으로 해석하고, 개별 소재의 제작과 데이터베이스의 제작을 구별하지 않았다는 비판을 받았다.

위 사건의 2심은 1심과 달리 소재 제작과 데이터베이스의 제작을 구별하여 원고가 체계, 카테고리, 항목 등을 설계하고 개별적·체계적 검색 기능을 도입한 점, 통일되고 짜임새 있는 목차 구조와 페이지 작성 양식 등을 만들었고, 개별 자료에의 접근성을 높인 점, 수 대의 서버를 운영하면서 만 명이 넘는 가입자와 수십만 개의 위키 문서를 갖춘 원고 사이트를 유지·관리하고 있는 점, 허위 자료, 검증되지 아니한 자료, 광고성 자료들을 관리·수정·삭제한 점 등을 종합하여 원고의 데이터베이스 제작자로서의 지위를 인정하였고, 데이터베이스 제작자의 권리 침해 중 복제권, 전송권 침해를 인정하였다(서울고등법원 2016. 12. 15. 선고 2015나2074198 저작권침해금지등 사건).

위 리그베다위키 사건 이후 법원은 인터넷플랫폼 사업자에 대해 데이터베이스와 데이터베이스 제작자의 권리를 대부분 인정해주고 있다.
이에 최근 무단 크롤링 사건의 피고는 저작권법 제93조 제2항 상 상당한 부분에 이르지 않는 부분의 복제라거나, 당해 데이터베이스의 통상적인 이용과 충돌하거나 데이터베이스 제작자의 이익을 부당하게 해지지 않는다는 취지의 주장을 점차 늘리고 있는 추세이다.

‘잡코리아-사람인HR’의 채용공고 무단 크롤링 사건에서도, 피고는 원고 웹사이트에 게재된 채용정보 중 약 10%만을 선별하여 피고의 구성 방식에 맞추어 새로이 게재하였다는 주장을 하였으나, 법원은 피고가 별도의 마케팅 비용 등의 지출 없이 피고의 영업에 이용할 목적으로 반복적, 체계적으로 원고 데이터베이스의 채용정보 부분을 복제함으로써 데이터베이스 제작자인 원고의 이익을 부당하게 해쳤다고 보아 데이터베이스 제작자의 권리 침해행위를 인정하였다(서울고등법원 2017. 4. 6. 선고 2016나2019365 저작권침해금지 등 청구의 소 사건).

또 다른 무단 크롤링 사건의 피고는 무단으로 크롤링한 정보에 대해 출처를 명시하고 있으며 출처에 링크를 연결하고 있기 때문에 데이터베이스의 통상적인 이용과 충돌하지 않는다고 주장하였으나, 법원은 크롤링한 웹사이트에서 출처 웹사이트로 굳이 이동하지 않더라도 검색이 가능한 점, 데이터베이스의 양과 질, 방문자 수나 이용 시간이 영업에 중요한 영향을 미치는 점 등을 종합하면, 데이터베이스 제작자의 권리 침해가 있다고 판시하였다(서울중앙지방법원 2020. 7. 9. 선고 2018가합528464 데이터베이스권침해금지등 사건).

한편 최근 법원은 숙박업소 플랫폼 ‘여기어때’의 대표에게 경쟁사 ‘야놀자’의 데이터를 무단 복제했다는 혐의로 지난 2월 징역 1년2개월에 집행유예 2년을 선고하였고(서울중앙지방법원 2020. 2. 11. 선고 2019고단1777 사건), 무단 크롤링을 직접 행한 경쟁사뿐만 아니라 해당 경쟁업체에게 크롤링 프로그램을 만들어준 개발사에게 공동으로 손해배상책임을 인정하기도 하였다(서울중앙지방법원 2020. 9. 18. 선고 2018가합524486 데이터베이스제작자의권리침해금지 등 사건).


출처 : https://blog.naver.com/kcopastory/222127895247

무단 웹크롤링과 데이터베이스 제작자의 권리 보호

최근 데이터베이스에 기초한 인터넷플랫폼 시장이 급성장하면서 경쟁사의 웹페이지를 타깃으로 한 무단 크...

blog.naver.com

'STUDY > etc' 카테고리의 다른 글

[노션 #2] 노션(Notion) 사용법/기본기능  (0) 2021.08.24
[노션 #1] 노션(Notion) 가입  (0) 2021.08.23
도메인 구매대행 서비스  (1) 2021.07.14
프레스 킷(press kit)  (0) 2021.06.17
해상도  (0) 2021.06.14