:: The Journal of the Institute of Internet, Broadcasting and Communication ::, Vol.19 No.6 | (2019) pp.1~8

빅데이터 분석을 활용한 가짜 리뷰 필터링 시스템 ADDAVICHI

Davichi Jeong

(회원, 한국산업기술대학교 컴퓨터공학부)

Young-J. Rho

(정회원, 한국산업기술대학교 컴퓨터공학부)

Abstract

최근 ‘바이럴 마케팅’ 으로 인해서 홍보에만 치중하는 블로그 게시물 등으로 인해 소비자의 불신이 깊어졌다. 또한, 이용후기를 거짓으로 작성하거나, 과장 확대하는 등의 마케팅 사업은 신문이나 TV 광고에 비해 가격이 저렴하면서 도 효과가 커 각광받는 사업 중 하나로서 광고비 규모는 2016년 기준 ‘3조 3941억’으로 주요 광고수단으로 자리잡고 있다. 이러한 ‘바이럴 마케팅’으로부터 정보를 걸러주는 도구가 필요한 인터넷 환경이 되었다. 본 논문에서 제시하는 가짜 리뷰 필터링 어플리케이션 ADDAVICHI는 사용자가 ‘이벤트’, ‘맛집’ 등의 컨텐츠를 검색하면 블로그 키워등, 총 검색 수, 신뢰도, 만족도 등을 추출하고 분석하여 제시한다. 신뢰도는 블로그에 있는 광고게시물 수와, 전체 게시물 수를 보여 주고, 만족도는 신뢰도에서 걸러진 청정 게시물을 긍정 게시물과 부정게시물로 나눠서 보여준다. 마지막으로 키워드는 긍정 게시물에서 나온 리뷰 상위 세 단어 리스트를 보여준다. 이러한 방법으로 사용자가 광고 글로부터 벗어나서 정보를 해석할 수 있도록 지원한다.
Recently, consumer distrust has deepened due to blog posts focusing only on public relations due to 'viral marketing'. In addition, marketing projects such as false writing or exaggerated use of the latter phase are one of the most popular programs in 2016 as they are cheaper and more effective than newspaper and TV ads, and the size of advertising costs is set to be a major means of advertising at '3 trillion 394.1 billion won. From this 'viral marketing,' it has become an Internet environment that needs tools to filter information. The fake review filtering application ADDAVICHI presented in this paper extracts, analyzes, and presents blog keywords, total number of searches, reliability and satisfaction when users search for content such as "event" and "taste restaurant." Reliability shows the number of ad posts on a blog, the total number of posts, and satisfaction shows a clean post with confidence divided into positive and negative posts. Finally, the keyword shows a list of the top three words in the review from a positive post. In this way, it helps users interpret information away from advertising.
  Mobile,text mining,significant advertising review,content positive/negative

Download PDF List