아랍연구자로서의 SNS 분석 연구와 교육의 필요성
페이지정보
글쓴이 지중해지역원 조회 3,477 조회 날짜 22-01-05 15:16내용
아랍연구자로서의 SNS 분석 연구와 교육의 필요성
이동열(지중해지역원)
트위터(tweeter)는 140자내에서 간단한 글을 공유할수 있는 단문 전용 SNS(Social Network Service)이다. 특히 트위터는 언어나 지역의 제한 없이 전 세계의 이용자들과 소통이 가능하다. 즉, 자신의 의견을 피력하거나, 자신의 일상을 이야기 하는 등의 데이터가 실시간으로 쌓이는 구조로 되어 있다. 트위터의 사용자는 2021년 1월 기준 3억 5천300만명으로 추산되고있으며, 매일 1억 8천 7백만명의 사용자가 접속하고 있는 것으로 트위터 CEO가 발표한바 있다. 또한 트위터에 게재된 트윗의 총 누계를 업데이트 하는 기가트위트(GigaTweet)는 트윗의 누계를 실시간으로 파악하는데는 기술의 한계가 있다는 공지와 함께 트윗의 총 누계 업데이트를 2010년 11월 이후로 진행하고 있지 않다.
이렇게 방대한 사용자와 데이터가 누적되어 있는 트위터는 분석에 따라서, 매우 중요한 기초자료(Raw Data)로 활용할 수 있다. 많은 연구들이 인간행동 및 심리 분석등에 중요한 자료로 트위터 분석을 활용하고 있으며, 향후 더 많은 분야에 활용 될 것으로 생각된다.
트위터의 데이터를 수집하여, 분석하는데에는 많은 연구와 분석기법이 개발되었으며, 또한 현재 활용되고 있다. 그러나, 대부분의 경우 그 분석의 대상이 영어 및 한글 사용자에 국한되어 있는 것이 사실이다. 영어나, 한글의 특정 단어를 중심으로 트위터의 트윗을 수집 및 분석하는 방법이 대부분인 것이다.
물론 일부 연구자들에 의해서 프랑스어 및 중국어등의 트위터 분석 연구도 진행되고 있다. 그러나 그에 반해 아랍어 트윗에 대한 연구는 미비한 편이다. 그 이유는 아랍어의 특징과도 관련이 있을 것이다. 아랍어는 어근을 가지고 그 형태가 변화하여, 다양한 뜻을 나타 낸다. 또한 그것이 인칭대명사와 결합하면서 또다른 형태를 취한다. 즉, 형태적으로 “공부하다”라는 단어는 일단적으로 “درس”를 사용한다. 그러나, 아랍어 문법에 의해서 “내가 공부한다”는 “أدرس”, “우리가 공부한다”는 “ندرس” 등과 같이 변화한다. 또한, 형태의 변화에 있어서 “~와 함께 공부했다.”는 “دارس”등으로 변화하고, 시제에 따라서도 변화한다. 또한 유사한 단어의 형태를 가지고도 전혀 다른 뜻을 가지기도 한다. “مدرس”의 경우 공부하다의 뜻이 아닌 “교사, 교육받은”의 의미로 사용된다. 즉, 기존의 한글과 영어의 트위터 분석 연구방식과는 언어적으로 교려할 사항이나, 예외로 두어야할 사항이 매우 많다는 의미가 된다. 이는 아랍어 트윗 분석을 위해서는 아랍언어 전공자 혹은 아랍어 전문가가 필요하다는 의미일 것이다. 이를 단순한 협업으로 해결하는데에는 한계가 있다. ICT전공자가 기술을 구현하기 위해서라도 최소한의 아랍어의 구조를 이해할 필요가 있다. 그러나 이를 ICT 전공자에게 요구하는 것은 무리한 요구일 것이다. 그렇다면 해결 방법은 아랍언어 전공자 혹은 아랍어 전문가가 최소한의 트위터 혹은 비정형 텍스트 분석기술을 습득하여, 가공된 자료를 생산하는 것이 바람직할 것이다. 이렇게 가공된 자료를 활용하여 세부적인 분석의 경우 해당 전공자와의 협업을 진행할 수 있을 것이다. 이렇게 연구에 활용하는 것 이외에도, 기초적인 트위터 분석 및 비정형 텍스트 분석 기법을 학부 전공자들에게 학습하게 한다면, 이를 통해 현재 아랍어에서 많이 쓰이는 신조어, 혹은 자신의 관심 분야를 아랍인들이 일상에서 어떻게 받아들이고 있는지를 직접 확인 할 수도 있을 것이다. 이러한 일련의 과정은 학생들에게 흥미를 유발하면서도, 컴퓨터적인 사고와 논리를 키우는데 큰 도움이 될 것이다.
댓글목록
댓글이 없습니다