우유부단한 성격이라면 데이터 과학을!
Page Info
Content
우유부단한 성격이라면 데이터 과학을!
강지훈_지중해지역원
인생은 결정의 연속이다. 하루에도 결정을 반드시 해야만 하는 순간이 무수히 많다. 아침은 먹을까 말까? 점심은 짜장면? 삼겹살? 주말엔 어떤 영화를 볼까? 주식을 살까? 팔까? 등 가벼운 결정부터 기업경영 방침 등에 대한 중대한 결정까지 일상이 결정의 연속이다. 이처럼 무수한 선택의 기로에서 우유부단한 성격때문에 주관적인 결정이 힘들다면 객관적인 정보를 참고하면 어떨까? 즉 의사결정을 위한 방법으로 객관적인 정보를 활용하자는 것이다.
데이터 과학(Data Science)은 다양한 형태의 데이터를 컴퓨터를 통해 분석하여 인사이트(Insight, 기존에 알지 못했던 유의미한 정보)를 추출하는 기술이자 학문 영역이다. 이렇게 추출된 결과는 개인이나 단체 또는 학술, 비즈니스 등 다양한 분야에서의 의사결정에 요긴하게 활용된다.
분야를 막론하고 의사결정에 활용되는 정보들은 사실에 기반해야 하겠다. 또한 객관적, 혹은 정량적 정보라는 사실이 전제되어야 한다. 최종 결정은 주관적이겠으나 그 주관적 결정의 과정은 객관적이어야 한다. 그렇다면 의사결정에 활용되는 정보들은 어디서, 어떻게 만들어질까?
의사결정을 위한 정보를 생성하는 기초 자원은 데이터/자료(Data)이다. 원래는 특별한 의미를 갖지 않는 대량의 데이터를 컴퓨터 시스템 기반에서 목적에 맞게 가공, 처리, 분석함으로써 기존에는 알지 못했던 유의미한 결과를 추출해 낼 수 있는데 이렇게 추출된 결과를 우리는 정보(Information)라고 한다.
가령 A고등학교 전교생들의 국어, 영어, 수학 점수 데이터는 가공이나 처리가 되지 않은 원시자료(raw data) 즉 데이터이다. 여기서 학년별/과목별 평균점수, 최고점수, 최저점수, 표준편자, 분산 등의 통계적 기법을 통해 처리된 결과는 의사결정을 돕는 정보가 된다. 예를 들어 학급별 통계에서 2학년 2반의 국어 점수의 평균은 높지만 수학 점수 평균이 학교 전체에서 최하위라면 해당 학급 담임 선생님은 국어보다는 수학에 우선순위를 두는 선택을 할 수 있다.
이처럼 데이터를 기반으로 추출된 유의미한 정보는 의사결정에 유용하게 활용될 수 있는데 정보가 의사결정 단계에 활용될 때 우리가 말하는 지식(Knowledge)이 된다. 위 예에서 국어보다 수학에 좀 더 집중을 했을 때 어떠한 효과나 가치가 있는지에 대해 판단해본다. 예를 들어 국어 점수는 다소 하락했으나 수학점수가 상승함으로써 자연계 대학 진학에 좀 더 유리해진다. 라는 지식이 생성된다. 마지막으로 학급별, 학년별, 성별에 따라 유사한 형태로 지식을 응용하고 활용하면 이것이 효과적인 대학진학의 지혜가 될 수 있는 것이다.