어쩔 수 없이 듣게 된 경영통계학 수업, 논문을 쓰기 위해서는 연구조사방법론과 경영통계학이 필수다. 벌써 4학기가 시작되었다. 시간이 정말 빠르다. 지난 학기에 연구조사방법론은 미적분을 고등학교때 배우지 않은게 천추의 한이 될만큼 너무 어려운 수업이었다. 경영은 수학이라는 말이 실감날 정도였다. 이번 경영통계학은 다행히 수학에 수자도 몰라도 쉽게 설명해주셔서 너무 감사했다. 일단 첫 오리엔테이션을 시작으로 경영통계학 부셔보도록 하겠다!
통계는 중요하다면서 왜이렇게 부정적으로 설명할까?
오늘 보는 내용은 이번학기 끝날 때 까지 반복해서 나온다. 숫자는 거짓말을 하지 않는다. 통계학은 모든것을 설명할 수 있기 때문에 통계로 설명할 수 있는 것은 아무것도 없다. 여기까지의 내용들은 부정적이다. 왜 부정적인가? 통계는 중요하다면서 왜이렇게 부정적일까?
머지않아 통계적 사고는, 읽기와 쓰기와 마찬가지로 유능한 시민이 되기 위한 필수조건이 될 것이다. 현대인이 살아가는데 있어서 통계학이 필요하다.
통계학의 기원
- 라틴어의 ‘status = 국가에 대한 모든 사실’ 로 부터 파생되었다는 설
- 이태리어의 ‘state = 국가’ 로 부터 파생되었다는 설
통계의 기원은 국가를 운영하는데 있어서 가장 필요한 징세와 징병을 목적으로 필요해 지기 시작했다. 이런것들을 기록하는데서 부터 통계가 발생되었다. 행정으로부터의 시작은 고대의 징세와 징병을 목적으로 하다가, 현대에 들어 빅데이터를 활용한 통계를 이용해 일기예보나 실시간 교통정보, 주식시장분석(과거로부터 누적된데이터를 바탕으로 미래의 추세를 알아볼 수 있는)등 이미 오래전에 개발이 되어 있었다. 컴퓨터가 발달하면서 계산능력이 정확해지고 빨라진 것이다. 현대에 더 다양한 부분에서 활용하고 있다. 조금만 찾아보면 우리가 매일 경험하는 것들이 모두 통계이다.
존 그래넌츠나 페스칼, 파르마가 통계를 학문의 영역으로 들여오게 되었다. 이부분은 그냥 참고적으로 알면 된다. 이 수업시간 중반부 이후 실습하게될 통계분석에 있어서는 쿼틀렛이 만든 통계분석툴이 아주 초보적인 형태에서 지금은 전진(advance)되어 있는데 이들을 이용해서 어떤 데이터를 추출하여 무엇을 분석해서 어떤 이야기를 하고자 하는지를 실습해 보는 시간을 갖겠다. 왜 그러한 계산을 해야하고, 그 계산이 뜻하는 것이 무엇인지 로직을 알면 된다.
★ 통계학이라는 것을 가장 잘 설명해 줄 수 있는 그림
통계학의 정의
통계학은 자료를 의사결정에 도움이 되는 의미있는 정보로 전환하여 사회현상이나 자연현상을 수치로 요약하는 학문이다. 경영학은 사회과학이다. 조직이나 사람, 회사라는 것이 어떻게 구성되어 있고, 구성원들은 어떻게 생각을 하고, 고객의 관점 등 다양한 관점에 대해서 과학적으로 살펴 보는 것이다. 사회과학은도 역시나 통계학을 이용해서 본인의 주장을 뒷받침 할 수 있다. 거의 대부분의 논문에는 이론적배경, 통계, 결론이 나온다. 이 통계는 본인의 주장을 뒷받침 해주는 수단이다. 그냥 숫자는 데이터인데 이를 의미있는 숫자로 바꾸는 것이 통계이다.
일상생활에서 사용하는 통계수치들에는 어떤것들이 있습니까?
코로나 확진자수, 지지율, 강수확률 이런 것들 모두 통계다. 우리의 일상에서 매일 쓰고 있다.
왜이렇게 통계를 싫어하는가 ?
일상생활에서 쓰는 통계들은 '기술통계'다. 여기서 말하는 기술은 설명(descriptive)이라서 테크닉이 아니다. 기술하다, 설명하는 것이다. '확진자 수가 어제보다 증가했다, 감소했다.' 라는것은 기술통계이다. 지난달보다 월급이 몇퍼센트 인상되었다. → 기술통계에 해당
학문에 영역으로 들어오게되면 기술통계가 아니라 추론통계가 핵심이다. 내가알던 통계와 완전히 다른것같은 느낌이라서 통계는 어렵게 느껴진다. 일상생활에서는 기술통계라고 보면된다. 예를들어 대통령 지지율의 경우에 a후보와 b후보의 지지율을 이야기 하는데 앞에 표본오차를 이야기 한다. 이것이 바로 소규모의 데이터를 이용해서 전체를 설명하겠다 라는 추론통계에 해당한다.
위 그림을 다시한번 보자
모집단 = 전체를 의미한다. 모집단의 '모'는 母(어미 모)를 쓴다. 즉, 전체를 의미한다. (어미모를 쓰는 이유는 잘 모르겠지만 여튼!)
표본(샘플) = 전체에서 일부분만 뗀 것을 말한다. (예를들어 지지율을 물어볼 때 유권자 전체가 아니라 일부에 물어본다. 조사마다 다르다. 여기서 말하는 일부가 표본이다.)
자료(data) = 위 예시에서의 나온 결과값의 정보. 일정수의 사람들이 찬반의 의견을 밝히면 이게 바로 자료이다.
기술통계 = 찬성이 전체 200명 중 45%, 반대가 40%, 나머지 무응답이 몇프로 등 . 찬성이 더 많다는 기술통계를 통해 정보를 알 수 있다. 여기서 말하는 기술통계는 표본의 자료(데이터)이다.
추론통계 = 내가 궁금 한 것은 전체를 알고싶어 샘플링을 한 것이라서, 전체가 알고싶어 작은수를 조사한 것이다. 이 전체를 추론하는 것이 추론통계이다.
어디까지가 자료이고, 어디까지가 정보인가?
자료와 정보의 명확한 구분은 사용자가 이를 어떻게 활용하느냐에 따라 달라질 수 있다.
통계학은 현상에대해 파악하고, 결과에 대한 원인을 규명하고, 미래에 대한 예측을 통해 합리적 의사결정을 하기 위함이다. low data 상태에서 가공을 하면 정보가 되고 정보가 계속 누적이 되면 사실이 된다. 이게 누적되면 만인이 인정하는 지식의 단계로 받아들여진다 . 하지만 이 지식이 불변하는것은 아니다. 바뀌는 경우도 있다. 과학이 발전하기 이전에 받아들였던 사실들이 후에 아니었다 라고 밝혀지는 경우도 있다. 천동설이나 지동설의 경우에는 사실로 지식으로 받아들이고 있었는데 지식이 다시 규명되는 경우도 있어 불변하는 것은 아님을 알아야 한다.
의사결정에 통계가 어떻게 활용이 되나?
문제가 무엇인지 혹은 목표를 어떤것으로 잡을 것인지 현명한 결정을 해야 한다. 어디까지가 관련자료고 어디까지가 비관련 자료인가 이런것들을 먼저 결정을 해야 한다. 관련대상이나 관련자료가 sorting되면 자료수집을 한다. 모집단을 어디까지로 볼 것이냐도 중요하다. 유권자를 조사하는데 17세의 미성년자에게 전화가 갈 수도 있다. 모집단에 속한 사람이 아닌 자료도 들어갈 수 있어 이 통계는 '자료가 오염되었다'라고 볼 수 있다. 그렇기에 이부분도 매우 중요하다. 표본을 정리해 어떤식으로 자료를 수집하고 어디까지 수집할 것인지 여기서 얻어진 데이터를 이용해서 분석을 하고 추론과정을 거치게 된다. 최종적으로 추론이 문제가 없다면 해당 내용을 바탕으로 예측과 의사결정을 하게 된다.
기술통계 : 설명해주는 것으로 그림이나 도표, 숫자 평균점수를 가장 많이 쓴다. 사람들이 어떤 집단의 정보를 알고싶을 때 가장많이 쓰는것이 평균이다. 평균은 그래프 혹은 그림을 이용해서 설명한다.
추론통계 : 샘플에서 얻게된 자료를 가지고 모집단을 설명하는 것으로 추정이나 검정의 과정을 거치게 된다.
유권자 샘플에서 나온 지지율 = 통계랑, 전체 지지자의 지지율은 모수라고 한다. (모집단의 숫자 = 모수)
통계량은 포본의 숫자를 의미한다.
엑스바는 표본의 평균, 뮤(mu)는 모집단의 평균을 나타낸다. 표본의 숫자인 통계량은 알파벳으로 표기하고 모집단은 그리스어로 표기한다. 서로 구별하기 위해서!
연구조사방법론, 통계학, 경영통계학
연구조사방법론 : 실습의 내용(어떠한 연구문제나, 어떤 목표를 갖었을 때 어떻게 분석하고 수집해야 하느냐에 대한 방법론, 논문을 쓰기 위한 기초적인 과목 중 하나)
통계학 : 자료에서부터 추론과정까지, 통계량을 이용해서 모수를 추정하는 과정에서 나오는 계산이나, 절차, 해석방법을 총괄하는 학문
경영통계학 : 경영학 안에서 통계를 가지고 활용할 수 있는 것들에 대한 내용, 의사결정, 계량경제, 재무분석 등 모든것에서 활용한다.
경영통계학을 하기 위해서는 연조사와 통계학을 알아야 한다. 통계학은 다양한 분야에서 광범위하게 사용하고 있다.
'4학기 > 경영통계학' 카테고리의 다른 글
02 경영통계학 : 자료(Data) (0) | 2020.09.21 |
---|