이 수업은 대학에서 전문 분야를 공부하는 데 있어서도, 졸업 후 사회에서 활약하기 위해서도 데이터 분석에 대한 지식과 능력이 필수적인 가운데, 다양한 종류의 데이터를 과학적 지식으로 객관적으로 분석하는 방법의 기초를 수학적 사고에 중점을 두고 학습하는 것을 목적으로 한다.
수업 내용
이 수업은 1학년을 주 대상으로 하고 있으며, 취재 당일은 7번째 강의가 진행 중으로 강의실을 가득 메운 학생들이 수강하고 있었다.
교과서는 사용하지 않고, e-Learning의 학습관리 시스템인 Moodle(무들)을 통해 제공되는 자료를 사용한다. 수강생들은 모두 개인 컴퓨터를 열어 수업에 임한다.
선생님은 사전에 과제를 내주며, 자료를 숙지하고 있어야 한다.
수업은 과제에 대한 설명으로 시작되었다. 이번 과제는 평균, 중앙값, 최빈값에 대한 고찰이었는데, ‘항상 평균을 취하는 것이 의미가 있는 것은 아니다’라는 설명과 함께 마츠우라 선생님이 좋아하는 야구 관련 데이터를 예로 들어 알기 쉽게 설명해 주셨습니다.
이어서 상관관계에 대한 설명이 이어졌고, 지난 수업의 복습으로 ‘두 변수에 상관관계가 있다고 해서 인과관계가 있는 것은 아니다’라는 내용이 다뤄졌다.
이후 이날 수업에서는 우상향의 양의 상관관계, 우하향의 음의 상관관계에 대해 상관계수를 이용해 좀 더 자세한 설명이 이루어졌다. 자료에는 Σ(시그마)를 이용한 수식이 나열되어 있어 언뜻 어렵게 느껴졌지만, 실제로는 어려운 계산을 하는 것이 아니라 그 수식을 통해 무엇을 구하는지, 산출된 데이터가 갖는 의미에 대한 설명이 주를 이루며 데이터를 다룰 때 주의해야 할 점을 배울 수 있었다.
또한 산포도를 그려보는 것의 중요성에 대한 설명도 있었는데, “복잡하게 계산하기 전에 먼저 그래프로 그려보면 알 수 있는 것도 있다. 컴퓨터를 사용하면 어려운 분석을 할 수 있지만, 어렵게 생각하기 전에 먼저 원시적인 방법으로 데이터의 성질을 파악할 필요가 있다”고 강조했다. 이 말이 인상적이었고, 앞으로 학생들이 전문 분야로 나누어 연구를 진행하는데 도움이 되는 기초적인 수업이라는 생각이 들었다.
이 수업은 분기별로 총 8회 수업이 진행되어 정리하는 시기에 접어들었고, 수업이 끝날 무렵에는 보고서 제출에 대한 설명이 있었습니다. 평가 기준도 상세히 제시되어, 4월에 입학한지 얼마 되지 않은 1학년에게는 대학에서 수업에 임하는 자세를 배울 수 있는 좋은 기회가 될 것 같습니다.
전체적으로 구체적 예시가 친숙하고 이해하기 쉬운, 그야말로 ‘기초’ 수업입니다. 꼭 수강하셔서 앞으로의 연구에 활용하시기 바랍니다.
교사의 의견
지금 전 세계적으로 AI(인공지능)와 데이터 사이언스가 각광을 받으며 각국이 치열한 개발 및 활용 경쟁을 벌이고 있다. 일본에서도 데이터 활용 능력이 사회인에게 필수적인 기초 능력이라는 인식이 확산되고 있다.
이 수업에서는 데이터를 기본적으로 보는 방법과 다루는 방법을 배웁니다. 수업에서 배운 내용은 졸업 연구 등에서 실험-관찰 데이터를 분석할 때 도움이 될 뿐만 아니라, 졸업 후 ‘데이터에 강한 인재’로서 사회에서 활약할 수 있는 기반이 된다. 이학부에는 수학, 데이터 사이언스, AI를 전문적으로 배우는 ‘수학-수학정보학’ 과목이 개설되어 있지만, 이 수업은 이과생 이외의 학생들도 수강할 수 있으며, 실제로 대부분의 이과생들이 수강하고 있다.
수업에서는 일상적인 예시 외에도 제가 개인적으로 관심 있는 프로야구(특히 제가 응원하는 중일 드래곤즈)나 해외(특히 제가 살았던 스웨덴)에 관한 자료도 예시로 들어 설명합니다. 물론 수강생들이 모두 프로야구나 해외 이야기에 관심을 가질 수는 없겠지만, 그래도 제가 좋아하는 것을 주제로 삼고 있습니다. 학문이라는 것은 본래 싫어서 배우는 것이 아니라, 지적 호기심에 이끌려 이타적으로 탐구하는 것이라고 생각합니다. 이를 전달하기 위해 관심 있는 데이터를 즐겁게 분석하는 자세를 스스로 보여주는 것이 중요하다고 생각하고 실천하고 있습니다.
그런데 AI를 이용하면 무엇이든 가능하다는 환상이 있지만, AI는 원칙적으로 불가능한 것을 가능하게 하는 ‘마법의 도구’가 아니며, AI라 할지라도 시대를 초월한 보편적인 과학적 원리를 거스를 수 없습니다. 그리고 그 보편적 원리를 탐구하는 것이 이학부의 교육 및 연구의 특징입니다. 과학기술은 시대와 함께 빠르게 발전하고, 대학에서 배운 내용도 하루가 다르게 낡아가고 있습니다. 하지만 이학부 수업에서 배운 과학적 원리는 평생 동안 보편적인 존재입니다. ‘수리정보의 기초’ 수업 내용도 수강생 여러분들이 오래도록 삶의 밑거름으로 삼을 수 있기를 바랍니다.
수강생의 코멘트
이학부 이학과 1학년 이와이 요쿠미 씨
‘상관관계가 있으니 둘 사이에 관계가 있겠지’라고 생각하지는 않으신가요? 고등학교까지 배운 수학의 범위라면 이렇게 생각하겠죠? 본 강의에서는 데이터를 과학적 관점에서 객관적으로 분석하는 방법의 기초를 배웁니다. 데이터를 분석하는 방법은 여러 가지로 나뉘기 때문에, 선생님은 1강 1키워드의 속도로 사례를 들어 설명해 주십니다. 예를 들어, 어떤 데이터에 상관관계가 있다고 해서 인과관계가 있는 것은 아니며, 반대로 인과관계가 있다고 해서 상관관계가 있는 것은 아니라는 등의 내용을 학습합니다.
이 수업을 통해 저는 데이터에 대한 생각이 달라졌다고 생각합니다. 왜냐하면 데이터를 한 방향에서 고찰하는 것이 아니라, 엑셀의 기능을 활용하면서 수치와 그래프 등 다양한 관점에서 분석할 수 있게 되었기 때문입니다.
이러한 점을 감안할 때, 향후 데이터를 분석하는 직업을 갖고 싶거나 데이터 분석에 관심이 있는 분들에게 이 강의를 수강할 것을 강력히 추천한다.