シラバスの表示

データ科学・AI概論

後期 火曜日 5講時 情報教育実習室 M105. 単位数/Credit(s): 2. 担当教員(所属)/Instructor (Position): 三石 大、大石 峰暉 所属:データ駆動科学・AI教育研究センター. 対象学部/Object: 全. 開講期/Term: 2セメスター. 科目群/Categories: 全学教育科目基幹科目. 履修年度: 2024. 科目ナンバリング/Course Numbering: ZAC-OIN801J. 使用言語/Language Used in Course: 日本語.

主要授業科目/Essential Subjects

各学部の履修内規または学生便覧を参照。

授業題目/Class Subject

データ科学・AI概論
Introduction to Data Science and Artificial Intelligence

授業の目的と概要/Object and Summary of Class

本授業科目の目的は、大量のデータから価値ある情報を抽出し、活用するためのデータ科学やAIの知識と技術の基礎を修得することにある。
近年、社会の様々な場面で大規模なデータが蓄積・流通されており、それらを安全かつ有効に公共の福祉や社会活動に役立てられる見識と能力が、現代的なリテラシーとして求められている。
すなわち、文系・理系を問わず全ての学生が、基礎的な統計学を理解するとともに、プログラミング環境を含む計算機科学の様々な成果を適切に活用し、データから目的の情報を抽出するためのデータ科学・AIの知識と技術を修得することが求められている。
そこで本授業科目では、データ科学や機械学習、AIの分野で標準的なプログラミング言語の1つであるPythonを利用した実習を交えながら、具体的なデータ処理方法について実践的に学ぶ。

The purpose of this course is to acquire basic knowledge and skills in data science and AI to extract and utilize valuable information from huge data.
In recent years, huge-scale data has been accumulated and distributed in various scenes of society, and insights and abilities to use them safely and effectively for public welfare and social activities are required as modern literacy.
Therefore, all students, regardless of humanities or science, are expected to understand basic statistics and to acquire knowledge and skills in data science and AI in order to extract the intended information from such data by utilizing various achievements in computer science, including programming environments.
In this course, you learn actual data processing methodology practically using the Python, which became one of the standard programming languages in the field of data science, machine learning and AI.

学修の到達目標/Goal of Study

・コンピュータプログラムを利用してデータの整理や可視化を行える。
・統計的仮説検定の種類と意味を理解し,目的に応じた検定を行える。
・観察対象から得られたデータを分析し,分類や予測を行える。
・機械学習や人工知能の概要を理解し,簡単なプログラムを作成できる。
・現代社会におけるデータ科学の課題を確認できる。

After taking this course, you will be able to :
- Organize and visualize data using computer programs
- Understand the types and meanings of statistical hypothesis test, and be able to perform them according to the purpose.
- Analyze data obtained from measuring object, and conduct classification and prediction
- Understand the outline of machine learning/artificial intelligence, and be able to create its simple programs.
- Identify the issues of data science in modern society.

授業内容・方法と進度予定/Contents and Progress Schedule of the Class

1. イントロダクション:データ科学・AIの活用事例
2. Pythonによるデータの整理と可視化
3. データ科学の基礎(1):データの分布とサンプリング
4. データ科学の基礎(2):確率・統計の諸定理と推定
5. 仮説検定(1):統計的仮説検定の基礎
6. 仮説検定(2):統計的仮説検定の種別と実践
7. 仮説検定(3):計数値についての統計的推測
8. データに基づく説明と予測(1):相関と回帰
9. データに基づく説明と予測(2):多変量回帰
10. 機械学習(1):主成分分析
11.機械学習(2):クラスター分析
12.機械学習(3):サポートベクトルマシン
13.人工知能(1):パーセプトロン、ニューラルネットワーク
14.人工知能(2):ディープラーニング
15.課題演習

1. Introduction: Applications of Data Science and AI
2. Organizing and Visualizing Data in Python
3. Data Science Basics (1): Probability Distribution/Sampling
4. Data Science Basics (2): Theorems of Probabilities and Statistics/Statistical Inference
5. Statistical Hypothesis Testing (1): Basics of Hypothesis Testing
6. Statistical Hypothesis Testing (2): Variations and Practice of Hypothesis Testing
7. Statistical Hypothesis Testing (3): Hypothesis Testing about Discrete Variables
8. Data-driven Explanation and Prediction (1): Correlation and Regression
9. Data-driven Explanation and Prediction (2): Multivariate Regression
10.Machine Learning (1): Principal Component Analysis
11.Machine Learning (2): Cluster Analysis
12.Machine Learning (3): Support Vector Machine
13.Artificial Intelligence (1): Perceptron and Neural network
14.Artificial Intelligence (2): Deep Learning
15.Excercise

成績評価方法/Evaluation Method

各回の授業で課す演習課題、および期末試験により評価される。
Home assignments in each session and terminal examination

教科書および参考書/Textbook and References

  • データサイエンス教本 (第2版), 牧野浩二、橋本洋志, オーム社 (2023) ISBN/ISSN: 9784274231148 資料種別:教科書

関連URL/URL

以下は文部科学省による「数理・データサイエンス・AI教育の全国展開」事業に伴って組織された「数理データサイエンス教育強化拠点コンソーシアム」が提供している自習用教材である。適宜参照のこと。
The following are self-study materials provided by the Consortium for Strengthening Mathematical Data Science Education, which was organized as part of the "Nationwide Development of Mathematical Data Science and AI Education" project by the Ministry of Education, Culture, Sports, Science and Technology. Please refer to them as appropriate.
http://www.mi.u-tokyo.ac.jp/consortium/e-learning.html

授業時間外学修/Preparation and Review

毎回、予習(分析のためのコードを書いてくる)をしていることを前提とする。また、各回の授業で示す演習課題に取り組み、指示された方法で成果物を提出すること。
Prepare for each session (write scripts for the analysis).
Work on the assignments given in each session and submit it.

実務・実践的授業/Practicalbusiness※○は、実務・実践的授業であることを示す。/Note:"○"Indicatesthe practicalbusiness

授業へのパソコン持ち込み【必要/不要】/Students must bring their own computers to class[Yes / No]

対面形式で実施する授業に参加の際は個人PCを持参すること。
Bring your own PC when participating in face-to-face sessions.

その他/In Addition

この授業では、ISTU/DCを利用して授業資料の配布や課題提出、諸連絡を行う。
In this class, ISTU/DC will be used to distribute class materials, submit assignments, and communicate with students.

授業の予習として、毎回提示する分析用のPythonコードを書いたうえで授業に出席すること(Google Colaboratoryの利用を想定しているが、Jupyter Notebookなどでも可)。
In preparation for class, you are expected to attend sessions after coding Python scripts for the analysis to be presented (Google Colaboratory is assumed to be used, but Jupyter Notebook, etc., is also acceptable).

数学(線形代数学、微分積分学)および数理統計学の基本的事項、および初歩的なプログラミング(言語は問わない)について既習していることが望ましい。
Basics of some mathematics (linear algebra, differential and integral calculus, statistics) and elementary programming skills are required.

本授業および試験における生成系AIの利用は原則として禁止するが、一部で制限を緩和する場合もあるので、授業内での指示に従うこと。
The use of generative AI in this class and examinations is generally prohibited; however, restrictions may be relaxed in some cases, and students should follow the in-class instructions.

なお、本授業では、汎用的なデータ処理のためのプログラミング言語であるPython を利用しながらデータ科学に関する基礎的な理論についても確認することで、様々な応用に広く適用可能な知識の獲得を目指す。一方、データ分析のための専用プログラミング言語であるRを使用し、実践的なデータ分析に必要なスキルの獲得を目指す場合は、本授業と並列に開講されている「データ科学・AI概論」(長濱先生担当)を受講するとよい。
This course aims to acquire knowledge that can be widely applied to a variety of applications while learning basic theories related to data science by using Python, a programming language for general-purpose data processing. On the other hand, we recommend another "Introduction to Data Science and AI" by Prof. Nagahama in parallel with this course is recommended if you want to acquire more practical data analysis skills by using R, a programming language specialized for data analysis.

 これと関連したシラバス 学務情報システムで確認
このシラバスを共有