シラバスの表示

データ科学・AI概論

後期 火曜日 5講時 情報教育実習室 M104. 単位数/Credit(s): 2. 担当教員(所属)/Instructor (Position): 長濱 澄 所属:情報科学研究科. 対象学部/Object: 全. 開講期/Term: 2セメスター. 科目群/Categories: 全学教育科目先進科目-情報教育. 履修年度: 2024. 科目ナンバリング/Course Numbering: ZAC-OIN801J. 使用言語/Language Used in Course: 日本語.

主要授業科目/Essential Subjects

各学部の履修内規または学生便覧を参照。

授業題目/Class Subject

データ科学・AI概論
Introduction to Data Science and Artificial Intelligence

授業の目的と概要/Object and Summary of Class

データ駆動型社会におけるデータ利活用の状況を理解すると共に、データ活用にあたって必要となる法令や倫理、数学や統計学の基本事項を振り返りつつ、標準的なソフトウェアやツール(表計算ソフトやR、 一部Python等を想定)を用いた実習を交えながら、具体的なデータ処理を体験的に学ぶ。また、様々な分析手法の紹介、ならびにデータ分析の注意事項や発展事項にも触れ、応用場面でさらにデータを活用できるよう準備を行う。

In addition to understanding the status of data utilization in a data-driven society, we will review the laws and regulations, ethics, and basic mathematics and statistics required for data utilization. Students learn concrete data processing through hands-on practice using standard software and tools (assuming spreadsheet software, R, and Python, etc.). They also learn various statistical analysis methods as well as notes on the analysis so that they can prepare for further use of the data in application situations.

学修の到達目標/Goal of Study

(1)PCを使って、各分野で用いられるデータを適切に整理・加工できる。
(2)図や数値によってデータの要約や可視化を行うことができる。
(3)カイ二乗検定、t検定、分散分析などについて、仮説検定の手続きを理解した上で、統計的検定の手続きの実行、結果の読み取り、結果の考察ができる。
(4)多変量解析(回帰分析、重回帰分析、主成分分析、因子分析)の基礎について、分析手続きの実行、結果の読み取り、結果の考察ができる。
(5)データ分析ソフトウェアを用いた分析ができる。
(6)(1)から(5)をもとに、オープンデータ等各データの特徴に応じて分析手法を適切に選択し、分析・報告できる。
(7)機械学習(線形識別器、ニューラルネットワーク、決定木等)に関する基礎的概念を理解し、簡単なプログラムを作成できる。

(1) To be able to use a PC to organize and process data used in various fields in an appropriate manner.
(2) Able to summarize and visualize data using figures and numbers.
(3) Understand hypothesis testing procedures for chi-square tests, t-tests, and ANOVA, and be able to perform statistical testing procedures, read results, and discuss results.
(4) Understand the basics of multivariate analysis (regression analysis, multiple regression analysis, principal component analysis, factor analysis), and be able to perform analysis procedures, read results, and discuss results.
(5) Be able to perform analysis using data analysis software.
(6) Based on (1) through (5) above, be able to select, analyze, and report on analysis methods appropriate to the characteristics of each type of data, including open data.
(7) Understand basic concepts related to machine learning (linear discriminators, neural networks, decision trees, etc.) and be able to create simple programs.

授業内容・方法と進度予定/Contents and Progress Schedule of the Class

1. イントロダクション:データ科学・AIの活用事例
2. Rによるデータの整理と可視化
3. データ科学の基礎(1):データの分布とサンプリング
4. データ科学の基礎(2):確率・統計の諸定理と推定
5. 仮説検定(1):統計的仮説検定の基礎
6. 仮説検定(2):統計的仮説検定の種別と実践
7. 仮説検定(3):計数値についての統計的推測
8. データに基づく説明と予測(1):最小二乗法と線形回帰
9. データに基づく説明と予測(2):最尤法と一般化線形モデル
10.機械学習(1):主成分分析
11.機械学習(2):クラスター分析
12.機械学習(3):サポートベクトルマシン
13.人工知能(1):パーセプトロン、ニューラルネットワーク
14.人工知能(2):ディープラーニング
15.課題演習

1. Introduction: Applications of Data Science and AI
2. Organizing and Visualizing Data in R
3. Data Science Basics (1): Probability Distribution/Sampling
4. Data Science Basics (2): Theorems of Probabilities and Statistics/Statistical Inference
5. Statistical Hypothesis Testing (1): Basics of Hypothesis Testing
6. Statistical Hypothesis Testing (2): Variations and Practice of Hypothesis Testing
7. Statistical Hypothesis Testing (3): Hypothesis Testing about Discrete Variables
8. Data-driven Explanation and Prediction (1): Least Squares and Linear Regression
9. Data-driven Explanation and Prediction (2): Maximum Likelihood Method and Generalized Linear Model
10.Machine Learning (1): Principal Component Analysis
11.Machine Learning (2): Cluster Analysis
12.Machine Learning (3): Support Vector Machine
13.Artificial Intelligence (1): Perceptron and Neural network
14.Artificial Intelligence (2): Deep Learning
15.Exercise

成績評価方法/Evaluation Method

授業への参加状況および演習課題の提出(70点)と最終課題に対するレポート(30点)の合計100点を基礎に評価される.

Students course scores are based on an assignment in every class (70% in total) and final report (30%).

教科書および参考書/Textbook and References

  • データの分析と知識発見, 秋光淳生, 放送大学教育出版 (2020) ISBN/ISSN: ISBN9784595322136

関連URL/URL

以下は文部科学省による「数理・データサイエンス・AI教育の全国展開」事業に伴って組織された「数理データサイエンス教育強化拠点コンソーシアム」が提供している自習用教材である。適宜参照のこと。
The following are self-study materials provided by the Consortium for Strengthening Mathematical Data Science Education, which was organized as part of the "Nationwide Development of Mathematical Data Science and AI Education" project by the Ministry of Education, Culture, Sports, Science and Technology. Please refer to them as appropriate.
http://www.mi.u-tokyo.ac.jp/consortium/e-learning.html

授業時間外学修/Preparation and Review

予習、復習課題をそれぞれ設定するため、授業での指示を十分に確認すること。
各回の予習には60~90分、復習には90~120分かかると想定される。

Please check the instructions given in class carefully, as there will be preparatory and review tasks respectively.
It is expected that each lesson will take 60-90 minutes for preparation and 90-120 minutes for review.

実務・実践的授業/Practicalbusiness※○は、実務・実践的授業であることを示す。/Note:"○"Indicatesthe practicalbusiness

授業へのパソコン持ち込み【必要/不要】/Students must bring their own computers to class[Yes / No]

この授業では,手元に常にパソコンがありインターネットに接続されていることを前提とする。授業中にクラウドを用いた活動(共同編集作業やディスカッション)を実施する。

This class assumes that you have a computer at hand at all times and are connected to the Internet. Cloud-based activities (collaborative editing and discussion) will be conducted during the class.

その他/In Addition

○本授業は人文社会系学生を対象にした授業内容を扱います。理数系学生向けには三石大先生が担当する「データ科学・AI概要」が並列開講されていますので、そちらの受講を検討するようにしてください。

○This course is designed for humanities and social sciences students. For science and mathematics students, please consider taking "Data Science and AI Overview" taught by Prof.Mitsuishi and Prof.Oyama, which is offered in parallel.

 これと関連したシラバス 学務情報システムで確認
このシラバスを共有