分類 | セミナー

  • Information

リカレント教育:データサイエンス オンラインコース
1対1 同時双方向型
Decision-Making Using Data

★ Data Science 初級オンラインコース
★ Data Science 中級オンラインコース
★ Data Science 上級オンラインコース



● Michaelmas Term 開講コース(10月開始)お申込受付を〆切りました。

● Lent Term 開講コース(1月開始)お申込受付を〆切りました。

● Easter Term 開講コース(4月開始)申込受付中!(申込期限:2024年2月28日)
WEB 申込:https://icc-edu.com/entryform2/form.php よりお申込みください。

● Summer Term 開講コース(7月開始)申込受付中!(申込期限:2024年5月31日)
WEB 申込:https://icc-edu.com/entryform2/form.php よりお申込みください。



WEB 申込:https://icc-edu.com/entryform2/form.php



◆ 本コースは、オックスフォード大学/ケンブリッジ大学の学位取得者であるテューターによる1対1の同時双方向型オンラインコースです。
◆ データを活用するために必要なツールの学習、スキルの習得に努めます。

Staff/スタッフ

    • 責任者
    赤石 眞澄
    ICCインターナショナル・コミュニケーションズ・カウンシル
    プログラム ディレクター
    経歴

    在アメリカ合衆国日本国大使館企画部に勤務

    オックスフォード大学専任講師

    ケンブリッジ大学専任講師

    ロンドン大学 SOAS 専任講師

    ブリティッシュ・コロンビア大学専任講師

    ICC インターナショナル・コミュニケーションズ・カウンシル プログラムディレクター

     

     

Competency/コンピテンシー

  • リテラシー
  • 論理的思考力
  • 課題発見力
  • 問題解決力
  • 想像力
  • 実践力
  • 状況把握力
  • コミュニケーション力
  • マネジメント力
  • リーダーシップ力
  • 主体性
  • 柔軟性

 

近年、社会や産業の活力を左右する要因の一つとして、データサイエンスや人工知能(AI)への理解や知識が「読み・書き・そろばん」的な素養として重視されるようになってきました。将来社会で活躍するためには、英語に加えてデータサイエンスの理解や知識を身につけておくことが重要になってきています。

データを用いて新たな科学的および社会に有益な知見を引き出し、データにもとづいて合理的な判断を行い、的確な意思決定を導き、情報科学、統計学などを横断的に取り扱い、分野の専門知識、プログラミングのスキル、数学および統計の知識、データ分析など複数分野を組み合わせて、データから意味のある、有意義な本質を見抜くために必要な方法論について学ぶことが重要になってきています。

政府がまとめた「AI戦略」では、すべての大学・高専生が初級レベルのデータサイエンスやAIを習得し、専門分野で応用できる力を身につけるという目標を掲げています。「情報I」は、データサイエンス・AIの基礎となる理数素養や知識を身につける役割を担います。

データサイエンスは、プログラミングや統計、数学などの知識や技能を用いながら有意義なデータを引き出すことを目指す研究分野で、実践的な学びを経験します。

データサイエンスとは、Big data and Big issues, Data mining, Crypto currencies, Data visualization, GDPR, Digital Encryption, Artificial Intelligence 等を活用し、データを用いて新たな科学および社会に有益な知見を引き出そうとするアプローチ、データにもとづいて合理的な判断を行い、的確な意思決定を導く手法を意味します。情報科学、統計学などを横断的に取り扱い、分野の専門知識、プログラミングのスキル、数学および統計の知識、データ分析など複数分野を組み合わせて、意味のある、有意義な本質を見抜くために必要な方法論であり、グローバルリーダーとなる資質の一つです。

世の中にあふれる膨大なデータの解析や分析を通して、社会や企業の課題を見出したり、解決方法を提案したり、情報通信や製造業、マスコミなど幅広い業種で活躍する「データサイエンティスト」の育成を目指します。

Rabbit-duck illusion の画像について、ウサギか、アヒルか、データを使って証明してみましょう!

データサイエンスからデータエンジニアリングへと学習を進めます。

In this 10 week course, students would learn about commonly used practices by data science professionals. Below is an outline of what students could expect to cover during each week. As this is a highly condensed course, students may also be asked to do extra reading outside of their tutorial sessions in order to practise what they have learnt, and to gain a firm understanding of key concepts.

Week 1

  • What does a data scientist do?
    • Typical workflow patterns
    • Tech and software used
    • Approach to business problems
  • What is machine learning?
    • What is a model?
    • Supervised vs Unsupervised ML
    • Regression vs Classification

 

What the typical workflow of a data scientist is, the software and technologies used, including common approaches to business problems. 

What machine learning is and an intuitive understanding of what “a model” represents. This will follow with examples of supervised and unsupervised learning, and understanding the differences and use cases for regression and classification models. 

 

Week 2

  • Variables:
    • independent, dependent
    • continuous vs categorical
  • Common statistics:
    • mean, median, mode (when to use which?)
    • variance, standard deviation
    • covariance, correlation

 

What variables are; the difference between independent and dependent variables; continuous, categorical and ordinal variables. 

An intuitive understanding of common statistics, such as mean, median, mode (and when to use which), variance, standard deviation, covariance and correlation. 

 

Week 3

  • Command line interface (intro)
  • Github (intro)
  • Jupyter notebooks (intro and orientation)
  • Python
    • Datatypes: int, float, dict, list, str, Bool, tuple, set
    • Loops (for, while, list comprehensions) and if/elif/else statements

 

An introduction to the common tech stack used by data scientists, including an introduction to the command line interface, Github version control, and Jupyter notebooks. 

An introduction to Python, including the datatypes available (eg int, float, dict, list, str, Booleans, tuples and sets), use of conditional statements (if, elif, else) and iterating using loops (for, while, and list comprehensions). 

 

Week 4

  • Pandas
    • Reading in datasets
    • EDA: .describe(), .shape()
    • Data cleaning techniques
    • Groupby, value_counts
  • Data Visualization
    • Seaborn gallery
    • Matplotlib

 

  • Intro to personal project: Ames Housing Dataset

 

Common data wrangling practices using the Pandas library (reading in data sets, EDA techniques, and data cleaning). 

Common data visualization libraries such as Matplotlib and Seaborn. 

Introduction to the personal project (this is a machine learning project to be completed by the individual and to be presented during their session in week 10 for feedback from the tutor). 

 

Week 5

  • Intro to scikit-learn
  • Regression
    • Simple linear regression
    • Interpretation of linear regression results (coefficients: gradients, intercept)
    • Multivariate regression
      • Standardisation: StandardScaler(), MinMaxScaler()
    • Performance metrics: OLS, RSS, TSS, R^2

 

Introduction to scikit-learn and some of the regression models available. 

Fitting of regression models and interpretation of their coefficient results. 

Common data pre-processing techniques such as standardisation and why this is important. 

Evaluation metrics of regression models. 

 

Week 6

  • Generalization
    • What is overfitting?
    • Bias-Variance tradeoff
    • Regularization: Ridge, Lasso, ElasticNet
    • K-fold Cross validation

 

The concept of generalization, including an understanding of what overfitting is, and the Bias-Variance tradeoff. Regularization techniques in order to address overfitting, and evaluation metrics such as cross validation. 

 

Week 7

  • Classification:
    • Logistic regression
    • kNN
    • Evaluation metrics
    • Grid Search
    • Performance metrics: confusion matrix, TN, TP, FN, FP, accuracy, precision, recall
      • The problem with “accuracy” for imbalanced datasets

 

Fitting of common models for classification problems, including their evaluation metrics, use of Grid Search to computationally iterate on “best” parameters. Use of performance metrics such as the confusion matrix. 

Exploring the meaning of constituent parts of the confusion matrix (true positives, true negatives, false positives, false negatives) and how to calculate accuracy, precision and recall. 

Considerations that need to be made when handling highly imbalanced datasets. 

 

Week 8

  • Databases: SQL

 

  • Ensemble models:
    • Decision Trees
    • Bootstrap Aggregating (Bagging)
    • Random Forest
    • Boosting

 

An intuitive understanding of what Ensemble models are and why performance is often improved; this includes decision trees, bootstrap aggregating, random forest and boosting models. 

 

Week 9

  • Unsupervised learning:
    • Clustering, k-means
    • DBSCAN

 

  • Time Series Analysis
    • Autocorrelation
    • ARIMA, SARIMA

 

Introduction into unsupervised learning such as clustering techniques. 

Time series analysis, such as ARIMA models. 

 

Week 10

  • Presentation of personal project: Regression project on Ames Housing Dataset

 

Presentation of personal project, including feedback and further discussion with the tutor. 

 

Tech Requirements:

  • Python
  • Jupyter notebooks, Anaconda
  • Pandas

 

Other topics:

Probability distributions

  • Probability distribution function
  • Cumulative distribution function
  • Normal distribution

 

Central limit theorem

 

 

 

 

英語運用能力比較スコア表

一般・社会人対象:Data Science オンラインコース 日程 コースコード  ☜こちらをクリックしてください。

Data Science オンライン初級コース

 

Data Science オンライン中級コース

 

Data Science オンライン上級コース

Information/その他の情報

受講要件

1対1 個人レッスン(同時双方向型)

申込:1名から先着順に受け付け、テューターをご案内します。

申込方法:https://icc-edu.com/entryform2/form.php

 

コース費用:

◆ Data Science オンライン初級コース

1対1レッスン(同時双方向型)の場合:3,000 英ポンド/1名(申込登録費 1,000英ポンドを含む)

1対2レッスン(同時双方向型)の場合:2,800 英ポンド/1名(申込登録費 1,000英ポンドを含む)※2名様でお申込みください。

1対3レッスン(同時双方向型)の場合:2,600 英ポンド/1名(申込登録費 1,000英ポンドを含む)※3名様でお申込みください。

 

◆ Data Science オンライン中級コース

1対1レッスン(同時双方向型)の場合:4,000 英ポンド(申込登録費 1,000英ポンドを含む)

1対2レッスン(同時双方向型)の場合:3,800 英ポンド/1名(申込登録費 1,000英ポンドを含む)※2名様でお申込みください。

1対3レッスン(同時双方向型)の場合:3,600 英ポンド/1名(申込登録費 1,000英ポンドを含む)※3名様でお申込みください。

 

◆ Data Science オンライン上級コース

1対1レッスン(同時双方向型)の場合:5,000 英ポンド(申込登録費 1,000英ポンドを含む)

1対2レッスン(同時双方向型)の場合:4,800 英ポンド/1名(申込登録費 1,000英ポンドを含む)※2名様でお申込みください。

1対3レッスン(同時双方向型)の場合:4,600 英ポンド/1名(申込登録費 1,000英ポンドを含む)※3名様でお申込みください。

 

 

コース費用に含まれるもの:Oxbridge テューターによる同時双方向型オンラインレッスン(10週間:1時間/1週間)

∗ 受講生の英語要件推奨値:CEFR B2、 TOEFL iBT 61 – 99、 TOEFL CBT 173 – 247、 TOEIC 550 – 870 以上(下記の英語検定スコア表を参考にしてください。)(英語要件証明書の提出は不要。)

∗ English Proficiency Conversion(マウスをあてて、クリックしてください。)

★ 使い慣れたタブレット端末、またはノートパソコンおよびヘッドホン・イヤホンをご準備ください。

★ Wi-fi のある環境のもとで、Webinar が出来ることを確認してください。

 

1対1の同時双方向型 個別オンラインレッスン PBL(Project-based learning)テュートリアル教育

1対1の個別レッスンのコースのテューターは、それぞれG5 Universities (オックスフォード大学、ケンブリッジ大学、ロンドン大学(London School of Economics、Imperial College London、King’s College Londonなど)の大学学位取得者で教授法の豊かな経験をもっています。主にオックスフォード大学とケンブリッジ大学の PBL(Project-based learning)テュートリアル教育、課題に立脚しながら学修を進める方法、課題に基づく学修アプローチを実践します。

評価方法

プレゼンテーション

コース参加

教材・参考文献

   

 

Contact/お問合せ先

japanoffice@internationalcommunicationscouncil.com

https://www.jv-campus.org/find-your-study/study-abroad-from-japan/

ICCアジア支部
〒651-1231 兵庫県神戸市北区青葉台16-1

TEL: +81 50-3821-2215

Related Contents/関連コンテンツ

コンテンツ

2/25(金) 留学生ヘルプデスク主催イベント「日本語で話そう!」
  • Information
無料
On Air
[プログラム情報] Hokkaido Summer Institute
  • Information
有料
On Air
NanoLSI独自の世界最先端Bio-SPM技術を用いる共同研究プログラム
  • Information
無料
On Air
第2回UU-A連続シンポジウム「根寄生雑草:生物学と防除法」
  • Information
無料
On Air