دوره تخصصی فراگیری علم داده(Data Science) با پایتون

سرفصل‌های آموزش دوره تخصصی پایتون شامل علم داده ، داده کاوی، یادگیری ماشین

الف.  مقدمه و آشنایی با داده کاوی

  • مقدمات و مفاهیم داده کاوی یادگیری ماشین
  • طراحی مسائل و مجموعه داده‌هایی جهت شناخت داده، علم داده و کاربردهای آن
  • آشنایی عمومی و مقدماتی با کتابخانه‌های موجود در زبان پایتون جهت انجام عملیات داده کاوی مثل Numpy، Pandas، sklearn، Matplotlib، Scikit Learn، Tensorflow، Py Torch و …

ب‌.    نصب و پیاده سازی محیط‌های عملیاتی

  • آشنایی با ورژن‌های مختلف پایتون و نصب پایتون همراه با نصب پکیج آناکوندا و آشنایی با پکیج‌های مهم
  • نصب و ایجاد محیط اولیه در Visual Studio Code و ایجاد یک برنامه پایتون
  • نصب و ایجاد محیط اولیه در Jupyter و ساخت یک دفترچه پایتون
  • آشنایی با رایانش ابری و آموزش کار با محیط کولب گوگل و اجرای برنامه‌ها بر روی سرورهای گوگل

ت‌.   معرفی روش‌های وارد کردن دیتاست ها و مراجع جمع آوری داده‌ها

  • وارد کردن انواع دیتاست (CSV, URL، Excel، Text، SAS، STATA)
  • بررسی چند مثال

ث‌.   مفاهیم پایه داده‌ها و ریاضی و آماری

  • داده و درک مفهوم ویژگی(Feature)، بعد(Dimension)، ماتریس (Matrix) و درک مفهوم تنسور (Tensor) و کاربرد آن در داده کاوی
  • آشنایی و کار با کتابخانه Numpy و Scipy برای انجام عملیات آماری
  • بارگذاری داده‌ها و تعامل با داده‌ها با استفاده از کتابخانه Pandas

ج‌.    پیش پردازش دیتا (data preprocessing)

  • پیش پردازش اولیه داده
  • پر کردن مقادیر(Null) کمی، کیفی اسمی و ترتیبی
  • فیلتر کردن رکورد یا وِیژگی
  • مدیریت دیتای کیفی (اسمی و ترتیبی)
  • تولید ویژگی (feature generation)
  • ساخت Dummy برای ویژگی‌های کیفی
  • (Reclassification) طبقه بندی مجدد مقادیر
  • (Join) اتصال
  • (Append)
  • بخش بندی دیتا (Train_Test_Split)
  • نرمالسازی
  • استاندارد سازی
  • انتخاب ویژگی
  • انتخاب ویژگی‌های مهم برای داده کاوی با جنگل تصادفی
  • انتخاب ویژگی‌های مهم برای داده کاوی با الگوریتم KNN
  • کاهش ابعاد

ح‌.    مصور سازی و نمایش داده‌ها (Data visualization) با پایتون

  • لایبرری MATPLOTLIB
  • لایبرری seaborn
  • لایبرری pandas
  • آشنایی با نمودارهای مختلف(Bar، Line، Pie، Histogram، نقشه حرارتی(Heat map)،Flow و …) وکاربرد هریک از آن‌ها
  • نحوه ایجاد نمودارها

خ‌.      پیاده سازی الگوریتم‌های مختلف یادگیری ماشینی(Machine learning) طبقه بندی

  • آشنایی با نمونه داده‌های طبقه بندی و کاربردهای آن
  • بررسی چند دیتاست به عنوان نمونه‌های ساده و کاربردی
    1. بررسی دیتاست IRIS (تشخیص گل‌های زنبق از روی ویژگی‌ها) و پروژه های آن
    2. MNISTتشخیص تصاویر دست نوشته
    3. قیمت گذاری هوشمند خانه
1.  آشنایی و پیاده سازی طبقه بندی با الگوریتم k نزدیکترین همسایه(KNN) در پایتون
2.  آشنایی و پیاده سازی طبقه بندی با الگوریتم ماشین بردار پشتیبان (SVM)و آشنایی با انواع مختلف پیاده سازی و پارامترهای آن در پایتون
3.  بررسی درخت‌های تصمیم (Decision Trees)و پیاده سازی آن‌ها در حل مسائل طبقه بندی در پایتون
د‌.       پیاده سازی الگوریتم‌های مختلف یادگیری ماشینی(Machine learning) رگرسیون
  • رگرسیون خطی و …
  • پروژه تخمین salary با رگرسیون خطی
  • پروژه پیش بینی آب و هوا

ذ‌.     Ensemble

1.  آشنایی و پیاده سازی طبقه بندی با الگوریتم‌های  RandomForest، AdaBoost و… در پایتون
2.  آشنایی با الگوریتم‌های XGBoost و CatBoost و کتابخانه‌های XGBoost و CatBoost

ر‌.      سری زمانی

ز‌.      لزوم ارزیابی مدل و آشنایی با معیارهای مختلف ارزیابی مدل‌ها

  • طبقه بندی
    1. Accuracy
    2. Precision
    3. Recall
    4. F1
    5. ROI AUC
    6. و …
  • رگرسیون
    1. MAE
    2. MSE
    3. RMSE

س‌. خوشه بندی و الگوریتم‌های مختلف آن

  • آشنایی با نمونه داده‌های خوشه بندی
  • حل مثال کاربردی آن

نقد و بررسی‌ها

هنوز بررسی‌ای ثبت نشده است.

اولین کسی باشید که دیدگاهی می نویسد “دوره تخصصی فراگیری علم داده(Data Science) با پایتون”

نشانی ایمیل شما منتشر نخواهد شد. بخش‌های موردنیاز علامت‌گذاری شده‌اند *

10 − 9 =

محصولات مرتبط

ارتباط با مدیریت