دوره تخصصی فراگیری علم داده(Data Science) با پایتون
سرفصلهای آموزش دوره تخصصی پایتون شامل علم داده ، داده کاوی، یادگیری ماشین
الف. مقدمه و آشنایی با داده کاوی
مقدمات و مفاهیم داده کاوی یادگیری ماشین
طراحی مسائل و مجموعه دادههایی جهت شناخت داده، علم داده و کاربردهای آن
آشنایی عمومی و مقدماتی با کتابخانههای موجود در زبان پایتون جهت انجام عملیات داده کاوی مثل Numpy، Pandas، sklearn، Matplotlib، Scikit Learn، Tensorflow، Py Torch و …
ب. نصب و پیاده سازی محیطهای عملیاتی
آشنایی با ورژنهای مختلف پایتون و نصب پایتون همراه با نصب پکیج آناکوندا و آشنایی با پکیجهای مهم
نصب و ایجاد محیط اولیه در Visual Studio Code و ایجاد یک برنامه پایتون
نصب و ایجاد محیط اولیه در Jupyter و ساخت یک دفترچه پایتون
آشنایی با رایانش ابری و آموزش کار با محیط کولب گوگل و اجرای برنامهها بر روی سرورهای گوگل
ت. معرفی روشهای وارد کردن دیتاست ها و مراجع جمع آوری دادهها
وارد کردن انواع دیتاست (CSV, URL، Excel، Text، SAS، STATA)
بررسی چند مثال
ث. مفاهیم پایه دادهها و ریاضی و آماری
داده و درک مفهوم ویژگی(Feature)، بعد(Dimension)، ماتریس (Matrix) و درک مفهوم تنسور (Tensor) و کاربرد آن در داده کاوی
آشنایی و کار با کتابخانه Numpy و Scipy برای انجام عملیات آماری
بارگذاری دادهها و تعامل با دادهها با استفاده از کتابخانه Pandas
ج. پیش پردازش دیتا (data preprocessing)
پیش پردازش اولیه داده
پر کردن مقادیر(Null) کمی، کیفی اسمی و ترتیبی
فیلتر کردن رکورد یا وِیژگی
مدیریت دیتای کیفی (اسمی و ترتیبی)
تولید ویژگی (feature generation)
ساخت Dummy برای ویژگیهای کیفی
(Reclassification) طبقه بندی مجدد مقادیر
(Join) اتصال
(Append)
بخش بندی دیتا (Train_Test_Split)
نرمالسازی
استاندارد سازی
انتخاب ویژگی
انتخاب ویژگیهای مهم برای داده کاوی با جنگل تصادفی
انتخاب ویژگیهای مهم برای داده کاوی با الگوریتم KNN
کاهش ابعاد
ح. مصور سازی و نمایش دادهها (Data visualization) با پایتون
لایبرری MATPLOTLIB
لایبرری seaborn
لایبرری pandas
آشنایی با نمودارهای مختلف(Bar، Line، Pie، Histogram، نقشه حرارتی(Heat map)،Flow و …) وکاربرد هریک از آنها
نحوه ایجاد نمودارها
خ. پیاده سازی الگوریتمهای مختلف یادگیری ماشینی(Machine learning) طبقه بندی
آشنایی با نمونه دادههای طبقه بندی و کاربردهای آن
بررسی چند دیتاست به عنوان نمونههای ساده و کاربردی
بررسی دیتاست IRIS (تشخیص گلهای زنبق از روی ویژگیها) و پروژه های آن
MNISTتشخیص تصاویر دست نوشته
قیمت گذاری هوشمند خانه
1. آشنایی و پیاده سازی طبقه بندی با الگوریتم k نزدیکترین همسایه(KNN) در پایتون
2. آشنایی و پیاده سازی طبقه بندی با الگوریتم ماشین بردار پشتیبان (SVM)و آشنایی با انواع مختلف پیاده سازی و پارامترهای آن در پایتون
3. بررسی درختهای تصمیم (Decision Trees)و پیاده سازی آنها در حل مسائل طبقه بندی در پایتون
د. پیاده سازی الگوریتمهای مختلف یادگیری ماشینی(Machine learning) رگرسیون
رگرسیون خطی و …
پروژه تخمین salary با رگرسیون خطی
پروژه پیش بینی آب و هوا
ذ. Ensemble
1. آشنایی و پیاده سازی طبقه بندی با الگوریتمهای RandomForest، AdaBoost و… در پایتون
2. آشنایی با الگوریتمهای XGBoost و CatBoost و کتابخانههای XGBoost و CatBoost
ر. سری زمانی
ز. لزوم ارزیابی مدل و آشنایی با معیارهای مختلف ارزیابی مدلها
طبقه بندی
Accuracy
Precision
Recall
F1
ROI AUC
و …
رگرسیون
MAE
MSE
RMSE
…
س. خوشه بندی و الگوریتمهای مختلف آن
آشنایی با نمونه دادههای خوشه بندی
حل مثال کاربردی آن
نقد و بررسیها
هنوز بررسیای ثبت نشده است.
اولین کسی باشید که دیدگاهی می نویسد “دوره تخصصی فراگیری علم داده(Data Science) با پایتون” لغو پاسخ
نقد و بررسیها
هنوز بررسیای ثبت نشده است.