Python for Citizen Data Scientist Archives

Machine Learning for Beginners in Python: What is Effect Of Alpha On Lasso Regression

By SETScholars Team on Monday, May 24, 2021

Effect Of Alpha On Lasso Regression Often we want conduct a process called regularization, wherein we penalize the number of features in a model in order to only keep the most important features. This can be particularly important when you have a dataset with 100,000+ features. Lasso regression is a common modeling technique to do regularization. The …

Boston House Price Dataset - Machine Learning Regression in Python Data Science Python Machine Learning

Machine Learning for Beginners in Python: How to Add Interaction Terms in Linear Regression

By SETScholars Team on Monday, May 24, 2021

Adding Interaction Terms Preliminaries /* Load libraries */ from sklearn.linear_model import LinearRegression from sklearn.datasets import load_boston from sklearn.preprocessing import PolynomialFeatures import warnings /* Suppress Warning */ warnings.filterwarnings(action=”ignore”, module=”scipy”, message=”^internal gelsd”) Load Boston Housing Dataset /* Load the data with only two features */ boston = load_boston() X = boston.data[:,0:2] y = boston.target Add Interaction Term …

Applied Data Science Explained Data Analytics Data Science IRIS Dataset - Machine Learning Classification in Python Python for Citizen Data Scientist Python Machine Learning

Machine Learning for Beginners in Python: Hyperparameter Tuning Using Random Search

By SETScholars Team on Monday, May 24, 2021

Hyperparameter Tuning Using Random Search Preliminaries /* Load libraries */ from scipy.stats import uniform from sklearn import linear_model, datasets from sklearn.model_selection import RandomizedSearchCV Load Iris Dataset /* Load data */ iris = datasets.load_iris() X = iris.data y = iris.target Create Logistic Regression /* Create logistic regression */ logistic = linear_model.LogisticRegression() Create Hyperparameter Search Space /* …

Data Science Python for Citizen Data Scientist Python Machine Learning

Machine Learning for Beginners in Python: How to Find Best Preprocessing Steps During Model Selection

By SETScholars Team on Monday, May 24, 2021

Find Best Preprocessing Steps During Model Selection We have to be careful to properly handle preprocessing when conducting model selection. First, GridSearchCV uses cross-validation to determine which model has the highest performance. However, in cross-validation we are in effect pretending that the fold held out as the test set is not seen, and thus not part of …

Data Science Python for Business Analyst Python for Citizen Data Scientist Python Machine Learning

Machine Learning for Beginners in Python: How to Calculate Recall

By SETScholars Team on Monday, May 24, 2021

Recall Preliminaries /* Load libraries */ from sklearn.model_selection import cross_val_score from sklearn.linear_model import LogisticRegression from sklearn.datasets import make_classification Generate Features And Target Data /* Generate features matrix and target vector */ X, y = make_classification(n_samples = 10000, n_features = 3, n_informative = 3, n_redundant = 0, n_classes = 2, random_state = 1) Create Logistic Regression …

Data Science Python Example for Beginners Python for Citizen Data Scientist Python Machine Learning

Machine Learning for Beginners in Python: How to Plot The Validation Curve

By SETScholars Team on Monday, May 24, 2021

Plot The Validation Curve Preliminaries /* Load libraries */ import matplotlib.pyplot as plt import numpy as np from sklearn.datasets import load_digits from sklearn.ensemble import RandomForestClassifier from sklearn.model_selection import validation_curve Load Digits Dataset /* Load data */ digits = load_digits() /* Create feature matrix and target vector */ X, y = digits.data, digits.target Plot Validation …

Data Analytics Data Science Python for Citizen Data Scientist Python Machine Learning

Machine Learning for Beginners in Python: How to Plot The Receiving Operating Characteristic Curve

By SETScholars Team on Monday, May 24, 2021

Plot The Receiving Operating Characteristic Curve Preliminaries /* Load libraries */ from sklearn.datasets import make_classification from sklearn.linear_model import LogisticRegression from sklearn.metrics import roc_curve, roc_auc_score from sklearn.model_selection import train_test_split import matplotlib.pyplot as plt Generate Features And Target /* Create feature matrix and target vector */ X, y = make_classification(n_samples=10000, n_features=10, n_classes=2, n_informative=3, random_state=3) Split Data Intro …

Data Science Python for Citizen Data Scientist Python Machine Learning

Machine Learning for Beginners in Python: How to Plot The Learning Curve

By SETScholars Team on Monday, May 24, 2021

Plot The Learning Curve Preliminaries /* Load libraries */ import numpy as np import matplotlib.pyplot as plt from sklearn.ensemble import RandomForestClassifier from sklearn.datasets import load_digits from sklearn.model_selection import learning_curve Load Digits Dataset /* Load data */ digits = load_digits() /* Create feature matrix and target vector */ X, y = digits.data, digits.target Plot Learning …

Classification Python Example for Beginners Python for Data Analyst Python Machine Learning

Machine Learning for Beginners in Python: How to do Nested Cross Validation

By SETScholars Team on Monday, May 24, 2021

Nested Cross Validation Often we want to tune the parameters of a model (for example, C in a support vector machine). That is, we want to find the value of a parameter that minimizes our loss function. The best way to do this is cross validation: Set the parameter you want to tune to some value. Split …

Applied Data Science Explained Classification Data Analytics Data Science IRIS Dataset - Machine Learning Classification in Python Python for Citizen Data Scientist Python Machine Learning

Machine Learning for Beginners in Python: How to Generate Text Reports On Performance

By SETScholars Team on Monday, May 24, 2021

Generate Text Reports On Performance Preliminaries /* Load libraries /* from sklearn import datasets from sklearn.linear_model import LogisticRegression from sklearn.model_selection import train_test_split from sklearn.metrics import classification_report Load Iris Flower Data /* Load data */ iris = datasets.load_iris() /* Create feature matrix */ X = iris.data /* Create target vector */ y = iris.target /* Create …

M	T	W	T	F	S	S
1	2	3	4	5	6	7
8	9	10	11	12	13	14
15	16	17	18	19	20	21
22	23	24	25	26	27	28
29	30

Towards Advanced Analytics Specialist & Analytics Engineer

Tag Archives: Python for Citizen Data Scientist

Machine Learning for Beginners in Python: What is Effect Of Alpha On Lasso Regression

Machine Learning for Beginners in Python: How to Add Interaction Terms in Linear Regression

Machine Learning for Beginners in Python: Hyperparameter Tuning Using Random Search

Machine Learning for Beginners in Python: How to Find Best Preprocessing Steps During Model Selection

Machine Learning for Beginners in Python: How to Calculate Recall

Machine Learning for Beginners in Python: How to Plot The Validation Curve

Machine Learning for Beginners in Python: How to Plot The Receiving Operating Characteristic Curve

Machine Learning for Beginners in Python: How to Plot The Learning Curve

Machine Learning for Beginners in Python: How to do Nested Cross Validation

Machine Learning for Beginners in Python: How to Generate Text Reports On Performance