hyperparameter tuning

kfold = skm.KFold(5, 
                  random_state=0,
                  shuffle=True)
grid = skm.GridSearchCV(svm_linear,
                        {'C':[0.001,0.01,0.1,1,5,10,100]},
                        refit=True,
                        cv=kfold,
                        scoring='accuracy')
grid.fit(X, y)
grid.best_params_

{'C': 1}

printing results

grid.cv_results_[('mean_test_score')]

array([0.46, 0.46, 0.72, 0.74, 0.74, 0.74, 0.74])

generating testing sample

X_test = rng.standard_normal((20, 2))
y_test = np.array([-1]*10+[1]*10)
X_test[y_test==1] += 1

predicting

best_ = grid.best_estimator_
y_test_hat = best_.predict(X_test)
confusion_table(y_test_hat, y_test)

Truth	-1	1
Predicted
-1	8	4
1	2	6

name	function
Linear kernel
Polynomial kernel
Radial kernel
Gaussian kernel
Laplacian kernel
Sigmoid kernel

	SVC	SVM
inner products / kernels
functional form
functional form

	sometimes data are non-seperateble
	sometimes the maximal margin classifier is very sensitive to noisy data

L03 Classification

We will learn

Introduction

Examples of classification problems

Regression is not appropriate for classification tasks

The default dataset

Losgistic regression

The logistic model

Estimation and Predictions

Multiple logistic regression

Multinomial logistic regression

Coding: Logistic Regression

Generative models for classification

Linear discriminant analysis (LDA) for

An Example

LDA for

Coding: LDA

Quadratic discriminant analysis (QDA)

Coding: QDA

Naive Bayes

Estimating the one-dimensional density function using training data

Coding: QDA

Generalized additive models

Support vector machine

Maximal Margin Classifier

Hyperplane

Classification Using a Separating Hyperplane

Separating Hyperplanes

The Maximal Margin Classifier

The Non-separable Case & Noisy Data

Support Vector Classifiers

Parameter

Coding: SVC

Support Vector Machines

Nonlinear Classifiers Utilizing Polynomial Features

Kernel Functions

SVC vs. SVM

Coding: SVM

SVMs with More than Two Classes

Coding: SVM with Multiple Classes

Relationship to Logistic Regression