import numpy as np
import pandas as pd
from matplotlib import pyplot as plt
import seaborn as sns

df=pd.read_csv('USA_Housing.csv')
df

df.info()

<class 'pandas.core.frame.DataFrame'>
RangeIndex: 5000 entries, 0 to 4999
Data columns (total 7 columns):
Avg. Area Income                5000 non-null float64
Avg. Area House Age             5000 non-null float64
Avg. Area Number of Rooms       5000 non-null float64
Avg. Area Number of Bedrooms    5000 non-null float64
Area Population                 5000 non-null float64
Price                           5000 non-null float64
Address                         5000 non-null object
dtypes: float64(6), object(1)
memory usage: 273.5+ KB

df.drop("Address",axis=1,inplace=True)

df.head()

#now we will find correlation between different columns
df.corr()

sns.heatmap(df.corr())

<matplotlib.axes._subplots.AxesSubplot at 0x2976190c898>

df.drop('Avg. Area Number of Bedrooms',axis=1,inplace=True)

df.head()

df.columns

Index(['Avg. Area Income', 'Avg. Area House Age', 'Avg. Area Number of Rooms',
       'Area Population', 'Price'],
      dtype='object')

x=df[['Avg. Area Income', 'Avg. Area House Age', 'Avg. Area Number of Rooms',
       'Area Population']]
y=df[['Price']]

x.head()
y.head()

from sklearn.model_selection import train_test_split

#train_test_split is a model for splitting

x_train,x_test,y_train,y_test=train_test_split(x,y,test_size=0.30,random_state=42)

#we need to divide the data in training and test.test_size=0.30 means how much data you want to keep in test environment
#. here it is 30%
#random_state=42 means it will pick same data again and again

x_train.info()

<class 'pandas.core.frame.DataFrame'>
Int64Index: 3500 entries, 1840 to 860
Data columns (total 4 columns):
Avg. Area Income             3500 non-null float64
Avg. Area House Age          3500 non-null float64
Avg. Area Number of Rooms    3500 non-null float64
Area Population              3500 non-null float64
dtypes: float64(4)
memory usage: 136.7 KB

y_train.info()

<class 'pandas.core.frame.DataFrame'>
Int64Index: 3500 entries, 1840 to 860
Data columns (total 1 columns):
Price    3500 non-null float64
dtypes: float64(1)
memory usage: 54.7 KB

y_train

x_train,x_test,y_train,y_test=train_test_split(x,y,test_size=0.30,random_state=42)

y_train

from sklearn.linear_model import LinearRegression

model=LinearRegression()

model.fit(x_train,y_train)

LinearRegression(copy_X=True, fit_intercept=True, n_jobs=None, normalize=False)

y_predict=model.predict(x_test)

y_predict

array([[1309493.18923727],
       [1238962.66596298],
       [1248121.55591489],
       ...,
       [1459381.97707876],
       [1482240.08195154],
       [1050989.28897342]])

model.coef_

array([[2.16341933e+01, 1.65621287e+05, 1.21162110e+05, 1.52136132e+01]])

model.intercept_

array([-2639242.60887411])

#Now we will Do Lgistic regression. It calculates Probability

 In [1]:

<class 'pandas.core.frame.DataFrame'>
RangeIndex: 891 entries, 0 to 890
Data columns (total 12 columns):
PassengerId    891 non-null int64
Survived       891 non-null int64
Pclass         891 non-null int64
Name           891 non-null object
Sex            891 non-null object
Age            714 non-null float64
SibSp          891 non-null int64
Parch          891 non-null int64
Ticket         891 non-null object
Fare           891 non-null float64
Cabin          204 non-null object
Embarked       889 non-null object
dtypes: float64(2), int64(5), object(5)
memory usage: 83.6+ KB

0    549
1    342
Name: Survived, dtype: int64

<matplotlib.axes._subplots.AxesSubplot at 0x19b36985630>

True     687
False    204
Name: Cabin, dtype: int64

<class 'pandas.core.frame.DataFrame'>
RangeIndex: 891 entries, 0 to 890
Data columns (total 8 columns):
Survived    891 non-null int64
Pclass      891 non-null int64
Sex         891 non-null object
Age         714 non-null float64
SibSp       891 non-null int64
Parch       891 non-null int64
Fare        891 non-null float64
Embarked    889 non-null object
dtypes: float64(2), int64(4), object(2)
memory usage: 55.8+ KB

<matplotlib.axes._subplots.AxesSubplot at 0x19b36d37828>

<matplotlib.axes._subplots.AxesSubplot at 0x19b36de9128>

<matplotlib.axes._subplots.AxesSubplot at 0x19b36e7b208>

29.69911764705882

38.233440860215055

import numpy as np
import pandas as pd
from matplotlib import pyplot as plt
import seaborn as sns

df=pd.read_csv('titanic_train.csv')

df

df.info()

<class 'pandas.core.frame.DataFrame'>
RangeIndex: 891 entries, 0 to 890
Data columns (total 12 columns):
PassengerId    891 non-null int64
Survived       891 non-null int64
Pclass         891 non-null int64
Name           891 non-null object
Sex            891 non-null object
Age            714 non-null float64
SibSp          891 non-null int64
Parch          891 non-null int64
Ticket         891 non-null object
Fare           891 non-null float64
Cabin          204 non-null object
Embarked       889 non-null object
dtypes: float64(2), int64(5), object(5)
memory usage: 83.6+ KB

#now we have to convert object into integer and fill non null values

df['Survived'].value_counts()

0    549
1    342
Name: Survived, dtype: int64

df.drop(['PassengerId','Name','Ticket'],axis=1,inplace=True)

df.head()

df.isnull()

sns.heatmap(df.isnull())

<matplotlib.axes._subplots.AxesSubplot at 0x19b36985630>

df['Cabin'].isnull().value_counts()

True     687
False    204
Name: Cabin, dtype: int64

#in the above command we find 687 values with no data

df.drop('Cabin',axis=1,inplace=True)

df.info()

<class 'pandas.core.frame.DataFrame'>
RangeIndex: 891 entries, 0 to 890
Data columns (total 8 columns):
Survived    891 non-null int64
Pclass      891 non-null int64
Sex         891 non-null object
Age         714 non-null float64
SibSp       891 non-null int64
Parch       891 non-null int64
Fare        891 non-null float64
Embarked    889 non-null object
dtypes: float64(2), int64(4), object(2)
memory usage: 55.8+ KB

# we will make boxplot so that we can determine ages

sns.boxplot(x='Sex',y='Age',data=df)

<matplotlib.axes._subplots.AxesSubplot at 0x19b36d37828>

sns.boxplot(x='Embarked',y='Age',data=df)

<matplotlib.axes._subplots.AxesSubplot at 0x19b36de9128>

sns.boxplot(x='Pclass',y='Age',data=df)

<matplotlib.axes._subplots.AxesSubplot at 0x19b36e7b208>

#now we will get the nmean of ages

df['Age'].mean()

29.69911764705882

df[df['Pclass']==1]['Age'].mean()

38.233440860215055

df[df['Pclass']==2]['Age'].mean()

29.87763005780347

df[df['Pclass']==3]['Age'].mean()

25.14061971830986

#now we will nthe null vales in Ages

def imput_age(cols):
    age=cols[0]
    pclass=cols[1]
    if(pd.isnull(age)):
        if(pclass==1):
            return 38
        elif(pclass==2):
            return 29
        else:
            return 25
    else:
        return age

df['Age']=df[['Age','Pclass']].apply(imput_age,axis=1)

sns.heatmap(df.isnull())

<matplotlib.axes._subplots.AxesSubplot at 0x19b36f331d0>

df.head()

#any data need to be in numbers so we convert embarked and sex into numbers

df['Sex'].value_counts()

male      577
female    314
Name: Sex, dtype: int64

#gender={'male':0,'female':1}
#df['Sex']=df['Sex'].map(gender)
gen={'male':0,'female':1}
df['Sex']=df['Sex'].map(gen)

df.head()

port={'S':0,'C':1,'Q':2}

df['Embarked']=df['Embarked'].map(port)

df.head()

df.columns

Index(['Survived', 'Pclass', 'Sex', 'Age', 'SibSp', 'Parch', 'Fare',
       'Embarked'],
      dtype='object')

x=df[['Pclass', 'Sex', 'Age', 'SibSp', 'Parch', 'Fare',
       ]]

x.head()

y=df['Survived']

y.head()

0    0
1    1
2    1
3    1
4    0
Name: Survived, dtype: int64

from sklearn.model_selection import train_test_split

x_train,x_test,y_train,y_test=train_test_split(x,y,test_size=0.30,random_state=101)

from sklearn.linear_model import LogisticRegression

model=LogisticRegression()

model.fit(x_train,y_train)

C:\Users\AbhishekSingh\Anaconda3\lib\site-packages\sklearn\linear_model\logistic.py:432: FutureWarning: Default solver will be changed to 'lbfgs' in 0.22. Specify a solver to silence this warning.
  FutureWarning)

LogisticRegression(C=1.0, class_weight=None, dual=False, fit_intercept=True,
                   intercept_scaling=1, l1_ratio=None, max_iter=100,
                   multi_class='warn', n_jobs=None, penalty='l2',
                   random_state=None, solver='warn', tol=0.0001, verbose=0,
                   warm_start=False)

y_predict=model.predict(x_test)

print(y_predict)

[0 1 0 0 0 0 0 0 1 1 0 0 1 0 0 0 0 0 0 1 0 0 1 1 0 0 0 0 0 0 1 1 1 0 0 1 0
 0 0 0 1 1 1 0 0 0 0 0 0 0 1 0 1 1 1 0 0 0 0 1 1 0 0 1 0 0 1 1 1 0 1 0 0 0
 1 1 0 0 0 0 0 1 0 0 1 0 0 0 0 1 0 1 1 1 1 1 1 0 0 0 0 1 0 0 1 1 1 1 1 0 0
 0 0 0 1 0 1 0 0 1 0 0 1 0 0 0 0 0 1 0 1 1 1 0 0 0 0 0 0 1 0 1 0 0 1 0 1 0
 0 0 1 1 0 0 0 0 1 0 1 1 0 0 1 0 1 1 0 1 0 0 1 0 0 1 0 0 1 0 0 0 0 0 1 1 1
 0 0 1 0 0 0 0 0 1 0 0 0 1 0 0 1 0 0 1 0 0 0 1 1 0 0 0 0 0 0 0 0 1 0 1 1 0
 0 0 0 0 0 0 0 0 0 0 1 1 1 0 0 1 1 0 1 1 0 0 1 1 0 0 1 1 0 1 0 0 0 0 0 0 1
 0 0 1 0 0 1 0 0 1]

from sklearn import metrics

metrics.accuracy_score(y_test,y_predict)

0.7723880597014925

from sklearn.metrics import confusion_matrix

confusion_matrix(y_test,y_predict)

array([[133,  21],
       [ 40,  74]], dtype=int64)

	Avg. Area Income	Avg. Area House Age	Avg. Area Number of Rooms	Avg. Area Number of Bedrooms	Area Population	Price	Address
0	79545.45857	5.682861	7.009188	4.09	23086.80050	1.059034e+06	208 Michael Ferry Apt. 674\nLaurabury, NE 3701...
1	79248.64245	6.002900	6.730821	3.09	40173.07217	1.505891e+06	188 Johnson Views Suite 079\nLake Kathleen, CA...
2	61287.06718	5.865890	8.512727	5.13	36882.15940	1.058988e+06	9127 Elizabeth Stravenue\nDanieltown, WI 06482...
3	63345.24005	7.188236	5.586729	3.26	34310.24283	1.260617e+06	USS Barnett\nFPO AP 44820
4	59982.19723	5.040555	7.839388	4.23	26354.10947	6.309435e+05	USNS Raymond\nFPO AE 09386
5	80175.75416	4.988408	6.104512	4.04	26748.42842	1.068138e+06	06039 Jennifer Islands Apt. 443\nTracyport, KS...
6	64698.46343	6.025336	8.147760	3.41	60828.24909	1.502056e+06	4759 Daniel Shoals Suite 442\nNguyenburgh, CO ...
7	78394.33928	6.989780	6.620478	2.42	36516.35897	1.573937e+06	972 Joyce Viaduct\nLake William, TN 17778-6483
8	59927.66081	5.362126	6.393121	2.30	29387.39600	7.988695e+05	USS Gilbert\nFPO AA 20957
9	81885.92718	4.423672	8.167688	6.10	40149.96575	1.545155e+06	Unit 9446 Box 0958\nDPO AE 97025
10	80527.47208	8.093513	5.042747	4.10	47224.35984	1.707046e+06	6368 John Motorway Suite 700\nJanetbury, NM 26854
11	50593.69550	4.496513	7.467627	4.49	34343.99189	6.637324e+05	911 Castillo Park Apt. 717\nDavisborough, PW 7...
12	39033.80924	7.671755	7.250029	3.10	39220.36147	1.042814e+06	209 Natasha Stream Suite 961\nHuffmanland, NE ...
13	73163.66344	6.919535	5.993188	2.27	32326.12314	1.291332e+06	829 Welch Track Apt. 992\nNorth John, AR 26532...
14	69391.38018	5.344776	8.406418	4.37	35521.29403	1.402818e+06	PSC 5330, Box 4420\nAPO AP 08302
15	73091.86675	5.443156	8.517513	4.01	23929.52405	1.306675e+06	2278 Shannon View\nNorth Carriemouth, NM 84617
16	79706.96306	5.067890	8.219771	3.12	39717.81358	1.556787e+06	064 Hayley Unions\nNicholsborough, HI 44161-1887
17	61929.07702	4.788550	5.097010	4.30	24595.90150	5.284852e+05	5498 Rachel Locks\nNew Gregoryshire, PW 54755
18	63508.19430	5.947165	7.187774	5.12	35719.65305	1.019426e+06	Unit 7424 Box 2786\nDPO AE 71255
19	62085.27640	5.739411	7.091808	5.49	44922.10670	1.030591e+06	19696 Benjamin Cape\nStephentown, ME 36952-4733
20	86294.99909	6.627457	8.011898	4.07	47560.77534	2.146925e+06	030 Larry Park Suite 665\nThomashaven, HI 8794...
21	60835.08998	5.551222	6.517175	2.10	45574.74166	9.292476e+05	USNS Brown\nFPO AP 85833
22	64490.65027	4.210323	5.478088	4.31	40358.96011	7.188872e+05	95198 Ortiz Key\nPort Sara, TN 24541-2855
23	60697.35154	6.170484	7.150537	6.34	28140.96709	7.439998e+05	9003 Jay Plains Suite 838\nLake Elizabeth, IN ...
24	59748.85549	5.339340	7.748682	4.23	27809.98654	8.957371e+05	24282 Paul Valley\nWest Perry, MI 03169-5806
25	56974.47654	8.287562	7.312880	4.33	40694.86951	1.453975e+06	61938 Brady Falls\nLewisfort, DE 61227
26	82173.62608	4.018525	6.992699	2.03	38853.91807	1.125693e+06	3599 Ramirez Springs\nJacksonhaven, AZ 72798
27	64626.88098	5.443360	6.988754	4.00	27784.74228	9.754295e+05	073 Christopher Falls Suite 882\nWest Cynthia,...
28	90499.05745	6.384359	4.242191	3.04	33970.16499	1.240764e+06	6531 Chase Prairie Apt. 245\nSusanshire, MN 22365
29	59323.79210	6.977828	8.273697	4.07	37520.65773	1.577018e+06	17124 Johnson Squares\nLake Robertfurt, AL 618...
...	...	...	...	...	...	...	...
4970	55980.20481	7.014510	5.458789	2.11	43968.68705	1.120943e+06	2558 King Trail\nEast Catherinebury, MP 23625-...
4971	73491.13443	5.784430	4.425959	3.37	30800.54106	1.111307e+06	6043 Stevens Stream\nWest Kimberlymouth, ME 49723
4972	83695.27238	7.643507	7.127219	5.05	33113.75906	1.736402e+06	33465 Hernandez Forest Apt. 692\nPort Ashleyfo...
4973	78743.75927	6.583685	6.595683	4.07	24381.14454	1.340770e+06	805 David Knoll Apt. 216\nMccarthyview, GU 74316
4974	70720.29646	6.411801	5.048128	3.01	19114.01925	8.013486e+05	14742 Lopez Ridge Apt. 889\nJessicatown, CA 28254
4975	54037.58088	8.471765	6.966072	3.27	28696.17086	1.324382e+06	6278 Jenkins Harbors Apt. 807\nNew Yvettehaven...
4976	75046.31379	5.351169	7.797825	5.23	34107.88862	1.340344e+06	55823 Stuart Fields\nNunezstad, NM 03601
4977	75980.43884	6.583105	5.914892	3.23	40394.59349	1.518478e+06	1831 Escobar Plain Suite 171\nMartinezberg, OH...
4978	80393.33950	8.899713	5.652974	4.04	39547.93249	1.910585e+06	02084 Rivera Lock\nHallville, NJ 32367-9579
4979	82224.69501	5.434087	8.375708	3.12	57166.86751	1.823498e+06	4679 Turner Tunnel\nRosariobury, CT 68552-4766
4980	75664.02448	5.789203	6.415312	2.02	54724.25127	1.406865e+06	0476 Jessica Shoals\nMelissamouth, DE 39609-2777
4981	71663.87129	6.150745	7.311907	6.33	24109.77806	1.203850e+06	1316 Tony Inlet Suite 235\nWest Jimmy, SC 72946
4982	58800.90877	5.976507	7.304051	6.43	37426.70975	1.020096e+06	109 Lee Wall Apt. 315\nLunamouth, AZ 05121-3634
4983	69655.18395	7.721100	6.077795	4.29	32902.35558	1.194357e+06	39174 Jessica Mission Apt. 539\nWest Cindyboro...
4984	62623.35983	5.071624	6.771015	3.33	50985.97120	1.211900e+06	9894 Greg Ridge\nNorth Tiffanyhaven, ID 66602-...
4985	75117.04295	6.036275	6.538111	2.22	43976.03106	1.378938e+06	PSC 7442, Box 6234\nAPO AP 13017
4986	71060.40601	5.718839	7.222730	4.34	34814.58559	1.260241e+06	5611 Matthew Avenue\nLake Kevin, FM 72963-8891
4987	65729.22233	6.237787	6.860475	3.12	25573.85429	1.197073e+06	641 Lisa Parkways Suite 552\nWest Amandaside, ...
4988	67637.84067	7.056673	5.774409	3.05	43846.53134	1.275143e+06	6066 Sanders Court Apt. 914\nSouth Alexis, FM ...
4989	47965.40690	5.694638	7.363327	5.40	46071.94734	8.852050e+05	19960 Scott Street\nPort Brenda, MO 02292-8651
4990	52723.87656	5.452237	8.124571	6.39	14802.08844	4.795006e+05	86727 Kelly Plaza\nLake Veronica, IL 04474
4991	74102.19189	5.657841	7.683993	3.13	24041.27059	1.263721e+06	2871 John Lodge\nAmychester, GU 61734-5597
4992	87499.12574	6.403473	4.836091	4.02	40815.19968	1.568701e+06	Unit 2096 Box 9559\nDPO AE 80983-8797
4993	69639.14090	5.007510	7.778375	6.05	54056.12843	1.381831e+06	5259 David Causeway Apt. 975\nSouth Alexstad, ...
4994	73060.84623	5.293682	6.312253	4.16	22695.69548	9.053549e+05	5224 Lamb Passage\nNancystad, GA 16579
4995	60567.94414	7.830362	6.137356	3.46	22837.36103	1.060194e+06	USNS Williams\nFPO AP 30153-7653
4996	78491.27543	6.999135	6.576763	4.02	25616.11549	1.482618e+06	PSC 9258, Box 8489\nAPO AA 42991-3352
4997	63390.68689	7.250591	4.805081	2.13	33266.14549	1.030730e+06	4215 Tracy Garden Suite 076\nJoshualand, VA 01...
4998	68001.33124	5.534388	7.130144	5.44	42625.62016	1.198657e+06	USS Wallace\nFPO AE 73316
4999	65510.58180	5.992305	6.792336	4.07	46501.28380	1.298950e+06	37778 George Ridges Apt. 509\nEast Holly, NV 2...

	Avg. Area Income	Avg. Area House Age	Avg. Area Number of Rooms	Avg. Area Number of Bedrooms	Area Population	Price
0	79545.45857	5.682861	7.009188	4.09	23086.80050	1.059034e+06
1	79248.64245	6.002900	6.730821	3.09	40173.07217	1.505891e+06
2	61287.06718	5.865890	8.512727	5.13	36882.15940	1.058988e+06
3	63345.24005	7.188236	5.586729	3.26	34310.24283	1.260617e+06
4	59982.19723	5.040555	7.839388	4.23	26354.10947	6.309435e+05

	Avg. Area Income	Avg. Area House Age	Avg. Area Number of Rooms	Avg. Area Number of Bedrooms	Area Population	Price
Avg. Area Income	1.000000	-0.002007	-0.011032	0.019788	-0.016234	0.639734
Avg. Area House Age	-0.002007	1.000000	-0.009428	0.006149	-0.018743	0.452543
Avg. Area Number of Rooms	-0.011032	-0.009428	1.000000	0.462695	0.002040	0.335664
Avg. Area Number of Bedrooms	0.019788	0.006149	0.462695	1.000000	-0.022168	0.171071
Area Population	-0.016234	-0.018743	0.002040	-0.022168	1.000000	0.408556
Price	0.639734	0.452543	0.335664	0.171071	0.408556	1.000000

	Avg. Area Income	Avg. Area House Age	Avg. Area Number of Rooms	Area Population	Price
0	79545.45857	5.682861	7.009188	23086.80050	1.059034e+06
1	79248.64245	6.002900	6.730821	40173.07217	1.505891e+06
2	61287.06718	5.865890	8.512727	36882.15940	1.058988e+06
3	63345.24005	7.188236	5.586729	34310.24283	1.260617e+06
4	59982.19723	5.040555	7.839388	26354.10947	6.309435e+05

	Price
0	1.059034e+06
1	1.505891e+06
2	1.058988e+06
3	1.260617e+06
4	6.309435e+05

Knowledge Hub

Friday, December 13, 2019

Machine learning- day3

No comments:

Post a Comment

Featured Post

Ichimoku cloud

Search This Blog

	Price
1840	8.814461e+05
2115	1.375771e+06
4437	1.137069e+06
1146	9.289500e+05
2486	1.392084e+06
44	1.153871e+06
2154	1.409039e+06
1526	9.554459e+05
4855	2.998630e+05
1378	1.172133e+06
1765	1.069851e+06
3012	1.594748e+06
413	1.008713e+06
4284	1.196254e+06
1407	1.292287e+06
1658	7.230900e+05
801	1.281741e+06
1288	1.526915e+06
2182	1.429383e+06
2588	1.986811e+06
2615	1.746087e+06
2318	1.155753e+06
256	2.298379e+06
4541	7.427053e+05
1729	9.456146e+05
1151	5.307647e+05
4144	1.126085e+06
647	1.919693e+06
2908	1.240504e+06
1702	1.273631e+06
...	...
4658	1.227660e+06
3005	6.509392e+05
2734	1.822988e+06
189	1.400105e+06
1806	1.168445e+06
975	1.433221e+06
2747	6.951522e+05
2047	1.587585e+06
2558	6.068631e+05
1082	1.237361e+06
474	1.137059e+06
2904	1.596343e+06
4843	1.167627e+06
4117	7.672148e+05
3385	1.880179e+06
4555	1.157759e+06
1184	1.591188e+06
2433	6.316565e+05
2391	1.226067e+06
769	8.812731e+05
1685	1.090805e+06
130	1.064686e+06
2919	1.860649e+06
3171	1.480675e+06
3444	7.980739e+05
4426	1.023944e+06
466	1.223101e+06
3092	1.318598e+06
3772	1.708631e+06
860	1.060898e+06

	PassengerId	Survived	Pclass	Name	Sex	Age	SibSp	Parch	Ticket	Fare	Cabin	Embarked
0	1	0	3	Braund, Mr. Owen Harris	male	22.0	1	0	A/5 21171	7.2500	NaN	S
1	2	1	1	Cumings, Mrs. John Bradley (Florence Briggs Th...	female	38.0	1	0	PC 17599	71.2833	C85	C
2	3	1	3	Heikkinen, Miss. Laina	female	26.0	0	0	STON/O2. 3101282	7.9250	NaN	S
3	4	1	1	Futrelle, Mrs. Jacques Heath (Lily May Peel)	female	35.0	1	0	113803	53.1000	C123	S
4	5	0	3	Allen, Mr. William Henry	male	35.0	0	0	373450	8.0500	NaN	S
5	6	0	3	Moran, Mr. James	male	NaN	0	0	330877	8.4583	NaN	Q
6	7	0	1	McCarthy, Mr. Timothy J	male	54.0	0	0	17463	51.8625	E46	S
7	8	0	3	Palsson, Master. Gosta Leonard	male	2.0	3	1	349909	21.0750	NaN	S
8	9	1	3	Johnson, Mrs. Oscar W (Elisabeth Vilhelmina Berg)	female	27.0	0	2	347742	11.1333	NaN	S
9	10	1	2	Nasser, Mrs. Nicholas (Adele Achem)	female	14.0	1	0	237736	30.0708	NaN	C
10	11	1	3	Sandstrom, Miss. Marguerite Rut	female	4.0	1	1	PP 9549	16.7000	G6	S
11	12	1	1	Bonnell, Miss. Elizabeth	female	58.0	0	0	113783	26.5500	C103	S
12	13	0	3	Saundercock, Mr. William Henry	male	20.0	0	0	A/5. 2151	8.0500	NaN	S
13	14	0	3	Andersson, Mr. Anders Johan	male	39.0	1	5	347082	31.2750	NaN	S
14	15	0	3	Vestrom, Miss. Hulda Amanda Adolfina	female	14.0	0	0	350406	7.8542	NaN	S
15	16	1	2	Hewlett, Mrs. (Mary D Kingcome)	female	55.0	0	0	248706	16.0000	NaN	S
16	17	0	3	Rice, Master. Eugene	male	2.0	4	1	382652	29.1250	NaN	Q
17	18	1	2	Williams, Mr. Charles Eugene	male	NaN	0	0	244373	13.0000	NaN	S
18	19	0	3	Vander Planke, Mrs. Julius (Emelia Maria Vande...	female	31.0	1	0	345763	18.0000	NaN	S
19	20	1	3	Masselmani, Mrs. Fatima	female	NaN	0	0	2649	7.2250	NaN	C
20	21	0	2	Fynney, Mr. Joseph J	male	35.0	0	0	239865	26.0000	NaN	S
21	22	1	2	Beesley, Mr. Lawrence	male	34.0	0	0	248698	13.0000	D56	S
22	23	1	3	McGowan, Miss. Anna "Annie"	female	15.0	0	0	330923	8.0292	NaN	Q
23	24	1	1	Sloper, Mr. William Thompson	male	28.0	0	0	113788	35.5000	A6	S
24	25	0	3	Palsson, Miss. Torborg Danira	female	8.0	3	1	349909	21.0750	NaN	S
25	26	1	3	Asplund, Mrs. Carl Oscar (Selma Augusta Emilia...	female	38.0	1	5	347077	31.3875	NaN	S
26	27	0	3	Emir, Mr. Farred Chehab	male	NaN	0	0	2631	7.2250	NaN	C
27	28	0	1	Fortune, Mr. Charles Alexander	male	19.0	3	2	19950	263.0000	C23 C25 C27	S
28	29	1	3	O'Dwyer, Miss. Ellen "Nellie"	female	NaN	0	0	330959	7.8792	NaN	Q
29	30	0	3	Todoroff, Mr. Lalio	male	NaN	0	0	349216	7.8958	NaN	S
...	...	...	...	...	...	...	...	...	...	...	...	...
861	862	0	2	Giles, Mr. Frederick Edward	male	21.0	1	0	28134	11.5000	NaN	S
862	863	1	1	Swift, Mrs. Frederick Joel (Margaret Welles Ba...	female	48.0	0	0	17466	25.9292	D17	S
863	864	0	3	Sage, Miss. Dorothy Edith "Dolly"	female	NaN	8	2	CA. 2343	69.5500	NaN	S
864	865	0	2	Gill, Mr. John William	male	24.0	0	0	233866	13.0000	NaN	S
865	866	1	2	Bystrom, Mrs. (Karolina)	female	42.0	0	0	236852	13.0000	NaN	S
866	867	1	2	Duran y More, Miss. Asuncion	female	27.0	1	0	SC/PARIS 2149	13.8583	NaN	C
867	868	0	1	Roebling, Mr. Washington Augustus II	male	31.0	0	0	PC 17590	50.4958	A24	S
868	869	0	3	van Melkebeke, Mr. Philemon	male	NaN	0	0	345777	9.5000	NaN	S
869	870	1	3	Johnson, Master. Harold Theodor	male	4.0	1	1	347742	11.1333	NaN	S
870	871	0	3	Balkic, Mr. Cerin	male	26.0	0	0	349248	7.8958	NaN	S
871	872	1	1	Beckwith, Mrs. Richard Leonard (Sallie Monypeny)	female	47.0	1	1	11751	52.5542	D35	S
872	873	0	1	Carlsson, Mr. Frans Olof	male	33.0	0	0	695	5.0000	B51 B53 B55	S
873	874	0	3	Vander Cruyssen, Mr. Victor	male	47.0	0	0	345765	9.0000	NaN	S
874	875	1	2	Abelson, Mrs. Samuel (Hannah Wizosky)	female	28.0	1	0	P/PP 3381	24.0000	NaN	C
875	876	1	3	Najib, Miss. Adele Kiamie "Jane"	female	15.0	0	0	2667	7.2250	NaN	C
876	877	0	3	Gustafsson, Mr. Alfred Ossian	male	20.0	0	0	7534	9.8458	NaN	S
877	878	0	3	Petroff, Mr. Nedelio	male	19.0	0	0	349212	7.8958	NaN	S
878	879	0	3	Laleff, Mr. Kristo	male	NaN	0	0	349217	7.8958	NaN	S
879	880	1	1	Potter, Mrs. Thomas Jr (Lily Alexenia Wilson)	female	56.0	0	1	11767	83.1583	C50	C
880	881	1	2	Shelley, Mrs. William (Imanita Parrish Hall)	female	25.0	0	1	230433	26.0000	NaN	S
881	882	0	3	Markun, Mr. Johann	male	33.0	0	0	349257	7.8958	NaN	S
882	883	0	3	Dahlberg, Miss. Gerda Ulrika	female	22.0	0	0	7552	10.5167	NaN	S
883	884	0	2	Banfield, Mr. Frederick James	male	28.0	0	0	C.A./SOTON 34068	10.5000	NaN	S
884	885	0	3	Sutehall, Mr. Henry Jr	male	25.0	0	0	SOTON/OQ 392076	7.0500	NaN	S
885	886	0	3	Rice, Mrs. William (Margaret Norton)	female	39.0	0	5	382652	29.1250	NaN	Q
886	887	0	2	Montvila, Rev. Juozas	male	27.0	0	0	211536	13.0000	NaN	S
887	888	1	1	Graham, Miss. Margaret Edith	female	19.0	0	0	112053	30.0000	B42	S
888	889	0	3	Johnston, Miss. Catherine Helen "Carrie"	female	NaN	1	2	W./C. 6607	23.4500	NaN	S
889	890	1	1	Behr, Mr. Karl Howell	male	26.0	0	0	111369	30.0000	C148	C
890	891	0	3	Dooley, Mr. Patrick	male	32.0	0	0	370376	7.7500	NaN	Q

	Survived	Pclass	Sex	Age	SibSp	Parch	Fare	Cabin	Embarked
0	False	False	False	False	False	False	False	True	False
1	False	False	False	False	False	False	False	False	False
2	False	False	False	False	False	False	False	True	False
3	False	False	False	False	False	False	False	False	False
4	False	False	False	False	False	False	False	True	False
5	False	False	False	True	False	False	False	True	False
6	False	False	False	False	False	False	False	False	False
7	False	False	False	False	False	False	False	True	False
8	False	False	False	False	False	False	False	True	False
9	False	False	False	False	False	False	False	True	False
10	False	False	False	False	False	False	False	False	False
11	False	False	False	False	False	False	False	False	False
12	False	False	False	False	False	False	False	True	False
13	False	False	False	False	False	False	False	True	False
14	False	False	False	False	False	False	False	True	False
15	False	False	False	False	False	False	False	True	False
16	False	False	False	False	False	False	False	True	False
17	False	False	False	True	False	False	False	True	False
18	False	False	False	False	False	False	False	True	False
19	False	False	False	True	False	False	False	True	False
20	False	False	False	False	False	False	False	True	False
21	False	False	False	False	False	False	False	False	False
22	False	False	False	False	False	False	False	True	False
23	False	False	False	False	False	False	False	False	False
24	False	False	False	False	False	False	False	True	False
25	False	False	False	False	False	False	False	True	False
26	False	False	False	True	False	False	False	True	False
27	False	False	False	False	False	False	False	False	False
28	False	False	False	True	False	False	False	True	False
29	False	False	False	True	False	False	False	True	False
...	...	...	...	...	...	...	...	...	...
861	False	False	False	False	False	False	False	True	False
862	False	False	False	False	False	False	False	False	False
863	False	False	False	True	False	False	False	True	False
864	False	False	False	False	False	False	False	True	False
865	False	False	False	False	False	False	False	True	False
866	False	False	False	False	False	False	False	True	False
867	False	False	False	False	False	False	False	False	False
868	False	False	False	True	False	False	False	True	False
869	False	False	False	False	False	False	False	True	False
870	False	False	False	False	False	False	False	True	False
871	False	False	False	False	False	False	False	False	False
872	False	False	False	False	False	False	False	False	False
873	False	False	False	False	False	False	False	True	False
874	False	False	False	False	False	False	False	True	False
875	False	False	False	False	False	False	False	True	False
876	False	False	False	False	False	False	False	True	False
877	False	False	False	False	False	False	False	True	False
878	False	False	False	True	False	False	False	True	False
879	False	False	False	False	False	False	False	False	False
880	False	False	False	False	False	False	False	True	False
881	False	False	False	False	False	False	False	True	False
882	False	False	False	False	False	False	False	True	False
883	False	False	False	False	False	False	False	True	False
884	False	False	False	False	False	False	False	True	False
885	False	False	False	False	False	False	False	True	False
886	False	False	False	False	False	False	False	True	False
887	False	False	False	False	False	False	False	False	False
888	False	False	False	True	False	False	False	True	False
889	False	False	False	False	False	False	False	False	False
890	False	False	False	False	False	False	False	True	False